1951年創刊 國家檔案局主管

投稿
首頁 > 業務 > 正文

明清檔案“數轉?!眴栴}的審視與思考

隨著信息技術的飛速發展,檔案管理工作開始全方位進入數字化時代,與此同時也面臨著數字檔案的長期保存問題。目前業內人士關注的焦點主要集中在存儲介質的選定與存儲介質之間的技術轉換方面。在檔案行政管理部門著力強調異質備份工作的前提下,傳統歷史檔案的“數轉模”成為當前形勢下的務實解決方案,無論從理論層面還是實踐層面都應予以認真研究,并提上議事日程。本文結合中國第一歷史檔案館(以下簡稱“一史館”)明清檔案的管理實踐,就明清檔案數字化加工項目中的“數轉模”問題作一簡要審視與闡述。

確保數字化信息長期保存的有效性

檔案管理兼具保護與利用兩大目標任務。一史館以其豐富的明清檔案資源,在檔案保護與利用過程中始終走在同行的前列。早在1973年,一史館就開始引入縮微技術,縮微膠片作為明清檔案保存與利用的有效載體在館藏檔案管理工作中得到了極好的應用。步入90年代后,隨著我國計算機的全面性普及和網絡技術的發展,社會信息的傳遞方式也隨之改變。一史館順應時代要求,采用“模轉數”即先縮微后數字化的方式對檔案加以有效管理。如今,隨著光盤、硬盤、磁盤陣列等多種載體的相繼出現,“數轉模”技術走向檔案數字化前沿,一史館也逐步進入到明清檔案管理的多介質存儲時代。

2010年11月,一史館制定了《檔案整理和數字化工作方案》,并于2011年正式啟動檔案整理數字化工作,同時逐步推進檔案數字化和縮微工作。截至2015年2月,一史館已完成文件級館藏目錄900余萬條,完成檔案數字化519萬件,生成檔案數字圖像5480余萬畫幅。為了及時將數字化成果提供社會公眾利用,從2012年開始,一史館連續4年在館內信息利用平臺推出已經完成數字化并對外開放的館藏檔案史料,主要有:2012年,內閣北大移交題本29054件453514畫幅;2013年,軍機處滿文錄副奏折、內閣吏科題本、內務府奏銷檔檔案422517件4503296畫幅;2014年,憲政編查館、修訂法律館和京師高等審判廳檢察廳3個全宗檔案5103件25468畫幅;2015年,內閣滿文題本80479件1198603畫幅。再加之2011年以前的數字化檔案1548085件,一史館館藏檔案利用查詢系統共對外開放利用數字化檔案現已達到210萬件2569萬畫幅。目前館藏檔案數字化資源已經突破5PB,而檔案數字資源存儲及備份總量也已超過3PB,這既為保護及利用明清歷史檔案奠定了堅實的基礎,同時又使如何保存和利用好如此海量的檔案數字信息成為一個新的重大問題和關注點。

歷史檔案文獻的永久保存一直以來都是檔案工作的重要內容,數字化時代也不例外。美國國家檔案管理機構曾邀請權威單位確定檔案的最佳保護介質,數十位專家對磁性介質、光盤、電子文檔、紙張、膠片5種常用的介質進行論證,最后結論是紙張和縮微膠片最適宜文獻的長期保存,建議用縮微膠片或紙張復制文獻,以達到永久保存的目的。2009年10月,國家檔案局頒布《數字檔案信息輸出到縮微膠片上的規定》,規定了數字檔案信息輸出到16mm和35mm?卷式黑白縮微膠片上的一般要求。按此“規定”要求,將數字檔案信息輸出制作為縮微膠片進行長期異質保存,可保證檔案得以科學、有效的保護。

確保檔案內容信息的法律認可性

“數轉模”全稱為數字影像轉換成模擬影像(Computer Output Microfilm),業內人士亦稱“數轉膠”,即利用光學原理將數字信息轉移到縮微膠片上,從而實現數字資源長期保存的技術。“數轉模”的應用目標仍然是將縮微膠片長期保存的優點與數字信息方便利用的優點相結合,以確保數字化文獻信息安全有效。與傳統縮微技術所產生的縮微膠片不同,這種經過從“數”到“模”的轉換所產生的縮微品,其內容的真實性及其法律憑證地位即法律認可性問題便凸顯出來。

無論是紙質檔案,還是采用縮微攝影技術直接拍攝紙質檔案所生成的縮微品,其內容的真實性及法律地位不言而喻,若自身法律性的不足往往會喪失其檔案本身應具有的效力??s微攝影技術在我國80年代文獻搶救工作中發揮了巨大作用,究其根本原因是因為縮微技術使用后檔案信息的真實性及其法律憑證地位起到了決定性作用。1990年10月發布的《中華人民共和國檔案法實施辦法》明確規定:“各級各類檔案館提供社會利用的檔案,應當逐步實現以縮微品代替原件。檔案縮微品和其他復制形式的檔案載有檔案收藏單位法定代表人的簽名或者印章標記的,具有與檔案原件同等的效力。”一史館從20世紀70年代開始使用縮微技術拍攝館藏檔案,截至目前共有縮微品(母片)1.5萬余盤、拷貝片3萬余盤可提供利用,并規定凡有縮微復制件的檔案,一律用縮微品代替原件使用。

數字時代計算機環境下直接生成的電子文件,以及將傳統檔案數字化后產生的數字信息,其檔案內容的真實性與法律憑證地位則是不能確定的。在此條件下,通過“數轉模”技術轉換后形成的縮微品,盡管與傳統縮微品一樣是檔案縮微品,但因其檔案原件是電子文件檔案而非紙質檔案本身,因此,通過“數轉模”形成的檔案信息內容是否具有真實性與法律憑證地位至今仍在討論中。國標《縮微攝影技術縮微品的法律認可性》(GB/Z 20650?—?2006)主要是針對縮微品信息的法律認可性問題提出了縮微品制作應遵循的程序和建議,指出如果遵循該程序和建議,縮微品副本可代替原件,并起到與原件相同的作用。

確保輸出縮微膠片檔案數字信息的完整性

通過“數轉模”技術轉換后形成的縮微品,因在轉換過程中信息易發生丟失現象而造成縮微品的檔案數字信息不完整。由于轉換后縮微品是利用掃描產生的數字圖像經COM技術制作而成,而這個轉換過程需要經過圖像掃描、格式轉化、縮微品輸出、拷貝沖洗等多個環節,每個環節自然都有可能出現數字信息丟失問題。比如,就圖像掃描而言,常規采用的OCR掃描輸入技術,其平均識別率僅為95%;就縮微膠片的材質而言,其背景密度及解像力的大小也影響縮微膠片上信息的完整性。更重要的是,由于明清檔案原件字體的大小、字跡顏色、紙張材料及薄厚程度的不同等,如深紅色背景黑色字跡,淡黃色背景紅色字跡,顏色較淺字跡,以及紅、藍色字跡等因素,會對輸出到縮微膠片上信息的清晰度及完整性產生相當大程度的影響,進而造成檔案信息丟失。為避免上述因素造成的縮微品檔案數字信息不完整,就需要加強對膠片的檢查力度。

相伴發生的另一種情況是,傳統紙質檔案數字化過程中,會產生一些新增加的技術參數信息(如色卡、備考表、裝具及標識符號等)。一史館在對館藏內閣-滿文實錄、內閣-滿文起居注、內務府-滿文雜件、宮中-滿文檔案、理藩部檔案進行數字化加工過程中,掃描檔案信息約305萬畫幅。其中新增加的技術參數信息約占40萬畫幅,即不屬于傳統紙質檔案內容的技術性信息標識影像占檔案總畫幅的13.1%。在“數轉模”過程中這些技術參數信息理應隨著檔案主體的數字信息一起轉換成縮微膠片進行保存,否則,一旦檔案主體的數字信息發生丟失,當需要借助“模轉數”技術手段再次將模擬信息轉換為數字信息時,整個“模轉數”過程因缺乏這些技術參數信息而無法得以實現。

“檔案數字化工作的生命線在于其能夠保持檔案原貌。”一史館館藏明清檔案,時間跨度近300年,所保存的明清兩代中央國家機關及皇室檔案的文獻史料具有珍貴的保存與利用價值。“數轉模”的主要目的之一就是能夠真實地將檔案信息長期保存下來,因此不僅要求對數字信息“原汁原味”地進行轉換,同時在質量標準上要求轉換后的縮微品與傳統縮微品質量無差別,在圖像檢查方面要求對畫幅逐一進行核對檢查,以確保輸出縮微膠片檔案數字信息的完整性。

選擇技術轉換過程中的格式最優性

為規范檔案數字化工作,加快推進檔案數字化進程,2010年10月,一史館確定了數字化圖像的主要技術參數:圖像文件格式為TIFF,全彩色(RGB)、24bit真彩色輸出,分辨率不低于300dpi,單頁檔案尺寸不超過A3尺寸標準畫幅,且為100%原大尺寸掃描。對于歸檔備份數據,采用多套多介質的備份機制,掃描圖像存儲采用TIFF、JPEG(按原始TIFF格式圖像轉換、優化,壓縮率為50%)以及無損壓縮JPEG2000(按原始TIFF格式圖像直接轉換)3種格式。究竟應采用哪種格式對電子文檔進行轉換,需要作以下簡單的分析比較。

TIFF(Tagged Image File Format)圖像文件格式是一種比較靈活的圖像格式,主要用來保存包括照片和藝術圖等圖像文件,特別是用于對圖像質量要求較高的圖像存儲與轉換。TIFF圖像文件格式具有圖形格式復雜、存貯信息多的優點。

JPEG(Joint Photographic Experts Group)?圖像文件格式是一種最常用的有損壓縮圖像文件格式,其最大優點是利用有損壓縮的方式去除冗余的圖像數據,即在獲得極高壓縮率的同時能展現十分豐富生動的圖像,換句話說,就是可以用最少的磁盤空間得到較好的圖像品質。當然,壓縮比的大小直接影響著圖像的清晰度。壓縮比越大,圖像品質就越低;反之,壓縮比越小,圖像品質就越好。

JPEG2000圖像文件格式作為JPEG的升級版,支持有損和無損壓縮。其重要的特征在于它能實現漸進傳輸,即先傳輸圖像的輪廓,然后逐步傳輸數據,不斷提高圖像質量,讓圖像由朦朧到清晰逐漸顯示。JPEG2000有很大的技術優勢,壓縮率比JPEG高約30%左右,壓縮性能卻可以提高20%以上。

由于明清檔案年代久遠,不少檔案因或霉爛變質,或水浸、殘破、蟲蛀,或字跡不清、圖章壓字等原因,造成原件狀況較為復雜,當被壓縮的圖像有大片近似顏色時,特別是在轉換時采用JPEG圖像文件格式是按原始TIFF格式圖像轉換、優化,且壓縮率為50%時,就有可能會出現馬賽克現象,甚至信息丟失。JPEG2000圖像文件格式是按原始TIFF格式圖像直接轉換而來,但經過轉換后得來的數據畢竟不是元數據,其真實性恐遭質疑。另外,在掃描簿冊類檔案時,由于擺放檔案的位置不同,檔案信息需要正反兩個方向進行掃描,如對館藏內閣-滿文實錄、內閣-滿文起居注2類檔案掃描的1739卷273萬畫幅中,反向掃描的檔案信息就占52萬畫幅,占檔案總畫幅數的19%。按照原始TIFF圖像文件格式進行轉換,雖然給膠片的質量檢查帶來不便,但為了真實地再現檔案原貌,選擇TIFF圖像文件格式進行轉換是最佳的方式。

確保資金投入邊際效益最大化

如何做到數字信息長期有效保存、防止數字化介質存儲的檔案信息不丟失,就需要不斷地投入大量資金用以維持維護管理工作的正常運轉,因此需要考慮資金投入的邊際效益最大化問題。

首先,數字信息安全的維護及日常使用需要持續不斷的資金投入。其次,更新設備和軟件需要花費大量的資金,且每隔幾年就要投入一次。第三,數字信息遷移轉錄的費用也是相當可觀和不可預知的。國家檔案局規定對于每年征收到檔案部門歸檔入館和登記備份的以光盤和硬盤等為存儲介質的電子檔案約1000件以上的,要求對檔案數據進行?2 年/次的檢測和4~5年/次的再備份。由此產生的離線存儲檔案數據量及管理費用是相對可觀的。這些工作都需要有強大的經濟實力做支撐。

如何確保資金投入邊際效益最大化?“數轉模”無疑是最佳的選擇。應該清楚的是,相當長一段時間內,我們不可能將所有已經數字化的檔案信息通過“數轉模”技術全部轉換為縮微膠片,務實的策略是分期分批、有步驟有計劃地逐步進行存儲介質的轉換,優先考慮對具有重要史料價值及重點項目的檔案優先進行“數轉模”轉換,以確保數據完整不丟失。當完成一批數據轉換后,就可以不必再投入資金進行數據的遷移或轉錄,且一旦將來數字化介質存儲的數據不慎丟失,還可以利用“模轉數”技術,將模擬信息轉換成數字信息再利用,這樣縮微膠片既是永久保存的介質,又是數字信息出現丟失或損壞時的備份轉換介質。

總之,使用縮微膠片保存重要的史料文獻是世界上進行檔案長期保存的最理想方式,在其長期的發展過程中,國際標準化組織ISO/TC171文獻影像應用技術委員會以及我國文獻影像技術標準化技術委員會及相關行業,相繼系統地制定了縮微技術的國際及國內標準。鑒于數字技術在檔案保護中的缺陷,檔案保護還應主要立足于縮微技術,即便是對原檔全部進行數字化處理后,仍需要對這些數字化產品進行由“數”到“模”的轉換與處理,利用數字存檔系列產品及相應的軟件系統,實現縮微膠片和數字光盤的優勢互補。

 參考文獻:

1.中國第一歷史檔案館.明清檔案事業九十年.人民出版社,2016.

2.中國第一歷史檔案館.明清檔案與歷史研究論文集.中國文史出版社,2015.

3.管先海.檔案館數字檔案信息保存技術思考.檔案管理,2010(4).

4.王小林.國內外圖書館數字資源的長期保存探討.數字與縮微影像,2010(3).

5.郎玉林.數字信息長期保存政策的宏觀思考.蘭臺世界,2010(7).

6.熊燕.數字資源長期保存的策略研究.農業圖書情報學刊,2010(4). 

作者單位:中國第一歷史檔案館

  • 微笑
  • 流汗
  • 難過
  • 羨慕
  • 憤怒
  • 流淚
責任編輯:中國檔案
0
同花顺e配资