1951年創刊 國家檔案局主管

投稿
首頁 > 業務 > 正文

電子文件元數據分類與方案設計對策研究

北京市檔案局于2014年承擔了國家檔案局科技項目“電子文件元數據分類與方案設計對策研究”課題,形成了電子文件和電子檔案元數據兩分法(即對象元數據和事件元數據)的管理理論和《北京市電子文件和電子檔案元數據分類方案》等重要研究成果。該課題于2015年12月通過了國家檔案局鑒定委員會的評審。鑒定委員會認為,該課題的科研成果具有較高理論價值,對北京市電子文件和電子檔案元數據管理以及數字檔案館建設實踐具有指導作用,對其他地方相關工作的開展也有參考借鑒意義,其科研成果具有較強的可操作性,對推進電子文件和電子檔案元數據相關標準規范的制定和實施具有重要參考價值。該課題榮獲2016年度國家檔案局優秀科技成果二等獎。

研究內容

根據調研已有的標準和學術研究項目來看,對于電子文件和電子檔案元數據的分類研究表現出以下3個特點:一是概念涉及內容范圍廣;二是電子文件和電子檔案元數據的種類和層級繁多;三是電子文件和電子檔案元數據隨著保管和利用而不斷增加??梢哉f,現有成果對于電子檔案真實性、憑證性保障及長期保存有效利用并不都是最佳選擇。設計電子文件和電子檔案元數據的最佳分類方案是關于電子文件和電子檔案元數據研究的重點和關鍵。北京市檔案局根據北京市電子文件和電子檔案管理的基本現狀,專題攻關電子文件和電子檔案的元數據分類方法,以及各類型電子文件和電子檔案的元數據項最優集合,破解當前元數據分類不夠清晰、項目繁雜難以落地執行的難題。

該課題設計并構建了“對象元數據”和“事件元數據”兩分法,探索設計了當前常見的文本類、圖像類、影像類、聲音類電子文件和電子檔案的對象元數據項和事件元數據項,形成了重要的科研成果《北京市電子文件和電子檔案元數據分類方案》。方案統一了國內電子文件和電子檔案元數據在分類方法和管理模式上的爭議,填補了圖像類、影像類和聲音類3類電子文件和電子檔案元數據方案的空白,優化了《文書類電子文件元數據方案》(DA/T 46)在實踐中存在執行不便的元數據項選擇。

1.元數據兩分法基礎理論研究

元數據是電子文件和電子檔案管理工作重心之一,這是毋庸置疑的。目前,國內檔案界對元數據的概念邊界、分類思路、管理方法等方面的認知和理論并不統一,各地區的具體實踐也各有特點。如何科學設計和解釋電子文件和電子檔案元數據的基礎理論,逐步形成統一的理論體系和一致的認知,進而快速推動電子文件和電子檔案管理工作又好又快發展,是我國檔案界當前一項重要的工作。

在課題組組長陶水龍發表的《電子檔案元數據分開管理研究》論文的指導下,課題明確了對象元數據和事件元數據的兩分法,界定了它們的概念與主要作用。

(1)對象元數據

對象元數據是指電子文件形成過程中產生的,由信息系統自動生成且不可人工干預的,直接關系電子文件和電子檔案憑證性的元數據項,對象元數據應封裝在電子檔案身份證中。

可以看出,①對象元數據的基本特征:是電子文件形成過程中產生的,由信息系統自動生成且不可人工干預的元數據項;②對象元數據的核心功用:直接關系電子文件和電子檔案的憑證價值和真實性,在這里談到的憑證價值和真實性主要聚焦在文件的依法合規問題;③對象元數據的管理原則:封裝在電子檔案身份證中,與電子檔案身份證一體化管理。

(2)事件元數據

事件元數據是指電子文件歸檔和電子檔案管理過程中產生的,對電子檔案溯源起重要作用的,由信息系統自動生成或人工錄入的元數據項,事件元數據以結構化的數據形式存儲在數據庫中,并通過電子檔案目錄與電子檔案的內容信息和電子檔案身份證進行有效關聯。

可以看出,①事件元數據的基本特征:是電子文件歸檔和電子檔案管理過程中產生的,由信息系統自動生成或人工錄入的元數據項,事件元數據的產生階段和允許由人工干預是其與對象元數據最主要的特征區別;②事件元數據的核心功用:對電子檔案溯源起重要作用,這就意味著事件元數據的選擇不應聚焦那些對電子文件和電子檔案起到憑證性保護作用的項目;③事件元數據的管理原則:以結構化的數據形式存儲在數據庫中,并通過電子檔案目錄與電子檔案的內容信息和電子檔案身份證進行有效關聯,為了避免電子檔案身份證在元數據不斷增加的管理過程中重復封裝,事件元數據采取在數據庫中單獨管理并與電子文件和電子檔案內容信息掛接的管理方式,不再做封裝一體化管理。

2.元數據分類方案設計

(1)分類方案支持更多的數據類型

《文書類電子文件元數據方案》(DA/T 46)僅僅局限于文書類電子文件的元數據。鑒于目前我國黨政機關公文處理的特點,能夠通過信息系統正式簽發文書類電子文件的單位并不多,因而當前產生的真正意義的電子文件和電子檔案可能更多地集中在圖像、影像和聲音等部分,DA/T 46并未覆蓋這三部分的電子文件和電子檔案,所以各地區在實踐中往往使用內部暫定的元數據方案執行。

課題明確了電子文件和電子檔案元數據分類方案的邊界,形成了重要的科研成果《北京市電子文件和電子檔案元數據分類方案》。元數據分類方案分別按照文本類、圖像類、影像類和聲音類4大常見類型的電子文件和電子檔案進行了元數據的方案設計。

(2)分類方案的設計更加易于落地

《文書類電子文件元數據方案》(DA/T 46)中羅列了88項文書類電子文件所需要留存的元數據項,涵蓋了電子文件形成階段、電子文件歸檔階段、電子檔案在檔案室的管理階段、電子檔案移交接收階段和電子檔案在檔案館的管理階段等電子文件和電子檔案全生命周期的5個主要階段。但在國內各地區的實踐過程中,普遍反饋DA/T 46的執行存在一些不便之處,有些是因為各黨政機關和國有企事業單位信息系統先于該標準建設完成,如嚴格按標準執行會出現地區性的信息系統二次開發行為,總體成本投入巨大,檔案行政管理部門難以硬性推動;還有一些是因為在深入研究DA/T 46之后,結合本地區、本單位、本系統、本行業實際,認為其中的某些必選和可選項目并不會實際產生,或并沒有保存的必要。

基于元數據的兩分法理論,《北京市電子文件和電子檔案元數據分類方案》在設計過程中充分考慮可操作性、便于執行性和科學合理性,力爭使其具備更好的易用性。其中,文本類對象元數據共計22項、圖像類對象元數據共計23項、影像類對象元數據共計19項、聲音類對象元數據共計7項;文本類、圖像類、影像類、聲音類事件元數據共計14項;必選的元數據項總計約40項、可選的元數據項總計約39項,新定義了一般為可選、在特定條件下為必選的元數據項總計約7項。

在課題研究過程中,注重聯系實際,將《北京市電子文件和電子檔案元數據分類方案》納入北京數字檔案館(北京電子文件中心)項目建設體系進行驗證,并作為項目建設所需遵循的核心制度使用,為項目建設提供設計藍圖。

主要創新

1.理論創新

該課題首創性地提出了電子文件和電子檔案元數據按兩分法(即對象元數據、事件元數據)進行分開管理的基礎理論,結合電子文件和電子檔案管理的特點、聯系北京數字檔案館(北京電子文件中心)項目建設實際,提出了對象元數據和事件元數據的核心功用和管理原則。

2.全面性創新

該課題的研究成果《北京市電子文件和電子檔案元數據分類方案》充分考慮電子文件和電子檔案的形成和管理現狀,對文本類、圖像類、影像類和聲音類4類最常見的電子文件和電子檔案進行了深入分析,結合各類型電子文件和電子檔案的形成環境、技術特點,分別梳理了特點鮮明、專業對口的對象元數據和事件元數據項,使《北京市電子文件和電子檔案元數據分類方案》覆蓋了目前黨政機關和國有企事業單位普遍形成的主要電子文件和電子檔案的類型,方案的指導性更強、參考意義更大。

3.實踐創新

該課題根據對北京市和各區檔案移交單位、市和區檔案館現行信息系統的調研結果,充分考慮《北京市電子文件和電子檔案元數據分類方案》的可操作性、便于執行性和科學合理性,在保障元數據項可充分表達對象元數據、事件元數據含義時,對元數據項進行了合理優化,最終選定的項目既滿足現行信息系統的基本現狀,又兼顧未來一段時期的發展需要,降低了各單位信息系統的改造量,使《北京市電子文件和電子檔案元數據分類方案》在實際工作中更易于落地,也更易于被文件和檔案管理人員及技術人員所接受。

應用前景

該課題通過調研國內外電子文件和電子檔案元數據的研究和使用情況,分析并提出科學的電子文件和電子檔案元數據分類方法及元數據項選取標準,并將研究成果《北京市電子文件和電子檔案元數據分類方案》運用到北京市電子文件和電子檔案管理工作以及北京數字檔案館(北京電子文件中心)建設項目中,為全市各級電子文件形成單位和國家綜合檔案館提供電子文件和電子檔案元數據管理的規范化支撐。

課題研究成果有望引領北京市電子文件和電子檔案元數據管理工作邁入科學化、規范化的管理階段,并引導北京市電子文件管理聯席會議、各級檔案移交單位和各級國家綜合檔案館在政策制定、發展規劃、信息系統建設等方面逐步進入一個良性的可持續發展時期。課題研究成果對北京市的實際工作具有極強的指導意義,同時對其他地區開展電子文件和電子檔案元數據管理工作具有參考價值,在國內具有較大的普遍適應性和借鑒意義。

作者單位:北京2022年冬奧會和冬殘奧會組織委員會、北京市檔案局

  • 微笑
  • 流汗
  • 難過
  • 羨慕
  • 憤怒
  • 流淚
責任編輯:中國檔案
0
同花顺e配资