時間:2023-03-20 16:21:11
序論:在您撰寫數(shù)字檔案論文時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導您走向新的創(chuàng)作高度。
【摘要題】數(shù)字信息化
【關鍵詞】數(shù)字檔案/信息安全/互聯(lián)網(wǎng)
【正文】
1.數(shù)字檔案網(wǎng)絡化應用的安全問題
數(shù)字檔案的產(chǎn)生、移交、歸檔、管理和利用都是基于互聯(lián)網(wǎng)、專用網(wǎng)和局域網(wǎng)環(huán)境下進行。系統(tǒng)的應用模式主要采用兩種方式(即基于瀏覽器的Browser/Server結(jié)構和基于客戶服務器模式的Client/Server結(jié)構),這兩種方式都可以實現(xiàn)網(wǎng)上對檔案信息的轉(zhuǎn)換、存貯和訪問。在數(shù)字檔案的歸檔、管理和服務利用等過程中,檔案數(shù)據(jù)的安全問題往往表現(xiàn)在多個層面。
1.1網(wǎng)絡級安全。是指支撐系統(tǒng)運行的物理設備的安全問題,包括網(wǎng)絡基礎建設如網(wǎng)絡布線、網(wǎng)絡聯(lián)接、局域網(wǎng)和廣域網(wǎng)環(huán)境的構建、設備的選型及其各個環(huán)節(jié)安全策略的考慮。往往會根據(jù)需要采用適當?shù)姆阑饓υO備及網(wǎng)絡管理軟件來確保局域網(wǎng)的內(nèi)外用戶的訪問權限和網(wǎng)絡上數(shù)據(jù)包的檢測與過濾;選用可靠的硬件安全設備保證整個系統(tǒng)的穩(wěn)定運行,如雙機熱備份、磁盤陣列等設備的采用來保證一臺服務器出現(xiàn)故障而不會導致整個系統(tǒng)的癱瘓問題,等等。網(wǎng)絡級安全策略是整個系統(tǒng)得以安全運行的基本保障,這是需要在系統(tǒng)規(guī)劃階段嚴格把關的重要內(nèi)容之一。
1.2數(shù)據(jù)級安全。主要是指涉及到系統(tǒng)存貯的檔案數(shù)據(jù)的安全問題,包括操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)、檔案數(shù)據(jù)存貯、數(shù)據(jù)備份、數(shù)據(jù)格式的轉(zhuǎn)換以及各類電子文件的保管和異地存貯策略等,以防止數(shù)據(jù)版本的更新、數(shù)據(jù)格式的轉(zhuǎn)換、硬件設備的意外損壞、存貯介質(zhì)的老化、失效、自然災害等造成的數(shù)據(jù)丟失、數(shù)據(jù)損壞甚至是計算機系統(tǒng)的破壞和癱瘓。操作系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)的安全問題雖說主要是取決于軟件供應商所開發(fā)的商品化軟件的穩(wěn)定性和安全的保障問題,但對于建立網(wǎng)絡化檔案管理信息系統(tǒng),首要考慮的是選擇什么樣的操作系統(tǒng)來確保應用系統(tǒng)的安裝和運行,目前主流的操作系統(tǒng)有Unix、Windows和Linix,他們各自有其優(yōu)越性,安全問題也各有特點,關鍵是如何選擇滿足用戶實際需求的操作系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)。當然考慮檔案元數(shù)據(jù)的存放規(guī)則和保管策略也是本階段非常重要的問題之一,如數(shù)據(jù)庫的分布式或集中式存放模式、數(shù)據(jù)的異地備份、電子數(shù)據(jù)格式的定期升級和保存介質(zhì)的更換等,需要一定的保管制度來約束。這些都是在系統(tǒng)設計和具體實現(xiàn)的過程中需要綜合考慮的關鍵因素,也是檔案應用系統(tǒng)能夠安全運行的根本保障。
1.3應用級安全。是指檔案管理信息系統(tǒng)在實際應用操作的過程中應考慮的基本問題,主要取決于檔案部門所采用的應用系統(tǒng)的用戶模型的定義模型和使用規(guī)則。一般情況下,檔案管理信息系統(tǒng)的用戶模型分多個層次、多個角色、多種功能或多種形式混合使用,來分別定義用戶權限。系統(tǒng)常常按功能權限劃分為系統(tǒng)管理、數(shù)據(jù)操作和數(shù)據(jù)瀏覽等3大類用戶:每類用戶角色的定義可以按照各業(yè)務職能的實際需求,對其操作權限和操作功能進行定義,如單位領導、部門領導、普通業(yè)務員等。但不論采用哪種用戶模型,要求應用級的安全至少包括兩項功能,一是對系統(tǒng)中各個功能模塊的操作權限的定義,另一個是對系統(tǒng)數(shù)據(jù)的分層管理和操作權限的定義。比如,兩個不同的用戶可以操作同一個功能模塊,但所能看到的數(shù)據(jù)只能是本用戶所在單位的數(shù)據(jù),而不應看到另一個用戶所在單位的數(shù)據(jù),這是網(wǎng)絡版檔案管理信息系統(tǒng)的基本操作需求;再如上級領導能夠看到下級人員所操作的數(shù)據(jù),而下級人員則無權看到上級領導權限范圍內(nèi)的數(shù)據(jù)。
2.網(wǎng)絡基礎環(huán)境的安全技術方案
網(wǎng)絡基礎環(huán)境的安全建設是防止系統(tǒng)外部非法用戶和不安全數(shù)據(jù)包侵犯的主要措施,常常采取的主要方法是物理隔離、應用防火墻以及身份認證等安全技術。防火墻技術是實現(xiàn)內(nèi)外網(wǎng)的隔離與訪問控制的最基本、最流行、最經(jīng)濟的、也是很有效的措施之一,這里以防火墻為例來討論數(shù)字檔案的網(wǎng)絡基礎環(huán)境的安全解決方案。
2.1防火墻安全解決方案。
防火墻是多個網(wǎng)絡之間的安全隔離網(wǎng),其基本原理是設置安全策略,控制(允許、拒絕、檢測)出入網(wǎng)絡的數(shù)據(jù)包,它本身具有較強的抗攻擊能力,可以實現(xiàn)以下幾種安全功能:一是限制未被授權的用戶進入內(nèi)部網(wǎng)絡,過濾掉不安全的數(shù)據(jù)包;二是防止入侵者接近本系統(tǒng)的防御設施;三是限定內(nèi)部網(wǎng)絡用戶訪問特殊站點;四是為監(jiān)視Internet安全提供方便。清華大學檔案館防火墻安全運行結(jié)構采用了三臺對外提供服務利用的服務器,都部署在非軍事管轄區(qū)(DMZ區(qū)),服務器通過特定的端口對外提供服務,如Web服務的8085端口,數(shù)據(jù)服務的1528等,避免了外界用戶對服務器其他端口訪問的可能性。如果少數(shù)的檔案室需要數(shù)據(jù)服務器特別指定用戶,可以采用防火墻用戶認證及用戶規(guī)則來限制,這樣除了經(jīng)過已認證的用戶外,所有本局域網(wǎng)以外的用戶在訪問內(nèi)部網(wǎng)絡時都需要通過防火墻進行過濾和篩選,具體使用時可以通過對客戶端IP地址或者網(wǎng)卡的MAC地址進行判斷和識別,以及通過對可疑數(shù)據(jù)包的檢測進行過濾,以保證整個網(wǎng)絡系統(tǒng)的安全運行。
這種鏈接方式是采用了防火墻的路由模式來實現(xiàn)的。檔案館內(nèi)部的辦公PC統(tǒng)一使用內(nèi)部定義的網(wǎng)址如192.168.X.X,為私有IP,通過防火墻的NAT功能訪問互聯(lián)網(wǎng),保證了安全性。外界不能直接訪問到檔案館內(nèi)部的PC,減少被攻擊的可能性;提高了可管理性,所有PC都可以實現(xiàn)MAC地址綁定,可以針對需要控制內(nèi)部用戶的上網(wǎng)時段和訪問內(nèi)容。
2.2網(wǎng)絡安全管理的人文策略。
硬件設備和網(wǎng)絡管理軟件是保證網(wǎng)絡安全運行的基本手段,同樣加強網(wǎng)絡的安全管理,采取科學有序的管理策略也是非常重要的人為因素,往往諸多的不安全因素恰恰反映在組織管理和防范不當?shù)确矫?,因此必須引起足夠的重視?/p>
系統(tǒng)管理員采用雙人負責制和任期有限的基本原則,防止人員流動或缺崗造成損失,避免職位壟斷或由于時間過長。
安全級別確定應根據(jù)工作的重要程度來確定,根據(jù)確定的安全等級,確定安全管理的范圍。
制定的機房管理制度:對于安全等級要求較高的系統(tǒng),要實行分區(qū)控制,限制工作人員出入與己無關的區(qū)域。出入管理可采用證件識別或安裝自動識別登記如門禁系統(tǒng),采用磁卡、身份卡等手段,對人員進行識別、登記管理。
制定嚴格的操作規(guī)程:操作規(guī)程要根據(jù)職責分離和多人負責的原則,各負其責,不能超越自己的管轄范圍。
制定完備的系統(tǒng)維護制度,如數(shù)據(jù)保護,數(shù)據(jù)備份等工作計劃。重要數(shù)據(jù)維護時要首先經(jīng)主管部門批準,并有安全管理人員在場,隨時將出現(xiàn)故障的原因、維護內(nèi)容和維護前后的情況要詳細記錄。
制定應急措施,保證緊急情況下,如何盡快恢復的應急措施,使損失減至最小。建立人員雇用和解聘制度,對工作調(diào)動和離職人員要及時調(diào)整相應的授權。
3.檔案管理信息系統(tǒng)的安全方案
數(shù)字檔案信息的錄入和維護主要依靠管理信息系統(tǒng)所提供的各項功能來完成,由于用戶角色的不同,權限的差異,要求應用系統(tǒng)能夠提供一套完整的用戶安全管理策略,以保證檔案信息的完整性和安全性。檔案管理信息系統(tǒng)的安全管理主要體現(xiàn)在3個方面。一是要采用成熟先進的計算機應用系統(tǒng)運行結(jié)構:二是對系統(tǒng)用戶按照工作需要進行角色和等級的區(qū)分;三是對檔案數(shù)據(jù)的安全管理級別如保密、開放等狀態(tài)按照檔案法規(guī)定和實施細則進行多級安全管理,以區(qū)別不同類型用戶的訪問。
3.1應用系統(tǒng)的體系結(jié)構。
三層Browser/Server體系結(jié)構有著多層數(shù)據(jù)安全機制、日常維護工作量小、對客戶端的運行環(huán)境要求也比較低(只要有瀏覽器即可)、客戶端物理位置可以靈活設置等諸多優(yōu)點,因此采用三層B/S的系統(tǒng)結(jié)構無疑是一個先進且明智的選擇。安全防護措施有三級,即防火墻安全措施、應用系統(tǒng)的身份認證安全措施以及數(shù)據(jù)庫管理系統(tǒng)的安全模型,
3.2應用系統(tǒng)用戶權限管理:
系統(tǒng)用戶權限的管理和角色分配與檔案管理的業(yè)務功能、操作流程、檔案數(shù)據(jù)的管理層次密切相關。一般情況下用戶分3大類,即管理級用戶、業(yè)務級用戶和瀏覽級用戶。管理級用戶負責系統(tǒng)整體數(shù)據(jù)備份,日常維護,系統(tǒng)模塊設置、公共字典維護、用戶定義及用戶權限設置等;業(yè)務級用戶負責各個業(yè)務崗位上數(shù)據(jù)的錄入、修改、刪除、統(tǒng)計、檢索等功能,該類用戶對系統(tǒng)中的數(shù)據(jù)具有完全的存取訪問權限,每個用戶的操作功能和訪問數(shù)據(jù)內(nèi)容的權限將根據(jù)其業(yè)務職能的不同而有所區(qū)別;瀏覽級用戶主要是通過Internet網(wǎng)查詢已經(jīng)開放的檔案信息,絕不允許對系統(tǒng)中的數(shù)字進行修改和刪除。無論是哪一類用戶,他在訪問系統(tǒng)的過程中主要是通過嚴格的身份認證技術來保證系統(tǒng)的安全性。因此系統(tǒng)用戶的安全管理也是非常重要的。各業(yè)務人員在操作過程中切不可將密碼帖在機器上,或者設置非常簡單的密碼,這些都是不利于安全管理的常見錯誤做法。
1.1基于管理能力和技術水平的人為風險
除了基于計算機技術特性的檔案數(shù)據(jù)風險,數(shù)字檔案管理者的管理能力和管理水平也是要加以重視的一項風險因素。由于我國檔案數(shù)字化建設是近些年才逐步發(fā)展起來的,因此,與之相關的法律、法規(guī)并不完善。在檔案數(shù)字化進程中,從電子文件的形成到歸檔保存,都應該有嚴格規(guī)范的程序管理、科學統(tǒng)一的標準體系和業(yè)務管理制度,而現(xiàn)實上卻并非如此。一般來說,檔案數(shù)據(jù)災難發(fā)生的可能性微乎其微,這樣就造成了檔案管理人員的麻痹大意和僥幸心理,還由于防范數(shù)字檔案風險的成本較高,出于經(jīng)濟方面的考慮,很難為了提高數(shù)字檔案的安全性投入過高的資金。此外,因為檔案管理系統(tǒng)是多用戶、多管理的系統(tǒng),如果管理不善或者管理人員的操作失誤,很可能導致數(shù)字檔案載體的損害及誤刪除、誤覆蓋、惡意篡改、越權訪問等安全事故的發(fā)生。
1.2基于自然災害的檔案數(shù)據(jù)風險
對于那些突發(fā)的災難,如火災、雷電、水災、颶風、地震等,一旦發(fā)生,其破壞程度非常高,范圍廣,而且?guī)缀鯖]有預見性,很難進行預防,因此,無論是對實體檔案還是數(shù)字檔案來說,其破壞程度都是難以估量、極具毀滅性的。
2數(shù)字檔案安全管理策略
2.1構建行之有效的數(shù)字檔案安全管理機制
首先,要貫徹前端控制思想。在數(shù)字檔案安全預防措施中,前端控制是重要內(nèi)容,實現(xiàn)事前預防、未雨綢繆,把災難控制在萌芽狀態(tài)。在建設數(shù)字檔案館的設計之初,就要對檔案館的抵御災難方面的設計重點考慮,并且合理制定數(shù)字檔案的操作規(guī)程,進一步完善應急預案、搶救預案等配套措施。為了防止由于軟硬件升級過快所帶來的讀取問題,在選擇設備時,要選擇技術成熟度高的檔案管理軟件和普及程度高的數(shù)字檔案存貯介質(zhì)。對于檔案技術力量進行合理配置和儲備,不斷地對數(shù)字檔案運行環(huán)境進行優(yōu)化。通過前端控制的方法,可以有效地提高數(shù)字檔案保存和維護的穩(wěn)定性。其次,要開展日常維護、災難備份、恢復和搶救等活動在內(nèi)的全程管理。全程管理貫穿數(shù)字檔案整個生命周期,通過有效的全程管理,對數(shù)字檔案安全實現(xiàn)全程監(jiān)測。最后,要對數(shù)字檔案安全管理機制進行后續(xù)監(jiān)督和評價。劃定數(shù)字檔案安全評價系統(tǒng)的范圍,選擇適當?shù)脑u價方法和評價指標,對有關數(shù)據(jù)進行收集、統(tǒng)計、分析,根據(jù)評價結(jié)果,不斷地進行改進,從而提高數(shù)字檔案信息安全管理體系的有效性,提高具體過程的效率,讓數(shù)字檔案信息更加保密、完整、易于使用。
2.2加強數(shù)字檔案管理的人力資源建設
要建立健全安全審查制度、崗位安全考核制度、安全培訓制度,加強安全管理制度的培訓和考核。數(shù)字檔案是由人來進行管理的,因此提高檔案人員的個人素質(zhì)、業(yè)務能力以及提高安全意識是檔案管理工作的重心。只有安全意識提高了,檔案人員才會對數(shù)字檔案工作真正重視起來,杜絕麻痹大意的思想,自覺遵守各項規(guī)章制度。對于管理操作數(shù)字檔案信息內(nèi)容的檔案員,尤其要加強安全保障技術的培訓。
2.3采用安全有效的技術手段與措施
2.3.1對數(shù)字檔案進行異質(zhì)轉(zhuǎn)換所謂數(shù)字檔案的異質(zhì)轉(zhuǎn)換,就是把數(shù)字信號轉(zhuǎn)換成文字、圖像、聲音等信號,把數(shù)字檔案轉(zhuǎn)換成紙質(zhì)檔案、縮微膠卷、聲像檔案等,即異質(zhì)轉(zhuǎn)換或異質(zhì)備份,對于重要的數(shù)字檔案,這是對其長期、安全防護的有效途徑。因為其脫離了數(shù)字信號的局限性,讀取時不再過多地依賴設備和技術,讀取方便,因此適合長期保存。經(jīng)過異質(zhì)轉(zhuǎn)換的檔案,脫離電子設備和環(huán)境,信息安全性提高,不易丟失。信息被"固化"到新的載體上,不僅避免的人為篡改的可能性,還可以對母本信息的真實性加以檢驗,甚至可以用來作為校正其母本的真實版本或可靠版本,成為真正意義上的檔案。2.3.2對數(shù)字檔案進行遷移新型信息存取設備對舊型檔案載體的不完全兼容性導致了必須采取數(shù)字檔案遷移的措施。計算機設備和軟件正以飛快的速度進行升級、換代、淘汰,幾年甚至幾十年后,現(xiàn)在使用的設備就會被完全淘汰,不復生產(chǎn),最終消失。以此,必須處于淘汰期的舊電子檔案信息存取設備進行儲備,用于遷移或載體轉(zhuǎn)換時讀取舊型檔案載體上的信息。此外,新/舊信息存取接口轉(zhuǎn)換設備也是要考慮的一項,如IDE/SATA接口轉(zhuǎn)換器,接口轉(zhuǎn)換設備可以有效延長舊型信息存取設備的生命周期。2.3.3對數(shù)字檔案進行同質(zhì)備份建立由數(shù)據(jù)備份系統(tǒng)、備份數(shù)據(jù)處理系統(tǒng)和完善的災難恢復計劃組成的備份與恢復系統(tǒng)。天災人禍的發(fā)生難以預見,但是可以通過一系列措施,將災害的破壞程度降到最低,甚至完全避免。數(shù)字檔案信息的備份就是一個行之有效的措施,通常采取靜態(tài)備份和同步備份相結(jié)合的方式。靜態(tài)備份用以保證歷史信息的完整,可以離線異地保存歷史記錄。同步備份用以保護當前系統(tǒng)的所有數(shù)據(jù),適用于硬盤數(shù)據(jù)恢復、網(wǎng)絡數(shù)據(jù)恢復、數(shù)據(jù)庫修復等災難數(shù)據(jù)恢復。2.3.4加強信息安全新技術的應用數(shù)字檔案安全包括很多方面,其中最重要的就是檔案信息的安全性和完整性。完整性即是要防止數(shù)字檔案信息被篡改或丟失,安全性則是要防止內(nèi)容被非法用戶獲取。電子簽名技術和數(shù)據(jù)加密技術是保障檔案信息內(nèi)容安全的有效手段。電子簽名技術能夠可靠地保證自形成時起,內(nèi)容保持完整、未被更改。目前最成熟的電子簽名技術就是“數(shù)字簽章”;加密技術主要涉及加密、解密算法和密匙,數(shù)據(jù)加密技術可以保障數(shù)字檔案信息的安全性和保密性。
3結(jié)語
人是推動數(shù)字檔案建設發(fā)展的動力,也是影響數(shù)字檔案信息安全的關鍵因素之一,數(shù)字檔案信息管理人員的安全意識、安全技能等將直接影響數(shù)字檔案信息的安全。當前,影響數(shù)字檔案信息安全的人為不當因素主要有:一是管理人員安全意識淡化。不少從事數(shù)字檔案信息管理的人員對安全管理的重要性認識不足,過分依賴安全技術,認為只要配置了安全防護策略、安裝了防火墻和殺毒軟件,就能保證數(shù)字檔案信息的安全,而沒有意識到在確保數(shù)字檔案信息的安全中,技術因素只降低安全風險,人的安全意識才是最重要的因素。二是管理人員對新技術應用能力的不足。區(qū)別于傳統(tǒng)檔案管理,對數(shù)字檔案信息的管理更多的要借助計算機應用軟件來完成,這些應用軟件能夠大幅度提高辦公效率,但在使用過程中難免會出問題,如果操作人員缺乏應用的處理能力,將會造成數(shù)據(jù)信息的丟失,從而數(shù)字檔案信息的安全。
2數(shù)字檔案信息標準尚不健全
目前,影響數(shù)字檔案信息安全最大的瓶頸問題就是標準的不健全,造成這一問題原因主要有:首先,從橫向上看,部門與部門、單位與單位之間的藩籬,影響標準的統(tǒng)一性。國家檔案局雖然出臺了《檔案管理軟件功能要求暫行規(guī)定》、《全國檔案信息化建設實施綱要》、《電子文件歸檔及電子檔案管理規(guī)范》等文件標準,但總體來看,這些標準要求相對比較寬泛,缺乏可操作性,并允許各單位根據(jù)實際情況進行再次開發(fā)設計,降低了統(tǒng)一的規(guī)范性要求。不少單位就自搞一套,而相互間兼容性又不夠,導致數(shù)字檔案管理系統(tǒng)的通用性、共享性較差,無法實現(xiàn)單位間檔案信息的無縫交流,甚至出現(xiàn)“信息孤島”現(xiàn)象,如若該單位發(fā)生災害等情況時,檔案信息很難恢復重建,嚴重影響數(shù)字檔案信息的安全。其次,從縱向上看,不少單位為追求上項目、造聲勢,開發(fā)出管理軟件沒有充分考慮信息技術發(fā)展帶來的影響,一些看似當前管用、可用的管理系統(tǒng),若干年后很難保證還可以繼續(xù)使用,若要重建或并入其它系統(tǒng),原有檔案信息的格式多種多樣,很難保證在新系統(tǒng)中全部繼續(xù)可用。
3數(shù)字檔案信息網(wǎng)絡系統(tǒng)自身的安全漏洞
各種信息網(wǎng)絡系統(tǒng)都不同程度地存在有一些漏洞,給信息管理帶來安全隱患,數(shù)字檔案網(wǎng)絡系統(tǒng)也不例外,其自身的安全漏洞嚴重影響著數(shù)字檔案信息的安全。其一是網(wǎng)絡通信協(xié)議的安全漏洞。多數(shù)檔案信息網(wǎng)絡是依托開放的網(wǎng)絡平臺,所使用的網(wǎng)絡通信協(xié)議如TCP/IP協(xié)議等,也是大家所熟悉的,但這些協(xié)議大多帶有安全漏洞。其二是各類軟件的安全漏洞。檔案信息網(wǎng)絡所采用的系統(tǒng)及應用軟件,在開發(fā)過程中不可避免地都會存在一些漏洞,有些甚至被故意安置一些后門,這些后門和漏洞極易被黑客所利用,造成對數(shù)字檔案信息的擴散、盜取、篡改等,嚴重時可導致整個系統(tǒng)的崩潰與癱瘓。其三是感染病毒。為方便信息查詢和利用,檔案信息網(wǎng)絡系統(tǒng)都提供有用戶登錄功能,有的還能自行下載保存檔案信息,這也為計算機病毒的傳播提供了便捷途徑,加之有些系統(tǒng)的防病毒措施不完善,很容易造成病毒的快速傳播,給數(shù)字檔案信息系統(tǒng)造成較大的安全威脅。
4存儲介質(zhì)的選擇及保存環(huán)境不當
數(shù)字信息存儲技術快速發(fā)展,使得存儲介質(zhì)的存儲容量不斷翻新,而不同類型的檔案信息對介質(zhì)的要求也不一樣,因此存儲介質(zhì)的選擇成為了其中的關鍵。如何選擇存儲介質(zhì),也沒有絕對的標準,為了能使數(shù)字檔案信息長期安全地保存,應根據(jù)數(shù)字檔案信息自身的特殊要求,正確選擇符合實際、質(zhì)量過硬的存儲載體。但有些單位在選擇存儲介質(zhì)時,沒有全面考慮檔案信息的自身要求,更多由于受經(jīng)濟承受能力的制約,選擇一些所謂"質(zhì)優(yōu)價廉"的產(chǎn)品,對存儲在其中的檔案信息造成極大威脅。存儲數(shù)字檔案信息的載體多為光電介質(zhì)或磁電介質(zhì),這些載體對環(huán)境的適應力較差,受溫度、濕度、磁場強度等外部因素影響較大。因此,保存數(shù)字檔案信息的載體對物理環(huán)境的要求比傳統(tǒng)檔案保存環(huán)境更加苛刻,應滿足恒溫、恒濕、避免腐蝕性氣體、遠離靜電及磁場干擾等條件。但不少單位缺少這樣的環(huán)境條件,只能將這些載體置于普通環(huán)境中,這就加快了其老化速度,容易出現(xiàn)各種故障,使存儲在其中的信息讀取不出來。
5數(shù)字檔案信息管理法規(guī)的不完善
1.宏觀管理模式
(1)集中管理模式。數(shù)字檔案館檔案信息資源建設的集中式管理式檔案工作域信息資源建設發(fā)展方面具有關鍵作用。一是通過集中管理模式能夠使得數(shù)字檔案館的信息資源建設具有一定的計劃性使檔案館檔案信息資源成為一種資源整體捉進其合理利用與開發(fā)二是數(shù)字檔案館通過集中式管理模式能夠?qū)ζ湫畔①Y源建設進行有效控制監(jiān)督檔案館各級信息資源建設的具體行為規(guī)范工作流程保證數(shù)字檔案館信息資源的可持續(xù)發(fā)展。但是集中式管理模式在一定程度上使得檔案信息資源建設缺乏一定的創(chuàng)新性。
(2)分散管理模式。數(shù)字檔案館檔案信息資源的分散管理模式具有較強的靈活性和適用性。通過分散管理模式能夠調(diào)動不同地區(qū)數(shù)字檔案館信息資源建設的積極性充分發(fā)揮自身優(yōu)勢加強檔案信息資源建設工作。同時數(shù)字檔案館采用分散管理模式為信息資源建設提供了個性化發(fā)展的渠道提高了檔案信息資源建設工作中的創(chuàng)新工作效力但是分散管理模式同樣有著信息資源分散、信息系統(tǒng)不兼容、共享交換不方便的問題。
2.微觀管理模式
(1)內(nèi)外結(jié)合模式。數(shù)字檔案館信息資源建設的內(nèi)外結(jié)合模式指的是數(shù)字檔案館根據(jù)其自身信息資源不足的現(xiàn)實情況積極尋找其他外部信息資源與其共同完成信息資源建設的一種模式。內(nèi)外結(jié)合管理模式的核心是數(shù)字檔案館通過整合內(nèi)部與外部的信息資源共同完成檔案信息資源建設工作。數(shù)字檔案館信息資源建設采用內(nèi)外結(jié)合的管理模式不但能夠克服集中管理與分散管理的弊端還能夠取兩者長處使檔案信息資源的建設具有較強的適應性。一是通過充分利用數(shù)字檔案館現(xiàn)有的信息資源使其人力資源、物品資源能夠得到良好利用提高檔案館信息資源建設的質(zhì)量;二是利用內(nèi)外結(jié)合的管理模式河以借鑒外部信息資源建設的信息技術、專業(yè)人才等,彌補數(shù)字檔案館在信息資源建設過程中的不足加強檔案館工作人員業(yè)務培訓加快信息資源建設步伐。
(2)專項建設模式。數(shù)字檔案館信息資源建設的專項建設模式指的是將其建設力量集中在某一個具體領域方面,由此集中力量解決數(shù)字檔案館信息資源建設過程中遇到的棘手問題盡可能找到問題的突破口。因此專項建設模式更適用于數(shù)字檔案館信息建設的最初時期或者用于專業(yè)性較強的數(shù)字檔案館信息資源建設中。
二、數(shù)字檔案館檔案信息資源建設管理流程
數(shù)字檔案館檔案信息資源建設是一項長期持續(xù)的工作包括總體分析、制訂計劃和一些具體業(yè)務共同構成。為了能夠有效控制管理數(shù)字檔案館信息資源建設工作必須對其進行建設規(guī)劃役計建設流程。第一階段數(shù)字檔案館信息資源建設的前期準備階段包括建設總體分析和建設整體規(guī)劃兩個方面。該階段主要是對數(shù)字檔案館信息資源建設的環(huán)境、條件等進行系統(tǒng)分析提出可行性研究報告為數(shù)字檔案館的信息資源建設進行整體規(guī)劃同時進一步細化具體業(yè)務的建設計劃。第二階段數(shù)字檔案館信息資源建設的具體業(yè)務的實施管理包括信息需求分析、獲取數(shù)字信息資源、信息鑒定、信息組織、信息存儲、信息開發(fā)和信息維護更新等環(huán)節(jié)。該階段數(shù)字檔案館信息資源建設的最終目的是控制整個過程保證其信息資源的建設目標能夠?qū)崿F(xiàn)。第三階段數(shù)字檔案館信息資源建設的總體評估和驗證階段包括數(shù)字檔案館建設績效評估和信息反饋兩個方面,該階段工作的最終目的是對其信息資源建設的實現(xiàn)流程、開發(fā)利用程度進行有效評估臉證數(shù)字檔案館信息資源建設工作是否已經(jīng)達到最初目標總結(jié)建設過程中的經(jīng)驗與問題將信息資源建設過程中遇到的問題進行反饋。
三、數(shù)字檔案館信息資源建設的策略構建
1.深入開發(fā)檔案信息資源
第一加強科學合理的成本投入??茖W合理的成本投入是保證數(shù)字檔案館檔案信息資源正常開放與利用的前提。檔案館信息資源的建設與應用是需要一定的人力、物力和資金的投入加果沒有合理的成本投入數(shù)字檔案館信息資源建設與開發(fā)就會受到各種阻礙,難以提高信息資源產(chǎn)品的品質(zhì)和檔次但是成本的投入也不能盲目增加而是要根據(jù)數(shù)字檔案館的實際建設情況而定。因此數(shù)字檔案館信息資源的建設與開發(fā)要保證有一定的成本投入同時避免資源浪費的問題出現(xiàn)。第二朋確信息產(chǎn)品特點。信息產(chǎn)品的特點與特色是數(shù)字檔案館信息資源建設過程中的取勝關鍵。檔案信息產(chǎn)品在社會中具有較強的特性例如原始性、不可復制性等由此數(shù)字檔案館信息資源的建設與開發(fā)工作更應該抓住這一特點朋確檔案信息產(chǎn)品的特色提高檔案信息產(chǎn)品的品質(zhì)與價值。第三實施聯(lián)合開發(fā)。數(shù)字檔案館信息資源建設與開發(fā)工作是一個整體過程對于檔案信息產(chǎn)品的標準規(guī)范、專業(yè)人員的配備與使用等方面都提出了較高要求。但是大部分數(shù)字檔案館都無法滿足以上這些要求需要經(jīng)過多方機構的整體協(xié)調(diào)加強檔案館之間、檔案部門與其他機構之間的聯(lián)系實施聯(lián)合開發(fā)建設,以此提高數(shù)字檔案館信息資源建設的步伐。
2.不斷更新檔案信息資源
隨著檔案信息產(chǎn)生和冗余信息價值的消失以及信息技術和生產(chǎn)設備的不斷提高數(shù)字檔案館信息資源建設仍然需要持續(xù)更新主要包括以下三個方面片是添加新的檔案信息主要是及時將最新的信息資源加入到數(shù)字檔案館信息資源建設開發(fā)工作中這也是檔案信息資源的重新建設不斷添加檔案信息資源,能夠提高數(shù)字檔案館信息資源開發(fā)的適應性和可用性。二是及時清除已經(jīng)失去利用價值的檔案信息由于數(shù)字檔案館信息資源建設占用的存儲空間有限不能夠滿足隨時增加新的信息資源因此需要及時清除已經(jīng)失去價值的檔案信息。而且這些老化無效的檔案信息如果不能夠及時清除不但會影響數(shù)字檔案館信息資源建設的運行速度還阻礙了用戶使用系統(tǒng)查找信息資源的行為。但是清除失去價值的檔案信息需要經(jīng)過嚴格的審查和鑒定并對其進行詳細記錄。三是數(shù)字檔案館信息資源管理系統(tǒng)的更新是隨著信息技術的發(fā)展而不斷進行的肖數(shù)字檔案館原始的信息系統(tǒng)無法滿足實際工作需求時,就需要對信息資源管理系統(tǒng)進行一次更新本質(zhì)上是將原始信息資源系統(tǒng)進行轉(zhuǎn)換。
3.科學合理的存儲信息資源
檔案信息的合理存儲是數(shù)字檔案館信息資源建設函待解決的問題,由于要充分考慮到檔案信息存儲與提取的便捷性和安全性,以及檔案信息長期有效存儲的問題,在數(shù)字檔案館信息資源建設過程中要重點規(guī)劃信息存儲問題通過有效的信息技術手段和保障措施加強檔案信息的存儲效率。首先要制訂完善合理的信息資源存儲方案在數(shù)字檔案館信息資源存儲建設中其信息技術手段包括分布式管理、數(shù)據(jù)挖掘、模糊識別、信息檢索等由于信息技術的發(fā)展是持續(xù)的,因此,不可能建設一種完全合理的信息資源存儲方案。但是數(shù)字檔案館應該充分考慮其建設環(huán)境和條件積極尋找科學合理的信息資源存儲方案,以最大限度滿足數(shù)字檔案館的現(xiàn)實需求這也是其信息資源建設過程中必須要綜合考慮的問題。其次要遵循數(shù)字檔案信息存儲的標準和規(guī)范。數(shù)字化建設提出以來信息領域?qū)τ跀?shù)字信息標準的研究方面也取得了一定進展。因此數(shù)字檔案館信息資源建設在對信息存儲進行合理規(guī)劃時要充分考慮到數(shù)字檔案信息的存儲標準和規(guī)范為后期檔案信息資源的共享與交流提供有力的支持和保障。最后數(shù)字檔案館檔案信息存儲要選擇適當?shù)拇鎯d體。載體是存儲檔案信息的實體。數(shù)字檔案信息與傳統(tǒng)檔案材料相同其存儲、保存、提取都與載體密不可分。數(shù)字檔案信息存儲的品質(zhì)與性能是影響檔案信息安全應用的關鍵因素油此數(shù)字檔案館在信息資源建設過程中對于檔案信息的存儲要采用性能穩(wěn)定、安全可靠的信息載體。
四、總結(jié)
【關鍵詞】數(shù)字檔案館/問題
【正文】
隨著現(xiàn)代信息技術的迅速發(fā)展和大量電子文件的產(chǎn)生,數(shù)字檔案館的研究和建設成為我國檔案界關注的熱點。數(shù)字檔案館與傳統(tǒng)檔案館相比,有著豐富的數(shù)字化資源、海量的存儲、便捷的檢索、快速的傳輸、高度的開放、信息的共享等優(yōu)點,使傳統(tǒng)的檔案館望塵莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我們應該清醒地認識到數(shù)字檔案館存在的缺陷,數(shù)字檔案館的建設還存在著諸多的難點和問題亟待深入研究解決。如果對存在的問題視而不見,或掉以輕心,必將給未來的檔案事業(yè)留下巨大而無法彌補的遺憾。
1數(shù)字檔案的憑證價值問題
檔案的基本價值有兩方面,憑證價值和參考價值,而尤以憑證價值最為重要,雖然,“目前人們對數(shù)字化檔案具有參考價值這一點已無疑義,然而,由于一系列技術和立法問題還未解決,數(shù)字化檔案目前還不具備法律憑證效力”[1]這無疑使數(shù)字檔案的作用大打折扣。因此,確認數(shù)字檔案的憑證價值就成為數(shù)字檔案館建設中無法回避的難題。目前,主要存在以下幾方面的問題:
1.1認識上的問題。數(shù)字檔案不具備“白紙黑字”的直觀性,必須依賴特定的計算機設備加以解讀。數(shù)字檔案完全脫離了以往人人對檔案“原件”的認識,從而引起人們對其原始性、可靠性的懷疑。而且,有些數(shù)字檔案即使載體保存完好,內(nèi)容亦可能在無形中丟失,它不像紙質(zhì)檔案那樣載體與內(nèi)容“一損俱損,一榮俱榮”。數(shù)字檔案與以往其他載體的檔案都不一樣,從甲骨檔案到簡牘檔案再到紙質(zhì)檔案,只是載體的耐久性有差別,并沒有改變其直觀性,而數(shù)字檔案的非人工識讀性與其他載體的檔案有著質(zhì)的區(qū)別。要確認數(shù)字檔案的憑證價值,恐怕不僅僅是改變觀念的問題,要真正認識數(shù)字檔案,確認其憑證價值,可能還需要走很長的路。
1.2技術上的問題。數(shù)字檔案是高新技術的產(chǎn)物,它給人們帶來極大便利的同時,也給人們留下了困惑與難題。其一,數(shù)字檔案具有易復制、修改、刪除的特點,使得檔案“原件”的概念變得難以確認。其二,計算機硬、軟件技術不斷更新?lián)Q代,迫使數(shù)字檔案必須不斷適應新的“生存環(huán)境”,不斷地變換載體、格式,因而無法通過載體、格式的鑒定來判定其原始性。其三,數(shù)字檔案不再具有特定的字跡,人們可以根據(jù)需要以不同的字體、字號將其輸出,傳統(tǒng)的字跡鑒定技術無法分辨數(shù)字檔案的原始性。其四,數(shù)字檔案對背景信息和元數(shù)據(jù)具有很強的依賴性?!半娮游募谋尘靶畔⒊3Ec文件內(nèi)容信息相分離保存,一旦失去背景信息,文件的內(nèi)容即便仍有意義,但也不再具有憑證價值。元數(shù)據(jù)是電子文件、電子檔案所特有的,“元數(shù)據(jù)由于其隱含性而易被忽視,而元數(shù)據(jù)一旦丟失或破壞,電子文件的原始性就會改變?!盵2]
1.3管理制度上的問題?!皞鹘y(tǒng)檔案之所以具有憑證價值,在一定程度上取決于嚴格的管理制度”,而目前“從電子文件的生成到歸檔都缺乏十分規(guī)范的程序化管理,缺乏嚴格而科學的標準體系和業(yè)務管理制度,一些標準、制度雖已制定,但全面推行尚需時日”[3]而且也有一定的難度。
2數(shù)字檔案信息的長期存取問題
數(shù)字檔案信息的長期存取問題是數(shù)字檔案館建設的一個具體而又棘手的難題?!皳?jù)報道,美國航空航天局在20年前發(fā)射的‘海盜’號火星探測器上的計算機中,已經(jīng)有20%的數(shù)據(jù)完全丟失,還有大約4000卷的統(tǒng)計數(shù)據(jù)因存儲的格式模糊無法讀出,程序員也無法保證將其恢復”。[4]數(shù)字檔案信息長期存取所面臨的主要問題有:
2.1存儲的介質(zhì)材料?!艾F(xiàn)代介質(zhì)的存儲設備還不可能解決計算機數(shù)據(jù)存儲問題”。[5]一般說來,磁盤的壽命是3~5年,光盤也不過30年左右,與能保存千年以上的紙質(zhì)載體相比,其壽命相差甚遠,而且它還要受到溫度、磁場、記錄存儲格式、硬件配置等多方面的影響,10年前還經(jīng)常使用的5.25英寸的軟盤,現(xiàn)在已經(jīng)沒有一臺普通電腦可以讀出來。
2.2機讀語言格式?!坝嬎銠C語言平均每三個月就會問世一種,而語言之間的互換大部分存在問題。很難想象,若干年以后,我們用現(xiàn)行的機器語言描述的數(shù)據(jù),還能百分之百的還原”。[6]
2.3對設備的依賴。數(shù)字檔案必須依賴于計算機設備才能讀出,這個特征對其長期存取帶來很多問題:“如設備發(fā)生故障、系統(tǒng)癱瘓,電子文件就讀不出來;電子文件對其它設備環(huán)境的不兼容性,使其只能在某種設備上處理,而不能在其它設備上處理;不同軟件環(huán)境形成的電子文件存貯在載體上,有時難以互換;電子文件加密后,不解密就無法識別;技術設備更新時,不及時解決格式轉(zhuǎn)換問題,也無法讀取等等”。[7]
3數(shù)字檔案的失真問題
“檔案數(shù)字化工作的生命線在于其能夠保持檔案原貌”。[8]然而,“就目前的研究水平而言,還難以保質(zhì)保量地完成館藏檔案數(shù)字化的任務。如已研制出的OCR掃描輸入技術,其平均識別率是95%。這對于追求最大程度真實性的檔案來說無疑是致命弱點”。[9]數(shù)字化的主要方式是掃描加工,在這一過程中造成數(shù)字檔案失真的原因還有以下幾個方面:其一,技術參數(shù)選擇不當。針對不同色調(diào)、紙質(zhì)和字跡,有時需調(diào)整不同的技術參數(shù),如分辨率、明暗度、對比度等,選擇不當會直接影響掃描的質(zhì)量,造成信息丟失、圖像模糊或產(chǎn)生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復勞動,難免有時失誤。如掃錯檔案或打錯順序,或存錯,或在建索引時鏈接錯誤等,如不及時發(fā)現(xiàn),將直接導致數(shù)字化檔案失真。其三,轉(zhuǎn)換過程中的失真。在進行數(shù)字檔案的遷移或在提供利用時,往往需要將掃描后形成的圖像文件轉(zhuǎn)換成另一種格式的文件,如果格式選擇不當,同樣會導致數(shù)據(jù)發(fā)生變化。
4數(shù)字檔案信息的安全問題
安全問題是計算機網(wǎng)絡世界最為頭痛的難題,也是數(shù)字檔案館中的重大難題之一。數(shù)字檔案館雖然被稱之為“館”,但它的存在更仿佛是一個巨大的沒有警察的自由市場,給不法分子帶來可乘之機,主要表現(xiàn)為:其一,計算機病毒。網(wǎng)絡信息安全的最主要的敵人就是計算機病毒。“國外有人估計,現(xiàn)在計算機病毒的傳染每兩個月增加1倍。網(wǎng)絡病毒的泛濫已對計算機網(wǎng)絡系統(tǒng)構成嚴重的威脅”。[10]其二,計算機黑客。由于網(wǎng)絡的加密性和匿名性,使入侵者難以被發(fā)現(xiàn)。黑客對信息資源的攻擊,不僅僅是好奇和自我挑戰(zhàn),程序設計高手可以篡改系統(tǒng)控制參數(shù)。其三,有竊取行為的間諜活動,窺視其機密信息進行復制或擴散。其四,有意破壞,摧毀系統(tǒng)的信息處理功能或破壞電子通訊裝置。其五,人為或偶然事故造成的威脅。如工作人員操作失誤而產(chǎn)生的不可預知的事件、網(wǎng)絡系統(tǒng)軟件硬件的故障、電子系統(tǒng)故障引發(fā)的系統(tǒng)問題等,所有這些,都使數(shù)字檔案信息的安全變得十分“脆弱”。
5數(shù)字檔案館建設的諸多技術問題
數(shù)字檔案館完全是高新技術、電子設備和計算機網(wǎng)絡技術支撐起來的產(chǎn)物,離開了高新技術的支撐,就沒有了數(shù)字檔案館。但是高新技術也給數(shù)字檔案館帶來了致命的弱點,真是“成也蕭何,敗也蕭何”。諸多的技術問題成為制約數(shù)字檔案館建設的難點。
5.1數(shù)字化設備技術條件。網(wǎng)絡系統(tǒng)中的硬件技術之一是必須有足夠的帶寬,以保證快捷地傳輸文本、語音、圖像、影像檔案,以便實現(xiàn)多網(wǎng)互連、高速互訪,實現(xiàn)跨平臺、跨系統(tǒng)、跨語種的互相轉(zhuǎn)換和鏈接。毫無疑問,足夠的帶寬條件和用戶對網(wǎng)絡信息傳輸?shù)男枨髮⒁恢笔且粚γ荏w。
5.2技術難題。數(shù)字檔案館是以信息源、網(wǎng)絡、數(shù)據(jù)庫為基礎的,其相關技術是較復雜較先進并且不斷發(fā)展的,它幾乎囊括了計算機網(wǎng)絡技術所需要解決的所有問題,技術密集。如數(shù)字化圖像的存儲與壓縮、數(shù)據(jù)組織技術、信息檢索技術、多語言平臺互換互訪技術、海量信息存儲與調(diào)配技術等,既是計算機網(wǎng)絡技術的難關,也是制約數(shù)字檔案館建設發(fā)展的難題。此外,“數(shù)字檔案館的建設和運行需要解決一些特殊問題,為此必須開發(fā)應用一系列新技術,如:身份認定、智能檢索、信息隱蔽、數(shù)字水印、電子簽章、操作跟蹤、信息加密等,其中有很多技術有創(chuàng)新性”。[11]這些技術也都是不容易解決的問題。
5.3技術過時問題。在飛速發(fā)展的IT業(yè)中,電腦硬件、操作系統(tǒng)、應用軟件及存儲載體等不斷地被新產(chǎn)品所替代,IT產(chǎn)品是真正的“短命鬼”。雖然絕大多數(shù)新產(chǎn)品承諾向下兼容,但其兼容的“代”數(shù)在跨越若干年后,舊的數(shù)字信息就很難被新的硬件設備和軟件系統(tǒng)讀出?!凹夹g過時”的陰影一直會籠罩著數(shù)字信息。專家們提出的解決方案是數(shù)據(jù)遷移,但遷移卻存在著一個致命弱點,就是每次遷移總會丟失一定的相關信息,這些丟失的信息積累起來會造成數(shù)字檔案信息無法準確恢復原貌。
6數(shù)字檔案館建設的標準化問題
數(shù)字檔案館建設的目的是要使地區(qū)檔案館、全國檔案館乃至全世界的檔案館連成一個整體,以實現(xiàn)檔案信息資源共享。這個整體性的數(shù)字檔案館事實上是一種基于網(wǎng)絡環(huán)境下的數(shù)字化檔案信息資源共享的社會檔案館系統(tǒng),是一個面向?qū)ο蟮姆植际降木W(wǎng)狀結(jié)構模式,是由一個個相對獨立的數(shù)字檔案館實體組成的。要對這分散在各地的數(shù)字檔案信息資源進行組織控制,就必須要有彼此兼容的硬件環(huán)境,要有一致的文件格式、統(tǒng)一的著錄標引標準、數(shù)據(jù)描述標準、元數(shù)據(jù)標準、全文數(shù)據(jù)庫標準等等,這些標準也僅僅是幾個主要的標準?!岸鴮嶋H上,在數(shù)字檔案館建設中,標準化是一個體系,是一個系統(tǒng),因此對于我們來說,如何結(jié)合我國實際,迅速建立起一個適合我國數(shù)字檔案館建設的標準化體系是擺在我們面前的一個迫切需要解決的新問題”。[12]然而,要解決這個問題并不容易,我們面臨著很多問題:其一,一個嚴峻的事實是我國檔案信息系統(tǒng)沒有相應的具體標準可遵循;其二,有些標準規(guī)范要超出檔案工作的范圍,如綜合數(shù)據(jù)處理格式就需滿足跨行業(yè)、跨部門的要求。如何統(tǒng)一是一個很麻煩的問題;其三,與整個檔案工作的標準相銜接的問題;其四,與國際通用標準的接軌問題;其五,由于計算機技術更新速度非???,每次技術設備的更新,都會對原標準產(chǎn)生相應的影響,因而必須不斷適時修訂標準。
7數(shù)字檔案館建設的投入與產(chǎn)出問題
數(shù)字檔案館建設存在著投入與產(chǎn)出不協(xié)調(diào)的問題。如果我們把數(shù)字檔案館與數(shù)字圖書館作比較,會對這個問題看得更清楚。數(shù)字檔案館建設投入的費用是巨大的,而且它的建設費用要遠遠高于數(shù)字圖書館的建設費用。由于圖書有復本,許多圖書館保存的圖書都一樣。因而國家圖書館和省市圖書館的部分圖書數(shù)字化后,其他圖書館特別是中小型圖書館完全可以坐享其成,不必再花費資金重復建設。而檔案館則不行,全國各個檔案館保存的檔案幾乎都是孤本,因而檔案館在用于檔案數(shù)字化的費用上要比圖書館多,如,僅檔案館進行數(shù)字化檔案目錄的“工作量約是圖書館的35倍”。[13]但是檔案館的利用人次與圖書館讀者的人數(shù)相比卻少得多,“以北京市檔案館和國家
圖書館(原北京圖書館)為例,前者年利用人次約四五千人,后者一年的讀者數(shù)不少于二百萬人”。[14]兩者相差400倍。“即使一、二史館和中央檔案館三個國家檔案館的年平均利用人次也不過5960人次”,[15]三個館加起來與國家圖書館相比仍相差100多倍。檔案館的利用長期處于低谷已是不爭的事實,就是建成數(shù)字檔案館后,這種情況也不會改變多少,因為檔案信息有保密和時效的限制,有利用者的限制,并不會增加太多的利用者,更不可能趕上數(shù)字圖書館的讀者人數(shù)。事實上,傳統(tǒng)檔案館本來就存在著投入與產(chǎn)出不協(xié)調(diào)的問題,只不過未引起人們的關注,但是,數(shù)字檔案館的建設卻拉大了這種不協(xié)調(diào)的距離,使這個問題凸現(xiàn)出來。它也成為擺在數(shù)字檔案館建設面前很難解決的問題。
8數(shù)字檔案中的經(jīng)濟問題
與其說數(shù)字檔案館是高新技術支撐起來的,不如更實際地說是由巨額資金支撐起來的,因為所有的高新技術和設備都將由資金來兌現(xiàn)。數(shù)字檔案館的建設與利用,不論對于檔案部門還是利用者,都有很重的經(jīng)濟負擔,經(jīng)濟問題可能是困擾數(shù)字檔案館建設的根本性難題之一。
8.1檔案部門方面的問題。
8.1.1數(shù)字檔案館建設的費用問題。數(shù)字檔案館的建設費用是巨大的,開發(fā)一個稍具規(guī)模的數(shù)字檔案館系統(tǒng),不論是購買軟件和硬件,還是開發(fā)專用軟件,還是館藏檔案的數(shù)字化工作,都需要花費可觀的人力、財力和時間,這些都需要有強大的經(jīng)濟實力做后盾。而數(shù)字檔案館的建設說到底,仍是以政府投入為主。但國家的綜合國力不可能在短期內(nèi)發(fā)展到較高的水平。因此,資金短缺是建設數(shù)字檔案館的最不好解決的難題。檔案館是公益性和社會性的部門,也不能走“以文養(yǎng)文”、“以館建館”之路,即便是想走此路也走不通,正如上文所述的數(shù)字檔案館存在著投入與產(chǎn)出的巨大反差,即使對利用者收費,數(shù)字檔案館也根本不可能收回投資成本。數(shù)字檔案館建設的巨額費用對于本來就經(jīng)費緊張的檔案部門來說是有相當難度的。而對中西部欠發(fā)達地區(qū)的大部分市、縣檔案館來說,連維持日常工作的經(jīng)費都成問題,建設數(shù)字檔案館恐怕在相當長的時間內(nèi)都是可望而不可及的。
8.1.2數(shù)字檔案館的使用和維護費用問題。雖然數(shù)字檔案館的建設費用巨大,但它并不是一勞永逸的。它的維護和使用的費用并不少于初建的費用。數(shù)字檔案館就像一個“無底洞”,需要不斷地投入大量資金來維持其正常運轉(zhuǎn)。
8.1.2.1平時正常的使用和維護費用。數(shù)字檔案館是靠技術支撐起來的,平時正常的使用和維護也需要很大一筆資金才能維持,如通信費、數(shù)據(jù)使用費和設備維護費等都需要不斷地支出,且費用不低。
8.1.2.2設備更新費用?,F(xiàn)代信息處理技術發(fā)展迅猛,其軟硬件更新非???,而在市場經(jīng)濟利益的強大動因驅(qū)使下,更加快了這種更新速度,“錄制、存貯信息的設備、方法及軟件隨著新產(chǎn)品、新方法的問世,正以5-9年的周期更新,新產(chǎn)品、新方法的不斷問世,必將導致原有設備及軟件的淘汰”[16]。數(shù)字檔案館要維持正常使用,也必須不斷地更新設備和軟件,但要更新設備和軟件,卻又要花費大量的資金,而且是每隔幾年就要又投入一次。
8.1.2.3數(shù)字檔案信息長期存取使用的費用。正如上文所述數(shù)字檔案信息長期存取是數(shù)字檔案館的一個具體而棘手的難題。而數(shù)字檔案館又必須使用數(shù)字檔案信息,專家們給出了一個不得已而為之的方案,就是不斷地使數(shù)字檔案信息遷移轉(zhuǎn)錄。但是遷移轉(zhuǎn)錄的費用是相當可觀的和不可預知的。一般檔案館能否承受這不斷遷移轉(zhuǎn)錄所需的費用,也是一個既不可預見又不容易解決的難題。
8.1.3向利用者收取數(shù)字檔案信息利用費的問題。檔案法規(guī)規(guī)定檔案館向社會提供利用檔案,可以收取費用。數(shù)字檔案館建設投資大,收取一定的費用也是應該的。但是,如何制定收取利用費的收費制度,如標準、數(shù)量、繳納程序等,也是數(shù)字檔案館建設的難題之一。
8.2利用者方面的問題。利用者的經(jīng)濟承受能力,也是影響和制約.數(shù)字檔案館建設發(fā)展的問題之一。數(shù)字檔案館需上網(wǎng)閱覽,從目前我國上網(wǎng)所需資費來看,每小時的費用是發(fā)達國家的10多倍,而用戶的平均收入又低于發(fā)達國家的若干倍。我國80-90%的用戶認為網(wǎng)絡收費過高,通信費難以承受。再一點是下載檔案信息的打印費用,盡管并不是要將所有下載的檔案信息打印出來,就是部分打印也需要承受可觀的打印費。如果再加上數(shù)字檔案信息使用費,這些費用加在一起,將會相當高。必將影響利用者對數(shù)字檔案館的使用,也將使數(shù)字檔案館的建設失去應有的作用和意義;
9數(shù)字檔案館法律法規(guī)方面的問題
數(shù)字檔案館建設中會涉及到許多法律問題,而這些法律問題恰恰又是亟待解決而又難以一時解決的問題。
9.1檔案法規(guī)方面的問題。面對數(shù)字檔案館產(chǎn)生的新情況、新特點.檔案法規(guī)中的一些內(nèi)容已不適應,而要解決起來仍有一定的難度。如對利用者的身份認證問題,在網(wǎng)上進行借閱限定和身份認證不僅增加技術難度,而且還要增加開支。而對外國利用者來說,由于限制得更嚴格,在網(wǎng)上操作更加困難。數(shù)字檔案館是開放的,是不受國界限制的,數(shù)字檔案館建設的初衷就是實現(xiàn)檔案信息的社會共享。但如果取消身份認證,那么就等于中外利用者都一樣沒有限制。因此,真要修改完善檔案法規(guī),兼顧到方方面面,還是有相當?shù)碾y度。
9.2著作權、知識產(chǎn)權、隱私權的保護問題。在數(shù)字檔案館的環(huán)境下,由于檔案信息通過網(wǎng)絡進行傳遞,它極容易被獲取、被復制、被傳播,對利用者控制的難度加大。原來意義上的著作權、知識產(chǎn)權、隱私權的保護方式對權利人已無法提供有效的保護,著作權、知識產(chǎn)權和隱私權很容易被侵犯。因此,如何對檔案著作權、知識產(chǎn)權和隱私權進行有效保護成為數(shù)字檔案館建設面臨的一大挑戰(zhàn)。從技術上說,真正切實可行的保護技術,目前尚屬于極其薄弱的環(huán)節(jié)。從完善相應法律法規(guī)方面說,目前進展緩慢,尚有許多難題不易解決。
9.3數(shù)字檔案的法律效用問題。對于數(shù)字檔案的法律效用問題,它是數(shù)字檔案館建設中一個不能回避的特殊難題。要想讓它得到法律的認可,恐怕還需要相當長的時間。而“如果電子檔案的法律憑證問題得不到解決,數(shù)字檔案館的數(shù)字化館藏也就失去了利用的價值、存在的意義”。[17]
10數(shù)字檔案館的基礎理論問題
數(shù)字檔案館的建設必然要受到數(shù)字檔案館理論研究的影響和指導。目前,對數(shù)字檔案館的研究還處于起步階段,許多認識不相同,統(tǒng)一尚需時日。而且有關數(shù)字檔案館的一些基礎理論問題,都是一些不易解決的難題。
10.1數(shù)字檔案館的概念問題。自從數(shù)字檔案館概念出現(xiàn)以來,“關于數(shù)字檔案館的認識并不統(tǒng)一,其定義就有數(shù)十種之多,勢必會造成對數(shù)字檔案館建設方向把握上的不一致”。[18]觀點不一樣,建設的數(shù)字檔案館就不一樣,建設的難易程度、工作流程、服務功能、配套措施、系統(tǒng)邊界和社會影響等等也都會截然不同”。[19]而統(tǒng)一認識或基本統(tǒng)一認識都非一日之功。但這個問題不解決,將對數(shù)字檔案館的實踐產(chǎn)生不利影響。
10.2數(shù)字檔案館的系統(tǒng)邊界問題?!皵?shù)字檔案館支持以網(wǎng)絡連接的相關檔案部門的數(shù)字化館藏,能夠提供分布于不同地區(qū)的檔案信息。然而信息網(wǎng)絡的一個重要特征就是鏈接,這種在技術上可以無限鏈接的情況下,就涉及到了系統(tǒng)的邊界問題”。[20]數(shù)字檔案館系統(tǒng)邊界的界定決定著數(shù)字檔案館所擁有的功能特性。同時也決定著數(shù)字檔案信息在信息中的地位。然而,“在圖書館情報學界,人們討論數(shù)字化圖書館時有種傾向,認為因特網(wǎng)就是一個數(shù)字圖書館,任何人都可以到這個無所不包的圖書館中查閱文獻、學習知識、合作交流甚至著書立說。這就把數(shù)字圖書館的地址空間和信息資源空間定位很廣,其系統(tǒng)邊界也無所不包。它不僅包括了書目文獻管理、信息網(wǎng)絡信息資源的組織與作用,甚至包括檔案館和博物館的信息內(nèi)容,因此建設規(guī)模異常龐大”。[21]數(shù)字圖書館的這種“擴張”,使本來就處于“弱勢”地位的檔案信息的地位更加岌岌可危,如果不對數(shù)字檔案館的系統(tǒng)邊界給以恰當?shù)慕缍?,并采取相應的技術措施,那么,在不久的將來,數(shù)字檔案館將會消失在數(shù)字圖書館的海洋里,成為數(shù)字圖書館的一部分。
10.3數(shù)字檔案的概念問題。數(shù)字檔案是數(shù)字檔案館生存的基礎。但是目前對數(shù)字檔案概念的認識卻并不統(tǒng)一和清晰。其一,對數(shù)字檔案概念的研究并未引起檔案界太多的關注;其二,一些對數(shù)字檔案概念的認識,大部分都是以傳統(tǒng)的檔案概念為基礎的,仍舊把數(shù)字檔案當作電子文件的轉(zhuǎn)化物來認識,無非是傳統(tǒng)檔案概念在數(shù)字時代的翻版。這里暫不說傳統(tǒng)的以文件為屬概念的檔案概念本身就有許多可商榷的地方。單說在數(shù)字信息時代文件的概念、檔案概念和其他信息的概念都會受到影響而發(fā)生變化,它們之間有互相融合的趨勢。如何區(qū)分它們將變得越來越困難。在數(shù)字時代的信息網(wǎng)絡環(huán)境下,數(shù)字文件、數(shù)字檔案、數(shù)字圖書、數(shù)字情報、數(shù)字資料、數(shù)字文獻籌有什么不同?如何區(qū)分它們?如果不能把數(shù)字檔案從這些其他數(shù)字信息中區(qū)分出來,那么數(shù)字檔案的概念的存在就將走向消亡,而在數(shù)字檔案概念基礎上建立起來的數(shù)字館大廈也將隨之傾覆。因此,必須把數(shù)字檔案概念從其他數(shù)字信息中區(qū)別出來,數(shù)字檔案館才能生存。但這是一道擺在我們面前的并不容易找到答案的難題。
【參考文獻】
1閻會勤.新世紀檔案工作展望.檔案學通訊,2001;6
23景紅.電子檔案憑證價值探析.檔案與建設,2000;10
456李玉安.數(shù)字圖書館建設的十大難題.圖書館學刊,2002;3,
7徐義全.電子文件的特性與長期保存.檔案學研究,2000;1
8吳志宏.數(shù)字化檔案的隱憂:數(shù)據(jù)失真.北京檔案,2002;12
9譚zhēng@①培,數(shù)字檔案館論綱.檔案學研究,2001;5
1016范開宏.數(shù)字圖書館之憂思.圖書與情報,2002;1
11邱曉威.數(shù)字檔案館及其建設模式.中國檔案,2001;10
12段榮婷.我國數(shù)字檔案館的研究與建設.中國檔案,2002;6
13劉東斌.數(shù)字檔案館與數(shù)字圖書館的比較研究.檔案管理,2003;2
14求實.檔案館與圖書館利用對比分析及對策.北京檔案,1999;9
15國家檔案局綜合科教司.從統(tǒng)計數(shù)字看1991年度全國檔案事業(yè)的發(fā)展狀況.檔案學研究,1993;1
17譚zhēng@①培.數(shù)字檔案館建設面臨的問題及其對策.浙江檔案,2002;3
18朱蒙生.傳統(tǒng)檔案館向數(shù)字檔案館跨越所面臨的問題.中國檔案,2003;3
【摘要題】數(shù)字信息化
【關鍵詞】數(shù)字檔案館/問題
【正文】
隨著現(xiàn)代信息技術的迅速發(fā)展和大量電子文件的產(chǎn)生,數(shù)字檔案館的研究和建設成為我國檔案界關注的熱點。數(shù)字檔案館與傳統(tǒng)檔案館相比,有著豐富的數(shù)字化資源、海量的存儲、便捷的檢索、快速的傳輸、高度的開放、信息的共享等優(yōu)點,使傳統(tǒng)的檔案館望塵莫及。然而,它也不可避免地存在一些缺陷和不足,有的甚至可能是致命的缺陷。因此,我們應該清醒地認識到數(shù)字檔案館存在的缺陷,數(shù)字檔案館的建設還存在著諸多的難點和問題亟待深入研究解決。如果對存在的問題視而不見,或掉以輕心,必將給未來的檔案事業(yè)留下巨大而無法彌補的遺憾。
1數(shù)字檔案的憑證價值問題
檔案的基本價值有兩方面,憑證價值和參考價值,而尤以憑證價值最為重要,雖然,“目前人們對數(shù)字化檔案具有參考價值這一點已無疑義,然而,由于一系列技術和立法問題還未解決,數(shù)字化檔案目前還不具備法律憑證效力”[1]這無疑使數(shù)字檔案的作用大打折扣。因此,確認數(shù)字檔案的憑證價值就成為數(shù)字檔案館建設中無法回避的難題。目前,主要存在以下幾方面的問題:
1.1認識上的問題。數(shù)字檔案不具備“白紙黑字”的直觀性,必須依賴特定的計算機設備加以解讀。數(shù)字檔案完全脫離了以往人人對檔案“原件”的認識,從而引起人們對其原始性、可靠性的懷疑。而且,有些數(shù)字檔案即使載體保存完好,內(nèi)容亦可能在無形中丟失,它不像紙質(zhì)檔案那樣載體與內(nèi)容“一損俱損,一榮俱榮”。數(shù)字檔案與以往其他載體的檔案都不一樣,從甲骨檔案到簡牘檔案再到紙質(zhì)檔案,只是載體的耐久性有差別,并沒有改變其直觀性,而數(shù)字檔案的非人工識讀性與其他載體的檔案有著質(zhì)的區(qū)別。要確認數(shù)字檔案的憑證價值,恐怕不僅僅是改變觀念的問題,要真正認識數(shù)字檔案,確認其憑證價值,可能還需要走很長的路。
1.2技術上的問題。數(shù)字檔案是高新技術的產(chǎn)物,它給人們帶來極大便利的同時,也給人們留下了困惑與難題。其一,數(shù)字檔案具有易復制、修改、刪除的特點,使得檔案“原件”的概念變得難以確認。其二,計算機硬、軟件技術不斷更新?lián)Q代,迫使數(shù)字檔案必須不斷適應新的“生存環(huán)境”,不斷地變換載體、格式,因而無法通過載體、格式的鑒定來判定其原始性。其三,數(shù)字檔案不再具有特定的字跡,人們可以根據(jù)需要以不同的字體、字號將其輸出,傳統(tǒng)的字跡鑒定技術無法分辨數(shù)字檔案的原始性。其四,數(shù)字檔案對背景信息和元數(shù)據(jù)具有很強的依賴性?!半娮游募谋尘靶畔⒊3Ec文件內(nèi)容信息相分離保存,一旦失去背景信息,文件的內(nèi)容即便仍有意義,但也不再具有憑證價值。元數(shù)據(jù)是電子文件、電子檔案所特有的,“元數(shù)據(jù)由于其隱含性而易被忽視,而元數(shù)據(jù)一旦丟失或破壞,電子文件的原始性就會改變。”[2]
1.3管理制度上的問題?!皞鹘y(tǒng)檔案之所以具有憑證價值,在一定程度上取決于嚴格的管理制度”,而目前“從電子文件的生成到歸檔都缺乏十分規(guī)范的程序化管理,缺乏嚴格而科學的標準體系和業(yè)務管理制度,一些標準、制度雖已制定,但全面推行尚需時日”[3]而且也有一定的難度。
2數(shù)字檔案信息的長期存取問題
數(shù)字檔案信息的長期存取問題是數(shù)字檔案館建設的一個具體而又棘手的難題?!皳?jù)報道,美國航空航天局在20年前發(fā)射的‘海盜’號火星探測器上的計算機中,已經(jīng)有20%的數(shù)據(jù)完全丟失,還有大約4000卷的統(tǒng)計數(shù)據(jù)因存儲的格式模糊無法讀出,程序員也無法保證將其恢復”。[4]數(shù)字檔案信息長期存取所面臨的主要問題有:
2.1存儲的介質(zhì)材料?!艾F(xiàn)代介質(zhì)的存儲設備還不可能解決計算機數(shù)據(jù)存儲問題”。[5]一般說來,磁盤的壽命是3~5年,光盤也不過30年左右,與能保存千年以上的紙質(zhì)載體相比,其壽命相差甚遠,而且它還要受到溫度、磁場、記錄存儲格式、硬件配置等多方面的影響,10年前還經(jīng)常使用的5.25英寸的軟盤,現(xiàn)在已經(jīng)沒有一臺普通電腦可以讀出來。
2.2機讀語言格式?!坝嬎銠C語言平均每三個月就會問世一種,而語言之間的互換大部分存在問題。很難想象,若干年以后,我們用現(xiàn)行的機器語言描述的數(shù)據(jù),還能百分之百的還原”。[6]
2.3對設備的依賴。數(shù)字檔案必須依賴于計算機設備才能讀出,這個特征對其長期存取帶來很多問題:“如設備發(fā)生故障、系統(tǒng)癱瘓,電子文件就讀不出來;電子文件對其它設備環(huán)境的不兼容性,使其只能在某種設備上處理,而不能在其它設備上處理;不同軟件環(huán)境形成的電子文件存貯在載體上,有時難以互換;電子文件加密后,不解密就無法識別;技術設備更新時,不及時解決格式轉(zhuǎn)換問題,也無法讀取等等”。[7]
3數(shù)字檔案的失真問題
“檔案數(shù)字化工作的生命線在于其能夠保持檔案原貌”。[8]然而,“就目前的研究水平而言,還難以保質(zhì)保量地完成館藏檔案數(shù)字化的任務。如已研制出的OCR掃描輸入技術,其平均識別率是95%。這對于追求最大程度真實性的檔案來說無疑是致命弱點”。[9]數(shù)字化的主要方式是掃描加工,在這一過程中造成數(shù)字檔案失真的原因還有以下幾個方面:其一,技術參數(shù)選擇不當。針對不同色調(diào)、紙質(zhì)和字跡,有時需調(diào)整不同的技術參數(shù),如分辨率、明暗度、對比度等,選擇不當會直接影響掃描的質(zhì)量,造成信息丟失、圖像模糊或產(chǎn)生額外信息,客觀上造成檔案原貌的改變。其二,工作失誤。檔案掃描是大量的重復勞動,難免有時失誤。如掃錯檔案或打錯順序,或存錯,或在建索引時鏈接錯誤等,如不及時發(fā)現(xiàn),將直接導致數(shù)字化檔案失真。其三,轉(zhuǎn)換過程中的失真。在進行數(shù)字檔案的遷移或在提供利用時,往往需要將掃描后形成的圖像文件轉(zhuǎn)換成另一種格式的文件,如果格式選擇不當,同樣會導致數(shù)據(jù)發(fā)生變化。
4數(shù)字檔案信息的安全問題
安全問題是計算機網(wǎng)絡世界最為頭痛的難題,也是數(shù)字檔案館中的重大難題之一。數(shù)字檔案館雖然被稱之為“館”,但它的存在更仿佛是一個巨大的沒有警察的自由市場,給不法分子帶來可乘之機,主要表現(xiàn)為:其一,計算機病毒。網(wǎng)絡信息安全的最主要的敵人就是計算機病毒。“國外有人估計,現(xiàn)在計算機病毒的傳染每兩個月增加1倍。網(wǎng)絡病毒的泛濫已對計算機網(wǎng)絡系統(tǒng)構成嚴重的威脅”。[10]其二,計算機黑客。由于網(wǎng)絡的加密性和匿名性,使入侵者難以被發(fā)現(xiàn)。黑客對信息資源的攻擊,不僅僅是好奇和自我挑戰(zhàn),程序設計高手可以篡改系統(tǒng)控制參數(shù)。其三,有竊取行為的間諜活動,窺視其機密信息進行復制或擴散。其四,有意破壞,摧毀系統(tǒng)的信息處理功能或破壞電子通訊裝置。其五,人為或偶然事故造成的威脅。如工作人員操作失誤而產(chǎn)生的不可預知的事件、網(wǎng)絡系統(tǒng)軟件硬件的故障、電子系統(tǒng)故障引發(fā)的系統(tǒng)問題等,所有這些,都使數(shù)字檔案信息的安全變得十分“脆弱”。
5數(shù)字檔案館建設的諸多技術問題
數(shù)字檔案館完全是高新技術、電子設備和計算機網(wǎng)絡技術支撐起來的產(chǎn)物,離開了高新技術的支撐,就沒有了數(shù)字檔案館。但是高新技術也給數(shù)字檔案館帶來了致命的弱點,真是“成也蕭何,敗也蕭何”。諸多的技術問題成為制約數(shù)字檔案館建設的難點。
5.1數(shù)字化設備技術條件。網(wǎng)絡系統(tǒng)中的硬件技術之一是必須有足夠的帶寬,以保證快捷地傳輸文本、語音、圖像、影像檔案,以便實現(xiàn)多網(wǎng)互連、高速互訪,實現(xiàn)跨平臺、跨系統(tǒng)、跨語種的互相轉(zhuǎn)換和鏈接。毫無疑問,足夠的帶寬條件和用戶對網(wǎng)絡信息傳輸?shù)男枨髮⒁恢笔且粚γ荏w。
5.2技術難題。數(shù)字檔案館是以信息源、網(wǎng)絡、數(shù)據(jù)庫為基礎的,其相關技術是較復雜較先進并且不斷發(fā)展的,它幾乎囊括了計算機網(wǎng)絡技術所需要解決的所有問題,技術密集。如數(shù)字化圖像的存儲與壓縮、數(shù)據(jù)組織技術、信息檢索技術、多語言平臺互換互訪技術、海量信息存儲與調(diào)配技術等,既是計算機網(wǎng)絡技術的難關,也是制約數(shù)字檔案館建設發(fā)展的難題。此外,“數(shù)字檔案館的建設和運行需要解決一些特殊問題,為此必須開發(fā)應用一系列新技術,如:身份認定、智能檢索、信息隱蔽、數(shù)字水印、電子簽章、操作跟蹤、信息加密等,其中有很多技術有創(chuàng)新性”。[11]這些技術也都是不容易解決的問題。
5.3技術過時問題。在飛速發(fā)展的IT業(yè)中,電腦硬件、操作系統(tǒng)、應用軟件及存儲載體等不斷地被新產(chǎn)品所替代,IT產(chǎn)品是真正的“短命鬼”。雖然絕大多數(shù)新產(chǎn)品承諾向下兼容,但其兼容的“代”數(shù)在跨越若干年后,舊的數(shù)字信息就很難被新的硬件設備和軟件系統(tǒng)讀出。“技術過時”的陰影一直會籠罩著數(shù)字信息。專家們提出的解決方案是數(shù)據(jù)遷移,但遷移卻存在著一個致命弱點,就是每次遷移總會丟失一定的相關信息,這些丟失的信息積累起來會造成數(shù)字檔案信息無法準確恢復原貌。
6數(shù)字檔案館建設的標準化問題
數(shù)字檔案館建設的目的是要使地區(qū)檔案館、全國檔案館乃至全世界的檔案館連成一個整體,以實現(xiàn)檔案信息資源共享。這個整體性的數(shù)字檔案館事實上是一種基于網(wǎng)絡環(huán)境下的數(shù)字化檔案信息資源共享的社會檔案館系統(tǒng),是一個面向?qū)ο蟮姆植际降木W(wǎng)狀結(jié)構模式,是由一個個相對獨立的數(shù)字檔案館實體組成的。要對這分散在各地的數(shù)字檔案信息資源進行組織控制,就必須要有彼此兼容的硬件環(huán)境,要有一致的文件格式、統(tǒng)一的著錄標引標準、數(shù)據(jù)描述標準、元數(shù)據(jù)標準、全文數(shù)據(jù)庫標準等等,這些標準也僅僅是幾個主要的標準。“而實際上,在數(shù)字檔案館建設中,標準化是一個體系,是一個系統(tǒng),因此對于我們來說,如何結(jié)合我國實際,迅速建立起一個適合我國數(shù)字檔案館建設的標準化體系是擺在我們面前的一個迫切需要解決的新問題”。[12]然而,要解決這個問題并不容易,我們面臨著很多問題:其一,一個嚴峻的事實是我國檔案信息系統(tǒng)沒有相應的具體標準可遵循;其二,有些標準規(guī)范要超出檔案工作的范圍,如綜合數(shù)據(jù)處理格式就需滿足跨行業(yè)、跨部門的要求。如何統(tǒng)一是一個很麻煩的問題;其三,與整個檔案工作的標準相銜接的問題;其四,與國際通用標準的接軌問題;其五,由于計算機技術更新速度非??欤看渭夹g設備的更新,都會對原標準產(chǎn)生相應的影響,因而必須不斷適時修訂標準。
7數(shù)字檔案館建設的投入與產(chǎn)出問題
數(shù)字檔案館建設存在著投入與產(chǎn)出不協(xié)調(diào)的問題。如果我們把數(shù)字檔案館與數(shù)字圖書館作比較,會對這個問題看得更清楚。數(shù)字檔案館建設投入的費用是巨大的,而且它的建設費用要遠遠高于數(shù)字圖書館的建設費用。由于圖書有復本,許多圖書館保存的圖書都一樣。因而國家圖書館和省市圖書館的部分圖書數(shù)字化后,其他圖書館特別是中小型圖書館完全可以坐享其成,不必再花費資金重復建設。而檔案館則不行,全國各個檔案館保存的檔案幾乎都是孤本,因而檔案館在用于檔案數(shù)字化的費用上要比圖書館多,如,僅檔案館進行數(shù)字化檔案目錄的“工作量約是圖書館的35倍”。[13]但是檔案館的利用人次與圖書館讀者的人數(shù)相比卻少得多,“以北京市檔案館和國家圖書館(原北京圖書館)為例,前者年利用人次約四五千人,后者一年的讀者數(shù)不少于二百萬人”。[14]兩者相差400倍。“即使一、二史館和中央檔案館三個國家檔案館的年平均利用人次也不過5960人次”,[15]三個館加起來與國家圖書館相比仍相差100多倍。檔案館的利用長期處于低谷已是不爭的事實,就是建成數(shù)字檔案館后,這種情況也不會改變多少,因為檔案信息有保密和時效的限制,有利用者的限制,并不會增加太多的利用者,更不可能趕上數(shù)字圖書館的讀者人數(shù)。事實上,傳統(tǒng)檔案館本來就存在著投入與產(chǎn)出不協(xié)調(diào)的問題,只不過未引起人們的關注,但是,數(shù)字檔案館的建設卻拉大了這種不協(xié)調(diào)的距離,使這個問題凸現(xiàn)出來。它也成為擺在數(shù)字檔案館建設面前很難解決的問題。
8數(shù)字檔案中的經(jīng)濟問題
與其說數(shù)字檔案館是高新技術支撐起來的,不如更實際地說是由巨額資金支撐起來的,因為所有的高新技術和設備都將由資金來兌現(xiàn)。數(shù)字檔案館的建設與利用,不論對于檔案部門還是利用者,都有很重的經(jīng)濟負擔,經(jīng)濟問題可能是困擾數(shù)字檔案館建設的根本性難題之一。
8.1檔案部門方面的問題。
8.1.1數(shù)字檔案館建設的費用問題。數(shù)字檔案館的建設費用是巨大的,開發(fā)一個稍具規(guī)模的數(shù)字檔案館系統(tǒng),不論是購買軟件和硬件,還是開發(fā)專用軟件,還是館藏檔案的數(shù)字化工作,都需要花費可觀的人力、財力和時間,這些都需要有強大的經(jīng)濟實力做后盾。而數(shù)字檔案館的建設說到底,仍是以政府投入為主。但國家的綜合國力不可能在短期內(nèi)發(fā)展到較高的水平。因此,資金短缺是建設數(shù)字檔案館的最不好解決的難題。檔案館是公益性和社會性的部門,也不能走“以文養(yǎng)文”、“以館建館”之路,即便是想走此路也走不通,正如上文所述的數(shù)字檔案館存在著投入與產(chǎn)出的巨大反差,即使對利用者收費,數(shù)字檔案館也根本不可能收回投資成本。數(shù)字檔案館建設的巨額費用對于本來就經(jīng)費緊張的檔案部門來說是有相當難度的。而對中西部欠發(fā)達地區(qū)的大部分市、縣檔案館來說,連維持日常工作的經(jīng)費都成問題,建設數(shù)字檔案館恐怕在相當長的時間內(nèi)都是可望而不可及的。
8.1.2數(shù)字檔案館的使用和維護費用問題。雖然數(shù)字檔案館的建設費用巨大,但它并不是一勞永逸的。它的維護和使用的費用并不少于初建的費用。數(shù)字檔案館就像一個“無底洞”,需要不斷地投入大量資金來維持其正常運轉(zhuǎn)。
8.1.2.1平時正常的使用和維護費用。數(shù)字檔案館是靠技術支撐起來的,平時正常的使用和維護也需要很大一筆資金才能維持,如通信費、數(shù)據(jù)使用費和設備維護費等都需要不斷地支出,且費用不低。
8.1.2.2設備更新費用?,F(xiàn)代信息處理技術發(fā)展迅猛,其軟硬件更新非常快,而在市場經(jīng)濟利益的強大動因驅(qū)使下,更加快了這種更新速度,“錄制、存貯信息的設備、方法及軟件隨著新產(chǎn)品、新方法的問世,正以5-9年的周期更新,新產(chǎn)品、新方法的不斷問世,必將導致原有設備及軟件的淘汰”[16]。數(shù)字檔案館要維持正常使用,也必須不斷地更新設備和軟件,但要更新設備和軟件,卻又要花費大量的資金,而且是每隔幾年就要又投入一次。
8.1.2.3數(shù)字檔案信息長期存取使用的費用。正如上文所述數(shù)字檔案信息長期存取是數(shù)字檔案館的一個具體而棘手的難題。而數(shù)字檔案館又必須使用數(shù)字檔案信息,專家們給出了一個不得已而為之的方案,就是不斷地使數(shù)字檔案信息遷移轉(zhuǎn)錄。但是遷移轉(zhuǎn)錄的費用是相當可觀的和不可預知的。一般檔案館能否承受這不斷遷移轉(zhuǎn)錄所需的費用,也是一個既不可預見又不容易解決的難題。
8.1.3向利用者收取數(shù)字檔案信息利用費的問題。檔案法規(guī)規(guī)定檔案館向社會提供利用檔案,可以收取費用。數(shù)字檔案館建設投資大,收取一定的費用也是應該的。但是,如何制定收取利用費的收費制度,如標準、數(shù)量、繳納程序等,也是數(shù)字檔案館建設的難題之一。
8.2利用者方面的問題。利用者的經(jīng)濟承受能力,也是影響和制約.數(shù)字檔案館建設發(fā)展的問題之一。數(shù)字檔案館需上網(wǎng)閱覽,從目前我國上網(wǎng)所需資費來看,每小時的費用是發(fā)達國家的10多倍,而用戶的平均收入又低于發(fā)達國家的若干倍。我國80-90%的用戶認為網(wǎng)絡收費過高,通信費難以承受。再一點是下載檔案信息的打印費用,盡管并不是要將所有下載的檔案信息打印出來,就是部分打印也需要承受可觀的打印費。如果再加上數(shù)字檔案信息使用費,這些費用加在一起,將會相當高。必將影響利用者對數(shù)字檔案館的使用,也將使數(shù)字檔案館的建設失去應有的作用和意義;
9數(shù)字檔案館法律法規(guī)方面的問題
數(shù)字檔案館建設中會涉及到許多法律問題,而這些法律問題恰恰又是亟待解決而又難以一時解決的問題。
9.1檔案法規(guī)方面的問題。面對數(shù)字檔案館產(chǎn)生的新情況、新特點.檔案法規(guī)中的一些內(nèi)容已不適應,而要解決起來仍有一定的難度。如對利用者的身份認證問題,在網(wǎng)上進行借閱限定和身份認證不僅增加技術難度,而且還要增加開支。而對外國利用者來說,由于限制得更嚴格,在網(wǎng)上操作更加困難。數(shù)字檔案館是開放的,是不受國界限制的,數(shù)字檔案館建設的初衷就是實現(xiàn)檔案信息的社會共享。但如果取消身份認證,那么就等于中外利用者都一樣沒有限制。因此,真要修改完善檔案法規(guī),兼顧到方方面面,還是有相當?shù)碾y度。
9.2著作權、知識產(chǎn)權、隱私權的保護問題。在數(shù)字檔案館的環(huán)境下,由于檔案信息通過網(wǎng)絡進行傳遞,它極容易被獲取、被復制、被傳播,對利用者控制的難度加大。原來意義上的著作權、知識產(chǎn)權、隱私權的保護方式對權利人已無法提供有效的保護,著作權、知識產(chǎn)權和隱私權很容易被侵犯。因此,如何對檔案著作權、知識產(chǎn)權和隱私權進行有效保護成為數(shù)字檔案館建設面臨的一大挑戰(zhàn)。從技術上說,真正切實可行的保護技術,目前尚屬于極其薄弱的環(huán)節(jié)。從完善相應法律法規(guī)方面說,目前進展緩慢,尚有許多難題不易解決。
9.3數(shù)字檔案的法律效用問題。對于數(shù)字檔案的法律效用問題,它是數(shù)字檔案館建設中一個不能回避的特殊難題。要想讓它得到法律的認可,恐怕還需要相當長的時間。而“如果電子檔案的法律憑證問題得不到解決,數(shù)字檔案館的數(shù)字化館藏也就失去了利用的價值、存在的意義”。[17]
10數(shù)字檔案館的基礎理論問題
數(shù)字檔案館的建設必然要受到數(shù)字檔案館理論研究的影響和指導。目前,對數(shù)字檔案館的研究還處于起步階段,許多認識不相同,統(tǒng)一尚需時日。而且有關數(shù)字檔案館的一些基礎理論問題,都是一些不易解決的難題。
10.1數(shù)字檔案館的概念問題。自從數(shù)字檔案館概念出現(xiàn)以來,“關于數(shù)字檔案館的認識并不統(tǒng)一,其定義就有數(shù)十種之多,勢必會造成對數(shù)字檔案館建設方向把握上的不一致”。[18]觀點不一樣,建設的數(shù)字檔案館就不一樣,建設的難易程度、工作流程、服務功能、配套措施、系統(tǒng)邊界和社會影響等等也都會截然不同”。[19]而統(tǒng)一認識或基本統(tǒng)一認識都非一日之功。但這個問題不解決,將對數(shù)字檔案館的實踐產(chǎn)生不利影響。
10.2數(shù)字檔案館的系統(tǒng)邊界問題?!皵?shù)字檔案館支持以網(wǎng)絡連接的相關檔案部門的數(shù)字化館藏,能夠提供分布于不同地區(qū)的檔案信息。然而信息網(wǎng)絡的一個重要特征就是鏈接,這種在技術上可以無限鏈接的情況下,就涉及到了系統(tǒng)的邊界問題”。[20]數(shù)字檔案館系統(tǒng)邊界的界定決定著數(shù)字檔案館所擁有的功能特性。同時也決定著數(shù)字檔案信息在信息中的地位。然而,“在圖書館情報學界,人們討論數(shù)字化圖書館時有種傾向,認為因特網(wǎng)就是一個數(shù)字圖書館,任何人都可以到這個無所不包的圖書館中查閱文獻、學習知識、合作交流甚至著書立說。這就把數(shù)字圖書館的地址空間和信息資源空間定位很廣,其系統(tǒng)邊界也無所不包。它不僅包括了書目文獻管理、信息網(wǎng)絡信息資源的組織與作用,甚至包括檔案館和博物館的信息內(nèi)容,因此建設規(guī)模異常龐大”。[21]數(shù)字圖書館的這種“擴張”,使本來就處于“弱勢”地位的檔案信息的地位更加岌岌可危,如果不對數(shù)字檔案館的系統(tǒng)邊界給以恰當?shù)慕缍?,并采取相應的技術措施,那么,在不久的將來,數(shù)字檔案館將會消失在數(shù)字圖書館的海洋里,成為數(shù)字圖書館的一部分。
10.3數(shù)字檔案的概念問題。數(shù)字檔案是數(shù)字檔案館生存的基礎。但是目前對數(shù)字檔案概念的認識卻并不統(tǒng)一和清晰。其一,對數(shù)字檔案概念的研究并未引起檔案界太多的關注;其二,一些對數(shù)字檔案概念的認識,大部分都是以傳統(tǒng)的檔案概念為基礎的,仍舊把數(shù)字檔案當作電子文件的轉(zhuǎn)化物來認識,無非是傳統(tǒng)檔案概念在數(shù)字時代的翻版。這里暫不說傳統(tǒng)的以文件為屬概念的檔案概念本身就有許多可商榷的地方。單說在數(shù)字信息時代文件的概念、檔案概念和其他信息的概念都會受到影響而發(fā)生變化,它們之間有互相融合的趨勢。如何區(qū)分它們將變得越來越困難。在數(shù)字時代的信息網(wǎng)絡環(huán)境下,數(shù)字文件、數(shù)字檔案、數(shù)字圖書、數(shù)字情報、數(shù)字資料、數(shù)字文獻籌有什么不同?如何區(qū)分它們?如果不能把數(shù)字檔案從這些其他數(shù)字信息中區(qū)分出來,那么數(shù)字檔案的概念的存在就將走向消亡,而在數(shù)字檔案概念基礎上建立起來的數(shù)字館大廈也將隨之傾覆。因此,必須把數(shù)字檔案概念從其他數(shù)字信息中區(qū)別出來,數(shù)字檔案館才能生存。但這是一道擺在我們面前的并不容易找到答案的難題。
【參考文獻】
1閻會勤.新世紀檔案工作展望.檔案學通訊,2001;6
23景紅.電子檔案憑證價值探析.檔案與建設,2000;10
456李玉安.數(shù)字圖書館建設的十大難題.圖書館學刊,2002;3,
7徐義全.電子文件的特性與長期保存.檔案學研究,2000;1
8吳志宏.數(shù)字化檔案的隱憂:數(shù)據(jù)失真.北京檔案,2002;12
9譚zhēng@①培,數(shù)字檔案館論綱.檔案學研究,2001;5
1016范開宏.數(shù)字圖書館之憂思.圖書與情報,2002;1
11邱曉威.數(shù)字檔案館及其建設模式.中國檔案,2001;10
12段榮婷.我國數(shù)字檔案館的研究與建設.中國檔案,2002;6
13劉東斌.數(shù)字檔案館與數(shù)字圖書館的比較研究.檔案管理,2003;2
14求實.檔案館與圖書館利用對比分析及對策.北京檔案,1999;9
15國家檔案局綜合科教司.從統(tǒng)計數(shù)字看1991年度全國檔案事業(yè)的發(fā)展狀況.檔案學研究,1993;1
17譚zhēng@①培.數(shù)字檔案館建設面臨的問題及其對策.浙江檔案,2002;3
18朱蒙生.傳統(tǒng)檔案館向數(shù)字檔案館跨越所面臨的問題.中國檔案,2003;3
1.檔案保管方式不同。傳統(tǒng)的項目圖紙等實物檔案,按照卷冊號有序地存放于庫房的檔案排架上,依照檔案庫的防火、防霉、防盜等規(guī)定進行保管。數(shù)字檔案的安全保管建立在數(shù)據(jù)中心的系統(tǒng)安全管理、設備操作管理、訪問權限管理、數(shù)據(jù)備份管理等一系列的安全管理措施之上,側(cè)重于防病毒、防攻擊、防災害等數(shù)據(jù)安全管理,其安全性明顯高于傳統(tǒng)檔案。
2.檔案利用方式不同。傳統(tǒng)檔案利用需要設計人員親自到檔案館借閱,且受限于實體檔案的數(shù)量、檔案的借閱情況、檔案館的開館時間等,利用率較低。數(shù)字檔案充分利用網(wǎng)絡數(shù)據(jù)傳輸?shù)谋憬菪院蛯崟r性,隨時為用戶提供瀏覽或下載檔案服務。數(shù)字檔案的使用率遠遠高于紙質(zhì)檔案,使檔案充分發(fā)揮出其自身的價值。但是,數(shù)字檔案的頻繁訪問也對檔案系統(tǒng)的健壯性、數(shù)據(jù)結(jié)構的合理性、檔案編研的科學性,提出了更高的要求。
二、在電力工程設計中加強數(shù)字檔案管理的對策
1.加強檔案管理業(yè)務平臺建設。檔案管理服務于電力工程設計工作,所以,數(shù)字檔案管理平臺不是孤立的,而是與協(xié)同設計平臺集成于同一工作平臺。電力設計院的設計人員與檔案管理人員,都使用該平臺進行設計和檔案管理等工作,并通過該平臺實時在線溝通。在協(xié)同設計平臺上設計完成的電力工程,其電子檔案基于網(wǎng)絡審核合格后,由檔案管理人員負責接收、整理和網(wǎng)上歸檔。應用檔案管理業(yè)務平臺實現(xiàn)在線檔案收集,保證了電子文檔的真實性、及時性和有效性,并能定期對電子文檔進行版本更新,極大地提高了工作效率。
2.構建各類檔案信息庫。檔案數(shù)字化是一項細致而繁瑣的工作,底圖和文書檔案需進行掃描,聲像檔案可采用錄像轉(zhuǎn)視頻文件、照片生成電子圖片等方式,集中進行數(shù)字化處理。工程檔案采用大流水工作方式數(shù)字化后,需進一步進行網(wǎng)上編目,自動生成流水號、文檔掛接等工作,構建各類檔案信息庫。檔案管理平臺具有電子檔案密級和權限劃分功能,可以根據(jù)密級和權限劃分規(guī)則,對全部電子檔案進行密級和權限劃分,從而實現(xiàn)了檔案信息庫的自動安全管理。