1引言
毫无疑问,数字档案馆建设正在由数年前仅见于报章的“前沿概念”逐渐成为我们日常工作的一部分,从馆藏数字化到室藏数字化,从目录数字化到全文数字化,从单机客户端到网络化平台,从流式电子文档到版式电子文件,这一切的改变发生在短短的几年内,而更加深刻的变革,正在逐渐酝酿。
传统档案馆建设、档案管理的对象是实体的档案卷宗,因此产生了一套与之相适应的工作方法,这套工作方法在新形势、新问题面前,其科学性、合理性必须接受重新检讨,根据地方实际情况,制定有针对性的策略,妥善开展数字档案馆建设,稳步实现档案管理工作的现代化转型,最终把档案工作三个体系建设水平提升到一个新的水平。
本文将以地级市档案局(馆)的视角,对建设一个中等规模的数字档案馆进行审视,提出一些在实践过程中总结得出的工作策略,为计划开展同类工作的单位提供决策参考,不足之处也恳请各位同仁斧正。
2数字档案馆建设规划的一些参考指标
一个数字档案馆的建设规划,可以使用一些指标进行量化参考,帮助我们选择恰当的策略来实施数字档案馆建设工作。
2.1指标(1)馆藏量
数字档案馆建设的基础是实体馆藏,馆藏量的大小直接决定数字档案馆的建设规模。必须注意的是,因为工作需求的不同,实体档案管理和统计的计量单位多为卷、盒、件等,在数字档案馆建设过程中,这些计量单位无法直接为工作服务,需要转换到页或者幅面进行计算,这两者之间的关系,需要针对自身馆藏,科学抽取样本进行统计。此外值得一提的是,馆藏量的估算不仅需要统计现有馆藏,还需要有预见性的估算未来至少3到5年的移交进馆档案数量,为后期工作留有余地。
2.2指标(2)立档单位/进馆单位数及室藏量
显而易见的是,本指标直接影响到数字档案馆建设过程中各个子项内容的规模大小,除了在上个指标中提到的未来接收进馆档案数量外,还有业务网结构设计、系统软硬件选型、网络带宽容量设计、业务系统用户数量、存储系统冗余量设计等等。
2.3指标(3)数据量
数据是数字档案馆的“馆藏”,数据量也就是数字档案馆最核心的“馆藏量”,这个“馆藏量”与实体档案的馆藏量息息相关,根据核心指标,已经能大致估算现有档案总量(页),在此基础上,根据自身采取的数字化加工方案实际情况,可以简单推算出对应的数据总量。以采取彩色模式300DPI分辨率扫描单页JPG图像,合成双层PDF,带上对应目录数据后一并移交为例,每100万页A4幅面档案将占用大约1.5T磁盘空间。其他方案或其它载体档案数字化产生的数据量,应当抽取样本进行实测后代入计算。
同时,数字档案馆建设必须考虑长期可持续发展,以此为指导思想,应当请求相关业务处室合作,根据当前进馆单位室藏量、往期和未来移交接收计划安排,计算出预期数据增长率,在软硬件建设时,保证具有符合实际需求的冗余空间和扩展能力。
另外,备份产生的数据量也要有预见性的进行估算,有效实行档案数据多套异质保存,确保档案数据万无一失。
2.4指标(4)存储设备需求量
作为需求方,我们直接面对的一个问题就是“存放这么多数据,需要多少设备?”根据上一个指标“数据量”,我们能根据直观的计算得到一个数值,而这个数值,将指导我们确定“存储设备需求量”。
根据不同量级和管理的需求,大致有机内直连、机外直连、网络存储等几种方案,同时需要明确的是,不论采用何种方案,由于安全保障等需要,我们并不能百分之百使用这些存储设备的标称容量(裸容量),而可用容量占裸容量的比例,随着不同条件而变化。比如使用机内直连方案,使用5块300G硬盘组建RAID5作为存储,那么这个方案的裸容量是5×300G=1500G,可用容量就是(5-1)×300G=1200G,比例为1200G/1500G×100%=80%;但如果再使用其中一块作为热备盘,那这个比例就变成了[(4-1)×300G/5×300G]×100%=60%。总体来说,使用的硬盘越多,这个比例会呈现提高的趋势,但并不绝对。
3一些具体策略
3.1基础设施建设策略
3.1.1场所和业务建设策略
以国家综合档案馆为基础开展的数字档案馆建设是无法脱离于实体馆舍的,在建设数字档案馆的过程中,为了满足数字档案馆建设带来的大量信息化设备运行与维护的需求,应当通过各种手段建设或者具备一系列符合要求的场所,这其中包括标准化的服务器机房,满足业务需求的网络出口,用于开展具体信息化管理的办公用房,适合于开展档案全文数字化的工作室等等。
另外,在建设过程中,要避免片面的强调“数字化”而忽视了传统业务的同步建设。数字档案的根基深深植于实体档案之中,什么样的土壤就会结出什么样的果实,存在于档案实体和档案管理中的种种问题,最终都会在进行档案数字化时暴露出来。所以,数字档案馆建设不是几个人或者一个部门的事,而是提供了一个能全面推进档案管理水平的绝好机会,充分认识到这一点,数字档案馆建设工作才能真正起到实效。
3.1.2硬件设备建设
硬件设备主要有服务器、交换机、储存设备、档案数字加工设备、数码照相机、摄像机、扫描仪、光盘记录设备、安全保密设备等硬件设施建设。在此类工作中,涉及到各种设备的选型采购,作为档案行业来说,要避免过渡追新、追强。相对于很多企业级应用来说,档案行业的数据调阅、检索、响应速度要求和数据量都属于一个中小型数据库的范畴,其各项指标要求都比较低,所以很多情况下,于其购置性能数据“漂亮”的服务器,不如添置存储设备或者购置一些设备和数据的保全服务,更好的履行国家综合档案馆为党管党,为国守史的职能。
3.1.3网络建设
在条件成熟的前提下,全面实现档案业务的在线化是数字档案馆建设的一个重要内容。而何谓之条件成熟呢?条件成熟即指在当地具备了一套能提供绝大多数立档单位接入的安全网络,这条网络从逻辑甚至是物理层面,必须隔断与因特网的连接,以最根本的手段阻止档案数据泄漏。若自行开展相关建设的,要合理规划网络布局,交换设备有专人负责维护,严格控制网络出口节点的安全设施建设,同时可以邀请同级保密工作管理机构和信息安全管理机构帮助提升网络安全性能。
3.1.4长期运维
运行维护工作是数字档案馆长期稳定运行的唯一保障,作为档案部门,完全依靠自身力量承担所有运维工作在很多时候是具有一定困难的,那么首选的策略就应当充分借助社会力量,与一些第三方服务机构进行合作,定期对各种信息化设备进行状态检测、性能调优,在发生紧急状况时,能及时开展应急,得到专业力量的技术支撑。
3.2数字档案馆业务系统建设策略
3.2.1充分调研,规划先行
数字档案馆内涵丰富,功能众多,而落地到各个地区,又产生更多的个性化需求,因此从整体来看,一个数字档案馆业务系统其实并不是一个系统,而是由多个系统协作产生的一个有机整体。
事先进行调研的重要性不言而喻,在数字档案馆业务系统建设之前的调研工作中,不仅要重视听取今后各用户单位的需求,还要全面收集相关标准、规范性文件、办法等等材料,有必要时要对旧有的规章制度进行重新修订,借助信息化的机会推动档案管理工作的进一步规范化。
作为普通用户,受限于其所处的位置,往往只能看到数字档案馆整体的一部分,提出的功能需求很可能不具有普遍意义,而且很可能会轻视相关工作的难度和工作量,但作为一个规划者,必须具纵览全局,具备全盘意识,合理规划整套业务系统的功能需求,优先推动核心功能的开发。
3.2.2不宜追求一步到位
数字档案馆建设不同于建造新馆舍,新馆舍在合理规划的前提下可以追求一次性投入,永久享受其成果,而数字档案馆建设往往由于投资数额、项目周期等因素限制,规模相对较小,在这种情况下,要摆脱传统的一步到位思想,从基础做起,搭建数字档案馆核心骨架,打通档案馆室信息通路,为后续建设铺平道路。
换一个角度来看,数字档案馆是顺应信息化潮流而产生的新生事物,但凡新生事物,其内涵和外延都是在不断变化之中的,在如此一个充满新概念的创新型建设工作中追求一步到位,其本身也是不科学和不合理的。
3.2.3分步实施,配套发展
数字档案馆建设必然涉及馆藏档案的数字化转换,这个数字化转换的进度规划直接取决于政府投资预算的划拨,而其工作内容相对简单,周期相对固定,较少受到外界各种因素的影响,因此可以作为整个数字档案馆体系建设的一个参考,以此为尺度,分步开展软件功能开发,配套落实硬件设施的添置,这样在数字化工作开展之处就能提供最基础的档案查询利用服务,在随后的各个阶段内,逐步丰富系统功能,最终提供更为多样更能满足利用需求的档案信息化服务。
3.3数字档案存储策略
3.3.1单级存储策略
所有数据都存储在数据服务器的本地磁盘上,采取直连方式连接磁盘和服务器。这种方式的好处是数据访问速度快,维护简单,缺点是存储的数据相对有限、单位容量价格较高。当存储数据量超过存储设备的存储容量限制时,需要增加本地磁盘的容量来解决,投入的资金较大。在数字档案馆建设的起步阶段,这种策略适合于绝大部分应用环境。
3.3.2分级存储策略
所谓分级存储,就是根据数据的重要性、访问频次等指标分别将其存储在不同性能的存储设备上,采取不同的存储方式。这样一方面可大大减少非重要性数据在本地磁盘所占用的空间,降低了单位存储空间价格,但带来的缺点是需要一套或多套系统来管理存储设备,维护难度较高。
在具有条件的档案馆中,应当优先采取这种策略来搭建存储系统,在一个典型的分级存储系统中,一般分为在线(On-line)存储、近线(Near-line)存储和离线(Off-line)存储三级存储方式。
在线存储是将数据存放在高速的磁盘系统上,适合存储那些需要经常和快速访问的程序和文件,其存取速度快,性能好,存储价格相对昂贵。在线存储是工作级的存储,其最大特征是存储设备和所存储的数据时刻保持“在线”状态,可以随时读取和修改,以满足前端应用服务器或数据库对数据访问的速度要求,通俗的说,档案馆的业务系统和数据库应当部署在在线存储这一级,满足时刻发起的档案目录数据查询需求。
近线存储是将数据存放在低速的磁盘系统上,一般是一些存取速度和价格介于高速磁盘与磁带之间的低端磁盘设备,其特点是寻址迅速、成本相对低廉。在档案业务系统中,大量的档案数据全文数据挂接在目录数据上,需要大量空间来存储,检索海量目录数据请求时刻在发起,而调阅单份全文数据的请求数量与检索目录的请求数量相较却低很多,属于并不是经常用到或者说访问量并不大的数据,所以,这种应用需求与近线存储的应用定位非常契合。由于成本的相对低廉,在同等投入规模条件下,近线存储能获得更多的可用存储空间。近线存储设备主要有SATA磁盘阵列、DVD-RAM光盘塔和光盘库等设备。
离线存储则指将数据备份到磁带或磁带库上。大多数情况下主要用于对在线存储或近线存储的数据进行备份,以防范可能发生的数据灾难,因此又称备份级存储。离线存储通常采用磁带作为存储介质,其访问速度低,但价格更加低廉。
3.4数字档案馆安全策略
我们要建立过硬的安全防护体系作为保障,从管理手段和技术手段两个方面在档案信息利用的每一个环节上杜绝风险和漏洞。
从管理手段这个方面来看,一是健全各项安全保密制度,明确责任,转变应付检查的思想态度,建立长效管理机制,做到安全管理无死角;二是积极配合相关部门,开展各类安全管理实务,例如开展重要信息系统等级保护相关工作、开展信息系统风险评估工作、开展档案信息系统开发和数字化加工备案工作等等;三是在资源配置上持续投入,添配相关设施设备,规避安全风险,封堵安全漏洞。
从技术手段来看,一是网络系统的安全防护,网络系统安全要保障和支撑所有系统的正常运行,主要包括网络布线、网络对接、设备的配备与选型等各个环节的安全;二是数据存储的安全策略,主要是指数字档案资料存储的安全问题,其中包括操作系统、数据库管理系统、档案业务系统、档案数据的安全;三是应用过程中的安全策略,主要是指在业务系统中严格定义用户角色,防止存在不合理权限,确保系统的使用权在规则内行使;四是非法程序、非法访问和非法移动存储设备的安全策略,配置硬件防火墙、安装杀毒软件、对授权客户端进行MAC绑定或者采取密钥进行身份认证以及采取技术手段阻止非法移动存储设备的使用是防止各种网络事故,保护计算机网络正常运行的主要手段。
3.5数字档案馆可持续发展策略
档案馆,从来不是一个孤立的部门。在传统档案工作中,档案的形成在馆外,经过档案馆的整理接收,形成了众多特色鲜明的档案资源总库,其门类也由最初的文书档案不断拓展,覆盖到了群众民生的各个方面;档案馆的指导的范围不断延伸,全面服务社会事业管理、地方经济建设的方方面面;社会广大公众在生产生活中通过档案馆这个媒介,利用获取的档案资源产生了多方面的效益;这已经说明了即使在传统档案馆的层面上,档案工作已经在无形间形成了一个不断自我完善,不断进化的生态系统。
基于实体档案馆建立起来的数字档案馆毫无疑问的必须继承这一特性,在规划之初就必须把数字档案馆中的数字档案从形成到管理再到利用的相关环节和涉及部门作为一个整体进行分析研究,制定相应策略不断促进这个生态系统的自我完善与提升。在此过程中,我们有必要借用“生态学”的一些基本理论,帮助我们在寻求数字档案馆可持续发展的道路上走的更远。
数字档案馆可持续发展策略研究的主体根据其在整个系统中承担的功能和扮演角色的不同可以分为三大类:档案形成者、档案管理者和档案利用者。而这三个主体之间的沟通、运作方式直接决定了一个数字档案馆的生存与发展的形态。
档案形成者,根据《中华人民共和国档案法》中的定义,“档案”是指过去和现在的国家机构、社会组织以及个人从事政治、军事、经济、科学、技术、文化、宗教等活动直接形成的对国家和社会有保存价值的各种文字、图表、声像等不同形式的历史记录。从这个定义中我们可以发现,档案概念的内涵非常丰富,而且其对应的形成者类型结构十分庞杂,覆盖了各种规模国家机构和社会组织或单独的个体。由于档案形成者之间的千差万别,其形成的档案数量和种类也大不相同。与此同时,虽然档案形成者不直接参与数字档案馆的管理和运作,但是他们是整个数字档案馆生态系统建设的基石,其在档案意识、职业道德、教育水平、技术手段、工作习惯上等要素存在的差异,直接影响了实体档案整理的形式和质量,而脱胎于实体档案的数字档案同样受其制约。所以在数字档案馆的建设过程中,一方面对档案形成者在以上几个要素提出了更高的要求,另一方面要求数字档案馆在管理手段、管理方法和服务方式上具备更强的业务能力,将各类档案按照对应的规范进行标准化管理并提供利用。
档案管理者是指所有涉及数字档案馆工作的档案工作人员。档案管理者在数字档案馆建设中发挥着重要的作用,主要表现在四个方面:第一、制定数字档案馆的发展目标和计划。档案管理者根据内外部环境的变化,作出适当的反应和判断,制定出适合数字档案馆发展的政策和策略。第二、组织和管理数字档案馆。具体包括数字档案馆软硬件等基础设施建设,对档案信息进行组织,整合和处理,保存和管理有价值的档案信息资源,为社会提供高效优质的档案信息服务等。第三、建立和完善数字档案馆的组织文化。档案管理者为数字档案馆创造共同的文化和价值观念,沟通组织目标,树立良好的服务理念。第四、监督和控制数字档案馆运作过程,具体包括对档案工作进行监督、评价馆藏数字资源,判定数字档案馆是否朝着既定的目标健康地向前发展并在必要时及时采取矫正措施等。
在数字档案馆生态系统中,档案管理者需要通过科学的管理,有效地组织、充分挖掘和发挥各个主体的功能,使数字档案馆的资源配置最优化,从而使数字档案馆适应社会快速发展的需求。
档案利用者是指在政治、经济、科技、文化、管理及其他各种活动中需要利用档案的个人和团体。档案利用者的类型、特征、需求、素质、心理和利用行为等都是制约数字档案馆功效和作用发挥的重要因素。档案利用者所处的地理位置、学历、年龄、从事的职业、利用档案信息的能力、对技术手段掌握的熟练程度等差异,都会构成对数字档案馆认识和利用行为的独特需求。档案利用者是数字档案馆存在和发展的根本所在,是数字档案馆服务的对象。
通过具体分析数字档案馆生态中的三个主体角色,我们可以看到数字档案馆在其中扮演了类似传统实体档案馆的角色,那么是否就代表能够套用经典的档案工作模式呢?在信息化、数字化的工作环境下,我们首先可以重新罗列这三个主体各自所具体承担的工作内容,再于传统模式下的内容进行比对。
|
传统档案馆
|
数字档案馆
|
档案形成者
|
收集
整理
编目
|
收集
整理
编目
目录数字化
全文数字化
设备维护
信息安全保障
|
档案管理者
|
接收
保管
提供利用
管理(鉴定、统计)
挖掘
馆舍维护
|
接收
保管
提供利用
管理(鉴定、统计)
挖掘
设备维护
信息安全保障
|
档案利用者
|
依法利用档案资源
|
依法利用档案信息资源
|
经过比对,可以看到经过数字档案馆建设,档案形成者和档案管理者的工作内容都有所增加,两者相较,又以档案形成者为甚。从一个地级市市级档案馆的视角来看,一般是市级机关、团体、企事业单位的档案员作为本级的档案形成者,这个群体中有少部分为专职档案员,大部分为兼职档案员,具有承担事务多、年龄层次两极分化、业务水平参差不齐的特征。如前文所述,虽然档案形成者不直接参与数字档案馆的建设和管理,但却直接影响了其产生的数字档案质量。这些档案形成者在原有档案工作要求下已经显疲态,在此基础上再次增加大量的档案数字化工作,将显著削弱整个数字档案馆生态的稳健程度。
而作为档案管理者,数字档案馆作为依附在实体档案馆上的虚拟机构,很难因此而获得地方政府给予额外的足量人力、物力和财力支持,在数字档案馆建设之初面对海量的馆藏档案和陆续移交进馆的各批次档案数字化、面对数字档案馆软硬件系统建设等工作时,很可能会产生心有余而力不足的情况。
结合以上两点,似乎数字档案馆的建设给档案生成者和档案管理者双方都带来困境,是否这条路就走不通呢?这个理想中的数字档案馆生态是否是不合理的呢?
汪洋中的浩瀚海水是如何化作雨水降落内陆的呢?是云,在蒸发、凝结和风的作用下,水分被从海洋搬运到内陆。在这个简单的生态模型中,太阳、云和风作为主要中介,实现了水资源的“加工”和“调度”。回到上文所提出的困境,完全可以借鉴这种思路,在档案形成者和档案管理者直接再加入一环,建设一支技术队伍或者一个机构,承担大部分由数字档案馆建设带来的专业工作,把存于档案室的实体档案按照档案馆的要求进行整理、加工,转换成符合规范标准的数字档案,统一向档案馆移交,甚至可以在条件成熟的情况下,承担大部分数字档案馆的软硬件和数据维护工作。
4结语
数字档案馆建设的各方面研究刚刚起步,各地开展的相关实践也多处于相对初级的阶段,关于数字档案馆建设的更多优秀策略,更多的科学思路都需要我们进一步探索和研究。
通讯地址:江苏省常州市新北区龙城大道1280号 常州市档案局
邮 编:213022
联系电话:0519-85681020、051985681019
电子邮箱:cdbhjsc@163.com
|