首页-兰台文丛
请选择字体大小:     
[推荐]电子文件的双重鉴定
  日期:2007-1-23

电子文件的双重鉴定

       ——《拥有新记忆——电子文件管理研究》摘要之三

中国人民大学档案学院  冯惠玲

  
   鉴定工作是电子文件管理中一项十分重要而又颇具难度的业务活动。决定其保存价值的因素与纸质文件有所不同,鉴定工作的思路和内容也需要随之进行相应的调整。
    一.电子文件保存价值的两个支点
   以往的鉴定工作基本上都把着眼点放在对文件内容的分析上,这种鉴定方法的重要前提是,人们可以直接从文件中获得它的价值。而被称为“记录革命”的电子文件因其系统依赖性而打破了人类直接获取文件价值的可能,二者之间出现了一个“中介”——计算机软硬件环境,离开了这个中介,保存下来的“文件价值”就无法为后人所获得。与电子文件保存、识读有关的技术状况是用户一系统一文件之间的链条能否不发生脱节,用户能否随时从文件中获取所需信息的决定性条件。于是,文件的内容难以独立支撑起它的保存价值,还需要一定的技术状态作为保障。
    法国档案学者哈罗尔德·瑙格勒(HaroldNaugler)1984年在其研究报告《机读文件的鉴定》中深入分析电子文件鉴定与传统文件的差异,首次明确提出并系统阐述了电子文件双重鉴定的思想。他认为“机读文件的鉴定包括文件所含信息的鉴定(内容鉴定)和文件技术状况的鉴定(技术分析)”。这一思想在实践上为电子文件的鉴定工作提供了一条新的思路,在理论上为鉴定电子文件的保存价值建立了两个支点——内容的有用性和技术状况,从而引起了各国档案研究人员和实际工作人员极大的关注,这在文件鉴定理论的发展史上是很有创见的。
   毫无疑问,和纸质文件一样,对电子文件的内容需要加以鉴定,以便从难以数计的文件河流中“淘出”经得起历史考验的真正具有价值的“金子”。随着我们对电子文件了解的增多,逐渐发现在电子文件中“淘金、’比纸质文件还困难,还重要,原因在于电子文件的量更大,流向和分布更为复杂。电子文件“制成材料”的物理性能比纸质文件材料要脆弱得多,电子文件中的信息也比纸质文件要易变、易失得多,这就意味着电子文件的有用性对于支持其存在的技术状况的依赖性要大得多,良好的技术状况是电子文件真实、可靠、完整、可读的基础。
   看来,这两个要素对于电子文件的保存价值来说确实缺一不可,这就要求电子文件的鉴定从内容和技术状况两个方面同时展开,并最终将两个方面的鉴定结果联系起来,综合判定电子文件的保存价值。
    二.分析文件价值的宏观思路
   电子文件的内容鉴定可以从纸质文件鉴定的原则、标准、方法中获得很多有益的经验,例如,分析文件重要性的思路,档案保管期限表所规定的各类文件的保管期限等。但是,在电子环境中文件存在的方式、人们获取和使用其中信息的方法等与纸质文件有很大不同,这些特性必然对从内容上判断其保存价值的方法和尺度产生特殊的影响。电子通讯的便利性使人们随时随地可以制作和使用电子文件,过去用电话、面谈解决的问题如今都可能转移于电子文件,伴随着数量增加又必然带来了内容的繁杂。我国长期以来提倡的“直接鉴定法”将在此遇到严峻的挑战,文件鉴定人员逐一阅读每一份电子文件的原文恐怕实在是无能为力。那么,我们如何判断文件可能给予后人的利用价值呢?
   纸质文件的激增已经引发了关于鉴定方面的对策研究。北美和欧洲的一·些档案专家几乎是不谋而合地在80年代末期前后想到了采用一种更为宏观的鉴定方法,并逐渐发现这种方法非常适合于电子文件。这种宏观鉴定思想的要点在于主要通过文件形成者的职能,而不是文件的内容来判断文件的价值,加拿大档案学家特里·库克对此作出的简要解释是:“从总体上判断机构形成有价值文件的能力,而不是直接地对文件加以处理:逐件地阅读每一个档案卷内卷帙浩繁的文件系列、数据库、多媒体汇集,更不用说那些个人文件。”这种鉴定思想的认识基础,在于将档案价值定位于它所反映的职能中。
   宏观鉴定法所面对的不再是单份文件,而是某种职能的文件,所以常常表现为一种“批处理”方式。在电子环境中,这项工作通常需要及早进行,文件管理系统设计阶段是鉴定电子文件最合适的阶段。因为在这个阶段可以在分析文件形成机关职能特点的基础上,按照一定的准则将文件的鉴定工作模型化,使系统对有价值的文件进行适当的管理,并及时处置无保存价值的文件。
    三.保管费用转移与价值取向的调整
   “价值一定要同费用放在一起权衡”,美国档案学者菲利普·鲍尔博士直接了当地使用“权衡”一词来表明他对文件鉴定的理解。保管文件有很多方面的费用支出,如保存空间、装具、人力等,对于纸质文件来说空间的问题最为突出,因此,档案工作者在鉴定档案时很自然地会把保存空间作为考虑的因素之一,其中比较典型的例于是对于“微观文件”的处理方法。所谓“微观文件”是指所记载内容范围较小或时间较短的文件,如机关、企业的月报、季报和某些具体记录,各种统计材料的基础数据等。这些材料在纸质文件中通常不予归档,只有在综合性文件无存的情况下才作为“替补文件”加以考虑。尽管汇总性材料给予研究人员的结论往往过于笼统,但是“微观文件”的数量可能是汇总性材料的若干倍,为此而付出的保管费用可能会使档案机构难以承受,于是,档案人员最多只能很有限度地选择一些有特点的“微观文件”加以保存,而将其它大多数放弃。
   对于电子文件来说,在存储空间上所需要的费用越来越少,数万页文件存储于一张5寸光盘的现有密度几乎使我们可以对几页、几十页、甚至几百页文件所需要的存储空间忽略不计。与保管费用降低而同时出现的另一种现象是其利用价值的提高。因为电子信息是可操作的,在系统中利用者可以随心所欲地把有关的信息、数据加以汇总、比较,从不同的角度运用这些信息进行分析和综合,因此美国档案与文件局认为“有时候统计案卷的远景研究价值是微观数据大于聚合数据”。如此,在“权衡”文件保存价值的天平上,费用的降低和利用价值的提高使得我们有条件改变过去那种对“微观文件”的苛刻态度,适当放宽电子“微观文件”的归档范围和保管期限,在双套归档的情况下,可以把一些电子“微观文件”单独归档,并在纸质档案的目录备注栏中加以注明。
   值得注意的是,电子文件中的“微观数据”有时候并不是独立地存在着,在动态数据库中,最新的数据不断地覆盖刚刚过时的数据,分散的数据不断地汇入结论性数据中,正在制作和使用电子文件的人注意的是实现他的现实目的,并不注意考虑需要为后人留下些什么。这正是不少专家主张把鉴定工作放在文件管理系统设计阶段的理由。当然,对微观数据的价值还是要做具体分析,不能一概而论地认为都有价值,更不能因此而忽略了宏观数据的作用。
   保存空间对于电子文件来说的确不那么重要了,管理电子文件的费用大量转移到为保障其安全性、可读性,易用性等所需要的技术设备和环境维护中。这样一来,“权衡”的要素发生了变化,必须考虑档案保管机构是否有足够的资金和技术力量来支持电子文件的技术要求,尤其是那些对特定的复杂软件具有特殊依赖性的文件。如果不能采用与软件无关的格式统一保管的话,档案保管机构还需要设法获得该文件的运行软件,而这类软件往往是昂贵的,或者是专利性的,软件拥有者可以有种种理由不愿无偿移交。在这种情况下,档案机构需要根据电子文件的价值和自身的实力作出决断:或者购置相应软件甚至全套系统以保障文件的维护和使用,或者与文件形成机关达成协议,由他们按照国家的有关规定实施管理。
   四.不可忽视的技术鉴定
   提出双重鉴定思想的瑙格勒认为,技术鉴定是电子文件鉴定中新的部分,它是比内容鉴定更为重要的部分。技术鉴定所承担的责任是对电子文件的各方面技术状况进行全面的检查,包括对信息真实、可靠、完整、可读性的认定和对文件载体性能的检测。一般说来,技术鉴定应当从以下几方面进行:
   可读性鉴定。由于电子文件的不可视性,对其进行可读性检测是技术鉴定中最重要的方面,目的在于确认电子文件中的内容可以正常读出,没有丢失和差错。如果文件不能顺利读出,文件中的信息便成为“死信息”,再有价值的东西也失去了存在的意义。
   进行可读性鉴定时不仅要确认文件在当时的可读状态,同时需要分析其是否具备日后多次无差错读出的技术性能。影响电子文件顺利读出的因素涉及到从外到内的许多方面,为此,鉴定时需要对其介质状况和所存信息进行全面的检查。对于归档电子文件的存储介质,要看其是否符合规定的形式、规格和质量要求,为保证日后的多次可读,可使用专用软件对介质的现有状态进行物理扫描。信息检查最常用的方法是将文件在计算机上读一篇,看能否顺利地将文件还原,蹈格勒认为,如果错误超过文件的5%,就有理由认为该文件不具有可读性,可通过与打印件加以比较的方法确定其是否值得保存。我国目前设定的指标更加严格,无论是抽样检验还是全部检验,合格率均应达到100%。
   检查归档电子文件的辅助技术材料是否齐全也是可读性鉴定中不可忽视的内容,如关于电子文件使用的操作系统和支持软件的记录材料,是保证电子文件由代码还原为可读信息的重要“引导”,不可遗漏。对于加密文件,保存时如果由于特殊需要未予解密,要检查其记录密码是否保存下来,否则这种文件有可能成为无法识读的永远的“秘密”。
    可靠性鉴定。可靠性的含义有很多方面,主要是指内容的真实与完整,而失真和不完整很多时候是由于技术上的疏忽造成的。
   对于电子文件的真实性,可从版本的鉴别入手,非正式版本的文件不具有法定的证据价值。电子文件的易修改性使得计算机系统中同一文件经常存在着不同的版本,一般情况下归档保存的必须是最终版本,必要时也要同时保存某些草稿和定稿。电子文件的版本不像纸质文件的稿本那样易于识别,可以借助计算机中记录下来的文件形成时间进行比较和鉴别。
   对于电子文件的完整性分析主要从文件的相关性入手。随着软件功能和计算机网络的发展,一套电子文件中的文字、图表、数据分布在几个甚至几十个地方的情况会越来越多,即使在同一主机内,一份电子文件也可能以若干份文件相连接的方式而存在。如果分布在各处的“文件成分”汇集不全,一份文件便无法“再现”其原貌,因此鉴定时需要核实相关文件是否收集齐全,特别是对这种在“物理结构”上分散的文件。对于数据库,还必须确认数据与栏目是否吻合,结构是否正确等,某些结构比较复杂的关系型数据库还应有相应的说明文件,否则日后的使用者可能对再现的数据结构无法正确理解,与相关的数据库无法顺利连接。
   无病毒鉴定。由于档案管理部门,尤其是档案馆的电子文件来自四面八方,比起一个业务部门、一个机关受病毒侵害的概率自然大大增加,档案部门一旦遭受病毒感染,其危害是难以估量的。因此对于以介质状态接收进来的电子文件,应使用查毒、杀毒软件进行检测和处理。
   载体状况鉴定。电子文件的载体是信息最直接的“生存环境”,载体质量发生问题会直接损伤存储在上面的信息。可在有关设备上演示或检测,确认归档文件载体质量良好,运转正常。
    五.鉴定工作的标准与方法
   电子文件鉴定的最终结果也同样表现为对存与毁的选择和对留存文件保管期限的确定。
   存在于系统中的电子文件不像放在抽屉里或文件柜中的文件那样给人以明确的数量概念,所以工作人员往往不注意对它进行鉴定和挑选。但是过多的芜杂的冗余信息不仅于人无益,而且会因加大系统负担而增加保管费用和给检索利用带来很大的麻烦。
   纸质文件鉴定中把鉴定的思想和原则转化成明确、具体的保管期限表的作法在电子文件的鉴定中依然必要,这可以给文件管理人员提供一个清晰的,易于执行的标准。纸质文件的保管期限表对于从内容上鉴定电子文件具有一定的参考价值,但由于电子文件的种类、成分和形成、积累过程有诸多特点,一些文件的价值还会随着信息技术的发展而有所改变,因此不能简单地套用原有的保管期限表,我国应该在积累经验的基础上为电子文件编制专用的保管期限表,用以体现文件内容和信息技术对保管期限的双重要求。
   电子文件的“销毁”作业变得非常方便,只要给计算机输入“删除”指令,文件立刻消失得无影无踪。操作的方便同时也会增加误销毁可能性,因此必须建立明确的标准和严格的制度。美国国家档案与文件局用电子文件保管期限表来规范电子文件的“处置”(销毁)范围,已经发布的两个“通用电子文件保管期限表”与我国现行档案保管期限表的功能有明显的不同,它并不是为留存文件确定保管期限的标准,而是授权各政府机关自行处置在内部管理活动中形成的电子文件的标准。美国这两个电子文件保管期限表中的条款非常具体,明确规定了哪一种文件在什么情况下可以删除。需要考虑的因素除文件的内容、来源之外,还包括版本、副本、数据转移等方面的情况。如果文件不在保管期限表条款之列,机关认为需要“处置”时就必须专门向国家档案与文件局递交申请表,获准后方可实行“处置”。
   和纸质文件的鉴定一样,电子文件的鉴定工作也需要分阶段进行。首先,选择归档文件,并划分保管期限。这项工作通常应该放在机关文件管理系统设计阶段进行,以便系统根据事先拟定的归档范围将有价值的文件自动备份保存下来。一些系统设计人员经常为计算机系统设定自动消除过时数据的功能,档案工作人员应该参与这种设定,对可能被删除的数据项进行认真的分析,确认这些信息不会影响文件的证据价值和信息价值。第二步是当机关档案室接收以介质方式归档的文件或对网络归档文件进行脱机保管时进行一次包括内容鉴定和技术鉴定在内的全面鉴定。第三步是再鉴定,非永久保存的电子文件由机关档案室在保管期满时进行再鉴定,通常可以结合磁带和光盘电子文件的复制工作一道进行,经鉴定后将确实无保存价值的删除销毁。进馆电子文件由档案馆接收时进行再鉴定,将确有永久保存价值的接收进馆。
   “档案鉴定是将文件的价值和不明确的未来相联系”,未来人们需要哪些电子文件,如何使用电子文件,比起纸质文件时代我们的预测可能具有更大的难度,但是我们还是要力求作出比较合理的明确的判断。

    注 释:

    ①特里·库克:《意识超越物质——档案鉴定的新理论》,转引自瓦洛:《档案思想的自由贸易》,《美国档案工作者》1994年,刘越男译。
    ②美国国家档案与文件局:《电子文件》手册,1990年,《磁性载体信息保护与管理》译文集,97页。
    ③The ArchivaIAppraisal of machine一recods, a RAMPstu打with guidelines(《机读文件的鉴定》文件与档案管理规划),1984年37页。
    ④同上58页。
    ⑤K·帝博多:《国际性研究:科学数据库的鉴定与保管》,《十三大报告集》162页。

——原载《档案学通讯》1998年第3期

打印

版权所有| 合肥市档案局 技术支持| 清华紫光
ICP备案编号:皖ICP备07002382号
建议使 IE4.0以上版本 最佳显示分辨率 800*600
cms,网站管理,网站内容管理,内容发布系统,信息采集,免费下载CMS,免费cms,内容管理系统, 个性化门户,全文检索,个人门户,建站系统