当前位置:首页 期刊杂志

国外数字资源长期保存对我国数字资源长期保存基础构建的启示

时间:2024-04-24

董一凤

(哈尔滨体育学院图书馆 黑龙江 哈尔滨 150008)

1 国内外数字资源长期保存现状

1.1 发达国家政府等组织重视数字资源开发、保存与作用

数字资源长期保存的目的就是确保数字比特流能长期得到运行与其内容得到长久获取的信息管理活动,早在20世纪90年代一些发达国家就着手研究数字资源存取保护问题。例如,北欧五国包括(瑞士、挪威、丹麦、芬兰和冰岛)在1991年就颁布国家档案馆了《电子文件的存取与保护》;在这之后其他欧洲各国相继成立了由大学、图书馆、档案馆及出版界的著名学者、专家组成的保护与存取欧洲委员会,英文简称为ECPA;1993年12月澳大利亚也成立了澳大利亚数字信息调研组,简称为TF2001PADI;美国于1994年12月成立了保护与存取委员会,他们对数字信息的长期保存问题进行了调研并且对其保护措施提出了建设性意见,并制定了数字信息的管理指南和规范及数字信息的长期存取与保护等。

在数字资源管理与保护方面也取得了长足的进展。以美国为例,美国斯坦福大学的LOCKSS项目意为通过建立各个副本保证数据的安全,即通过建立出版商与图书馆之间的协作关系,允许图书馆在本地收藏、管理电子期刊,并提供用户服务的信息系统[2]。美国国家航空局和宇航局的空间数据系统咨询委员会所推出的关于数字信息长期保存和利用的基本框架体系——开放档案信息系统参照模型简称OAIS,目前,该机构的数字信息长期保存体系已成为国际标准,为其他国家所公认。

可见,国外发达国家的数字资源无论在资源整合与保存,还是在合作上都取得了积极的进展。归纳起来主要体现在:

第一,政府的高度重视,并制定数字资源长期保存的标准规范,以此建立不同层次的合作机制与制定合理的保护策略。在信息化社会越发普及的当今,无论从政府组织,还是跨国集团或高校图书馆与出版机构都成为数字保存运作的主要实施者。

第二,政府在数字信息长久保存上,实现永久性的电子文件档案馆,通过网络合作实现数据与信息的共享与利用,实现资源的动态更新、损坏修复、丢失补遗等功能,从而确保了数字资源的完整性。

第三,建立出版商与图书馆、图书馆与图书馆之间的协作平台,提出了从电子资源出版、发布到永久性保存与利用等一整套解决方案,例如,美国最新报告表明,每年世界上生产的信息量在千兆兆位以上,即世界上每人平均大约250MB,这些巨量的信息中有90%以上是数字资源,[3]这些数字信息的长期保存需要一整套完善措施的支持。

以上不难看出,发达国家政府适应信息化社会的发展要求,越来越对数字资源的长期保存、利用更加重视。

1.2 国外数字资源长期保存基本模式

目前,在对数字资源长期保存上还没有一个公认的模式,但有几种具有代表性的研究模式主要体现在:

第一,(英文简称为OAIS模型)这一观点认为,数字保存系统的目标是要确保被保存的信息对于目标团体而言是独立可理解的,也就是说,在没有专家的帮助下,目标团体仍能够独立地理解被保存的信息,为了达到这一要求,在保存过程中,既要保存存档对象,也要保存针对对象的描述和说明信息[4]。

第二,还有(简称PREMIS)该模式认为,数字保存的目标是维持数字资源的长期可生存能力,也就是要求被保存的数字对象的比特流完整无缺,并且能够从它所存储的载体上读出。数字保存目标要求数字资源的可呈现能力,也就是能够将比特流转变为一种可以被人看被计算机处理的能力。

第三种模式(英文简称Priscilla Caplan),这一研究认为,从下到上,从低到高的要求数字信息保存的目标分别为:可获得性,即选择获得技术;可识别性,即描述;可理解性,即文档记录;完整性,即安全存储;持久生存能力,即媒体管理;可呈现能力,即格式技术策略;被保存对象的真实性,即真实还原技术[4]。

虽然发达国家在数字资源长期保存技术开发方面取得较大的成绩,但还存在较突出的问题,有学者研究认为,目前尚未有国家建立统一的国家体系进行数字资源的典藏与保存,对数字资源及非印本资源的呈缴也缺乏相应政策和法律支持,这些为数字资源长期保存造成不利影响[6]。在2008年数字资源长期保存国际会议(Ipres2008)参加会议的专家一致认为,技术不是数字保存的关键问题,而政策、法律、跨界合作等的不足才是制约数字保存的瓶颈。可见,从技术上升到法律、法规是确保数字资源长期保存、利用的新课题,有待于进行探讨。

2 我国数字资源长期保存基本现状与存在的突出问题

2.1 我国数字资源长期保存基本现状

我国的数字资源长期保存与欧洲国家相比,无论是系统目标确定,还是具体技术环节或细节等方面仍然存在这一定的差距,但也取得了一些成果,例如,我国目前主要的软件开发系统有:中国科学院国家科学图书馆的NSTLH NSL联合资助的对电子出版物构建长期保存系统;国家图书馆“网络信息资源保存试验项目”简称WICP,目前建立有2110中报纸、1800个报纸网站以及80个网站的PDF文件的数据库;中国Web信息博物馆,目前已经有30亿以中文为主的网页,并已月均45000完网页的速度在增长。此外,还有清华大学图书馆开发出来的元数据框架、标引机制和元数据编码的系统软件等。

2.2 我国数字资源长期保存存在的突出问题

与国外数字资源长期保存相比,还存在一些问题与不足,主要体现在以下几个方面。有学者研究认为,数字资源长期保存所涉及经济投入,例如巨大投资、可持续投资以及投资额不明确;知识产权问题,例如永久使用权、保存权与国家尚未制定责任体系的相应政策与有关技术开发中的选择什么技术策略与方法[7]。

由于互联网的普及,网络数字资源越来越丰富,人们也更注重从网上获取数字资源,但怎样收集与保存也成为突出的问题。有学者指出,我国互联网信息采集系统采集信息的准确性和效率较低,对动态网页和数据库中的深层网页采集质量不高[8]。

我国还缺乏合作性质的保存网络组织机构,虽然有学者在研究协作保存网络的数字资源问题,但仍然体现出不同程度的分散性,不仅不利于数字资源的整合,还会导致重要资源内容遗漏、利用率低下以及人力物力等浪费现象。

数字资源长期保存的主体,政府部门、数字信息创造者、出版商、数字信息保存机构、软硬件的开发者与非营利组织在软件开发的责任、作用与表现,从相关的研究中,虽有学者对之在模式上进行探讨[9],但在法律、政策上还缺乏必要的保障与对相应责任的追究等。

还有学者以数字图书馆信息资源保存为依托,提出对信息进行必要的压缩、鉴定与选择、选择适当的储存媒体以及采用新技术(仿真、更新与迁移)[10]。

3 国外数字资源长期保存对我国数字资源长期保存的启示

标准是数字资源长期保存建设过程中不可忽视的重要问题之一,是保证数字资源长期保存各环节互相操作的基础,贯穿于数字资源生命周期的全过程[11]。标准也是缓解技术更新与数字信息读出矛盾的一剂良方。

我国目前这项技术还处在实验阶段,还没有形成被广泛认可的统一标准。有学者研究认为,管理是国家从整体上对数字资源的长期保存进行宏观规划、组织和控制,是数字资源长期保存的基础与保障。它的内容有:保存政策、责任体系及合作机制、知识产权等。保存政策是有效实施数字资源长期保存的管理上的保证,涉及技术、组织、法律及权益等管理,包括确定长期保存目标,完善管理机构,制定长期保存的规范流程,明确有关人员或组织职责,确定技术标准和最佳实践,制定长期保存的延续性计划,建立对实施效果的评价机制,完善保存政策的反馈系统等[12]。

(1)由政府牵头,加大对我国数字资源的调查、归类与整合,并依托网络组织以及高校与企事业单位等组织,进行结构调整,建立数字资源长期保存的不同层次的系统,同时要配合制定相应法律、法规,使之规范化、制度化。从发达国家对数字资源长期保存的实践上看,他们对数字资源的整合、开发与使用都具有较强的体系性、严谨性与安全性,贯穿控摄整个信息社会的内部要素,对他们的技术方法与手段进行更多的借鉴,在国家相关政策的指导下构建有中国特色的数字资源长期保存体系。

(2)在对我国数字资源长期保存基础构建中,注重我国数字长期保存经验的继承,通过与发达国家的比较,对我国数字资源的分布进行宏观比较,对政府、企事业单位等数字保存进行资源整合,避免资源“割据”现象,对此在所用经费的来源、使用以及系统模型的开发等方面要形成清晰权利责任体系。

(3)国家要对数字资源保存系统进行统一规划,在对资源的合作保存、选择性保存以及最大减小保存前的顾虑,明确不同数字资源保存组织之间的关联,在实践中发挥其功效。

4 结语

数字资源是信息社会中主要载体,对其长期保存不仅是技术层面上的问题,也是社会(法律、道德等)层面上的问题,随着信息社会的不断发展,数字资源的长期保存也来越来越多受到注目。通过对国外数字资源长期保存现状的分析,我们看到作为信息社会载体的数字资源保存的理论探讨与实际应用非常庞杂,同时它选择什么技术,还取决于待保护的数据类型,格式,内容结构和关系复杂性及原始软硬件平台。因此,我们在了解国际上大量有价值的信息及技术动态的同时,对我国数字资源长期保存基础构建进行初步探讨,目的在于促进我国相关领域对数字资源长期保存工作的重视和发展。

[1]俞敏,编译.韩国国家图书馆的网页存档系统[J].AwebArchiving System of the National Libraryofkorea:OASIS.http://www.ndigo,Jp/en/publication/cdnlao/058/583.htwl[2007-4-7].

[2]吴振新,等.LOCKSSS数字资源长期保存策略[J].现代图书馆技术,2006(2):35-37.

[3]圣才学习网.数字图书馆理论基[EB//OL].(2006.10)[2010-10-19].http//www.100xuexi.

[4]张智雄.如何长期保存数字资源2006年教育行业信息存储大会上的讲话.[EB//OL].(2006.4)[2006-6-12].http//www.cnki.net.China.AcademicJournalElectronic Publishing House.AIIrights reserued.

[5]李丹等.协作与实践:数字资源长期保存工具及方法[J].图书馆理论与实践,2009(11)70-72.

[6]苑玲.国外数字资源长期保存的最新发展及对我国的启示[J].中国图书馆学报,2004(2)24-25.

[7]苏雪梅.网络数字信息采集与保存的探讨[J].预防医学报,2004(6):647.

[8]谢永宪.数字长期保存的相关主体及合作模式研究[J].图书馆学研究,2009(3):42.

[9]石得万.数字图书馆信息资源保存面临的挑战与对策[J].图书馆论坛,2002(8)47-48.

[10]徐恩元,李澜楠.市场经济条件下信息资源有效配置问题初探[J].情报杂志,2005(11).

[11]王芳.阳光下的政府:政府信息行为的路径与激励[M].南开大学出版社,2006:65.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!