当前位置:首页 期刊杂志

国内电子文件长期保存研究热点分析

时间:2024-08-31

鄢明芳, 郑 川

(1.湖南省语言文字培训测试中心,湖南 长沙 410016;2.中南大学 档案技术研究所,湖南 长沙 410083)

1 引言

信息化时代,传统载体的记录模式受到巨大冲击,传统载体文件的管理体制和机制无法完全适应电子文件的管理和利用需求。数字文件易于复制、修改等特点给电子文件的真实性、完整性、安全性和可读性保障带来了难题,特别是作为社会记忆载体的电子档案,保证其长期可读可用尤为重要,国内外也开展了诸多研究。本文对我国电子文件长期保存的相关文献进行系统梳理,旨在理清该领域研究的热点、成果和现状,为相关研究提供参考。

2 研究方法和数据来源

2.1 研究方法

通过关键词聚类法和内容分析法,可视化分析软件Citespace 5.5.R2对电子文件长期保存相关文献进行研究热点分析,并基于研究热点的演进发现该领域的研究趋势。关键词聚类,可以将关系密切的主题词集中呈现以展现某领域的研究结构。内容分析法通过对文献的阅读、分析和整理,能够突破文献计量的表象数据特征达到对“质”的认识,确保分析深度[3]。Citespace是近年来可视化文献计量分析领域中影响力较大的软件。

2.2 数据来源

中国知网(CNKI)是国内领先的集期刊、会议论文、报纸、杂志、硕博士学位论文、标准、年鉴、专利、工具书等文献资源于一体的网络出版平台。本文以中国知网为数据来源,检索数据库包括中国学术期刊网络出版总库、中国优秀硕士学位论文全文数据库、中国博士学位论文数据库和中国重要会议文论全文数据库。检索条件为:SU =“电子文件”and “长期保存”(精确匹配)、文献来源=“不限”、发表时间=“不限”,检索时间为2019年10月30日,检索得到中文文献376篇。通过逐篇阅读摘要对文献进行数据清洗,剔除内容无关文献15篇、重复题录6篇、期刊要览1篇、新闻资讯6篇、访谈稿1篇和卷首语1篇,最终得到346篇国内电子文件长期保存的相关文献。将这些文献在CNKI里以Refworks格式导出后转换为CiteSpace可使用的专用格式。

3 我国电子文件长期保存研究热点分析

3.1 研究热点

关键词是为文献标引而设置的能反映全文主题和中心内容的词汇和术语,关键词选取的规范性会直接影响科技论文的检索效率。但关键词一般是非受控的自然语言词汇,论文的关键词易出现词义宽泛、专指性差、用词不规范、无法准确反应主题等用词泛化问题[1],在计量分析之前需对关键词进行数据清洗。譬如,将“电子档案”、“数字档案”等同义词统一合并为“电子档案”;删除无明确含义和专指性差的词如“问题”、“探析”、“应用”、“档案”等。结合高频词与低频词词频界分公式,得到词频排名前20的关键词如表1所示。

表1 关键词词频表

将清洗后的关键词导入Citespace 5.5.R2,设置分析年份Time Slicing从1996年到2019年,时间切片Years Per Slice=1年,分析节点Node Types=Keyword,连接强度Links Strength=Consine,切片选取标准Selection Criteria=Top 80%,网络裁剪Pruning=Pruning the merged network,绘制关键词共词图谱。网络同质性指标Silhouette=0.7397≥0.5、Q=0.5906表明聚类结果可信。根据图谱中关键词聚类情况,结合文献可将电子文件长期保存相关文献划分为五个主要热点研究领域:文献和研究综述、相关技术研究、相关标准研究、电子档案管理和实际案例分析。

3.1.1 文献和研究综述

该领域研究主要是对电子文件长期保存某方面的研究综述。刘家真、徐义全、毛义春等学者早在2000年前后就开始对数字信息长期存取研究和以美国、澳大利亚为主的国外研究进行介绍。其后的时间里,邓丹丹、苏旻、李景、张雅君等人不断对该领域新的研究进展进行介绍。近年来,谢永宪和王巧玲等人从目的、相关主体、技术、标准、法律、经济和国家策略七方面对国内数字档案长期保存相关文献进行了整理分析,并建议未来应加强理论与实践的结合,建立具有中国特色的数字档案长期保存理论体系[2]。肖秋会和赵文艳从作者、年度和主题三方面对欧美电子文件研究相关文献进行了分析和梳理,发现从20世纪60年代至今,欧美电子文件研究经历了萌芽、创新和国家战略三个阶段,热点研究主题有电子文件元数据、电子文件鉴定、电子文件长期保存和电子文件的法律凭证性等,并介绍了欧美核心作者David Bearman和Luciana Duranti的主要研究成果[3]。

3.1.2 相关技术研究

该领域主要是对电子文件长期保存的相关技术展开研究。刘国伟、毛义春、张江珊、闫晓创等学者对电子文件长期保存的格式问题进行了研究,周枫、吕东伟等人对我国自主开发的版式文件格式OFD进行了SWOT分析[4],钱毅从文件全生命周期的角度提出了电子档案长期保存所用格式的基本原则,总结了电子档案长期保存格式的主要管理策略[5]。张永洁、康惠清、连秉然、汤卫新、张晶晶等人对电子文件长期保存的各类载体进行了优劣势分析,蒋术基于我国现状从存储载体、存储技术、环境保护、管理制度、标准规范五个方面提出了电子档案长期保存存储载体的综合方案[6]。金更达、王艳丽、李泽锋、刘益妍、马仁杰、钱毅等学者基于OAIS结构框架对电子文件长期保存的可信度保障进行了系列研究,重点关注依赖于技术和信息系统前提下的长期可信保障。蔡盈芳、刘越男、杨建梁等学者对电子签名的原则、方案与应用策略等相关问题展开了研究。程妍妍、郑静、马仲凯、刘越男等人分别对图像文件、电子发票、电子文件的元数据和封装方案进行了研究,刘越男和杨建梁面向电子文件长期保存构建了统一的元数据模型,主要包括文件、技术环境、责任主体、业务、法规标准五个实体[7]。李亚男、毕建新、杨静、殷建琳等人探索了在云环境、云存储等新技术条件下电子文件长期保存所面临的机遇和挑战。刘越男和吴云鹏分析了区块链技术在数字档案长期保存方面的优点、不足和风险,提出应用区块链技术长期保存需解决哈希值持续有效、合适的区块结构、相关技术集成、合适的共识机制、保持节点相对稳定、保证链上数据长期可用、提升管理水平七大关键问题[8]。

3.1.3 相关标准研究

该领域研究主要是对电子文件长期保存的相关标准展开分析和讨论。陈晓辉系统介绍了我国当前关于电子档案管理的63项相关标准[9],赵屹系统介绍了国际标准化组织ISO关于电子档案管理的49项相关标准[10]。陶悦、于浩、赵屹、冯文杰、贾茹等人梳理了我国电子文件长期保存标准研究的发展历程。郭晓云、李从卫、刘国伟、肖秋会等人重点分析了我国关于电子档案长期保存格式方面的相关标准,张晓娟、唐长乐、程妍妍等人梳理了我国电子文件长期保存元数据方面的相关标准。周耀林、李丛林和罗亚利分别介绍了国内外文化记忆机构关于信息资源长期保存的标准体系建设和质量标准研究情况。

3.1.4 电子档案管理

电子档案是电子文件的组成部分,档案管理机构是研究电子档案和电子文件长期保存的重要力量,档案行业许多学者和从业工作者对电子档案这一特定形式的电子文件开展了许多研究。宁娜、王英玮、常建法、刘俊、彭蒙蒙等人结合档案工作实际情况对电子档案和电子文件的归档要求、流程等相关问题进行了研究。骆建珍等人对电子档案长期保存的安全性、真实性、完整性和可用性检测要求和实现方法进行了探索。陈海平阐述了高校实行电子档案单套制归档的紧迫性,并重点对可行性进行了研究,管先海、何思源、武梦雅、廖倩文等人研究了电子档案的管理模式和单套制管理的推进策略。耿志杰、凌桂萍、毛海帆、王新阳、康璐等人从需求分析、功能设计、应用开发等实际应用的角度对电子档案管理系统进行了研究。

3.1.5 实际案例分析

该领域研究主要是对一些典型案例进行分析和经验介绍。肖秋会和伍黎丹介绍了澳大利亚国家档案馆针对数字信息长期保存开展的数字连续性计划(Digital Continuity Plan),分析了该计划制定的背景、相关要素和理论依据、关键举措和管理理念,总结了值得借鉴的地方。祁天娇和刘越男介绍了美国国家档案与文件署的电子文件档案馆项目(The Electronic Records Archives of NARA),描述了该项目的建设背景、目标和主要成果,解读了ERA 2.0系统新的技术方法和研发理念,以及近年来在系统功能实现和运维方面的局限性。马林青对电子文件永久真实性国际合作项目InterPARES(International Research on Permanent Authentic Records in Electronic Systems)政策框架的制定背景、概念基础、框架结构、研究视角和主要内容进行了全面的介绍和分析,并基于此对我国电子文件长期保存政策提出建议,侯衡重点从概念内涵、整体设计、管理流程、管理责任、管理系统等方面对InterPARES项目电子邮件长期保存研究成果进行了分析,总结对我国电子邮件长期保存的启示。徐拥军和马林青介绍了加拿大图书档案馆(Library and archives of Canada)可信数字仓储的发展历程,及其在永久保存联邦政府电子文件中遇到的困难和挑战,并总结了其成功经验。

4 总结

二十年来我国电子文件长期保存的研究热点主要集中文献和研究综述、相关技术研究、相关标准研究、电子档案管理和实际案例分析五个方面。对电子文件长期保存体系而言,技术研究是基本前提,标准研究是边界参照,电子档案管理和实际案例分析是结合理论知识针对具体问题的实践经验,文献和研究综述是对整个研究的不断总结。除此之外,还有许多学者对电子文件长期保存的法律法规、参与主体、目的和意义、新技术应用、趋势展望、策略研究等其他相关主题进行了大量研究,这些研究共同推进了电子文件长期保存研究体系的进步与发展。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!