当前位置:首页 期刊杂志

基于知识图谱的我国档案管理热点及趋势研究

时间:2024-08-31

刘华英, 扈桂红

(1.中南大学 档案技术研究所,湖南 长沙 410083; 2.中南大学 生命科学学院医药信息系,湖南 长沙 410083)

0 引言

随着科学技术的进步以及人类社会活动领域的拓展,各种门类和载体形式的档案大量增加,国家机关、社会组织和个人在其活动中产生了数量众多、种类多样、载体各异、内容丰富的档案。同时,社会对档案的需求日益增强,需要设立专门的档案管理机构,并由受过专门的档案教育或培训的人员对其进行系统管理,为社会各项事业的发展提供档案利用和服务。近现代以来,档案管理工作成为一项独立的业务工作。一直以来,档案学界对档案管理各个方面进行了大量研究,为现代社会出现的档案新问题新挑战出谋划策,这些研究文献比较全面地反映了当代档案管理工作的现状,但目前还鲜少有对档案管理研究领域系统而全面地分析研究,尤其缺少对研究热点、发展趋势方面的研究。

近年来,我国广泛兴起运用科学知识图谱来把握学科研究前沿和知识发展动态的浪潮。知识图谱(Mapping Knowledge Domain),就是现实世界中根据实体间关系相互连接起来所形成的一种网络结构, 其本身就是结构化的语义知识库, 属于语义网络的范畴,主要是用图形的方式直观地呈现学科或领域知识的各种联系。目前,知识图谱已被广泛应用于自然科学、工程与技术科学、计算机科学等60多个领域, 它对研究某一领域的现状、热点及前沿趋势效果十分显著。

基于上述情况,本文采用文献计量学的统计分析方法,利用可视化分析工具——Cite Space分析我国于2008~2018年间收录在SCI、EI、CSSCI、CSCD以及核心期刊上的主题为“档案管理”的文献,绘制档案管理研究领域的科学知识图谱,探究该领域研究现状、研究热点以及未来的研究发展趋势,以期对我国档案管理研究领域的发展梳理出直观清晰的发展脉络,为相关学者的研究提供借鉴意义。

1 数据获取与预处理

本文以“档案管理”为主题,检索CNKI的期刊数据库中时间段为2008~2018年的文献。选择来源类别为SCI来源期刊、EI来源期刊、CSSCI来源期刊、核心期刊这四类来源期刊,共检索到期刊论文2 242篇。以人工筛查方式筛选每条记录,去除明显与主题不相关的文献,最终得到“档案管理”相关文献2 233篇,并以refworks的形式保存,以便Cite Space对其进行识别分析。

2 研究结果分析

2.1 载文量分析

通过分析档案管理研究文献数量随时间的变化状况,可以在一定程度上了解档案管理领域的研究热度变化发展趋势。图1是通过Origin软件描绘的档案管理领域自2008~2018年以来的发文数量图,横坐标代表的是年份,纵坐标代表发文数量,最高点的标注是(2013,327),也即2013年是该领域发文数量最多的一年,发文数量为327篇。

图1 档案管理领域发文数量图

2.2 研究机构分析

通过对文献的发文机构进行定量分析, 可以为各科研机构 ( 学校、团体) 的科研成果、学术水平、权威性程度或机构间研究水平的差异提供数据依据, 进而为寻求合作研究伙伴提供素材。将数据导入Cite Space中进行机构分析,时间限定在2008~2018年,以一年为一个时间片,每个时间片选择发文量前50的机构,得到如图2所示的我国档案管理领域研究的机构分布图谱。

图2 档案管理研究机构分布图谱

图2中,节点大小表示机构的发文量的多少,节点之间的连线表示机构之间合作关系的强弱,连线越粗,机构之间的合作关系越强。分析图2可知,档案管理相关研究主要集中在高校,少量在档案局(馆),中国人民大学信息资源管理学院、山东大学历史文化学院、辽宁大学历史学院是发文量最多的机构,其中中国人民大学信息资源管理学院发文量最多。但总体而言节点之间的连线较少,仅在中国人民大学信息资源管理学院、山东大学历史文化学院、辽宁大学历史学院这三个机构中形成比较弱的合作关系,绝大多数呈点状分布,说明各机构之间的科研合作不够密切,没有形成成熟的档案管理方面的研究团体。现将档案管理领域发文量排名前十的机构整理成表1所示。

表1 档案管理研究领域文量排名前十的机构

表1可以清晰看到档案管理研究发文主要集中在高校,且过于集中在中国人民大学信息资源管理学院;在发文量排名前十的机构中,中国人民大学信息资源管理学院、山东大学历史文化学院、四川大学公共管理学院、辽宁大学历史学院是该领域内具有代表性的科研院校。且发文量较多的机构往往与其他高校的合作关系更强,在该领域内一定程度上起着主导作用。而北京市档案局、南京大学信息管理学院、广西民族大学管理学院、广西民族大学管理学院、上海大学图书情报档案系、中山大学资讯管理学院、国家档案局分别占据11、9、8、8、8、6个席位。此外,从表1中也可以看出档案管理研究主要是在高校的信息管理学院、历史学院。

综上所述,从发文量来看,该领域研究力量主要集中在中国人民大学信息资源管理学院,除此之外,尚未有高产出机构出现,大部分研究机构的研究力量比较薄弱,而且从图2可以看出,各机构之间缺乏合作,仅形成以中国人民大学信息资源管理学校、山东大学历史文化学院、辽宁大学历史学院为中心的少量合作群体。

2.3 研究人员分析

统计作者发文量可以反映该领域研究是否形成核心作者群, 而核心作者是反映该研究领域的重要带头人, 是该研究领域发文较多, 研究水平较高的群体, 也是期刊质量稳固和继续发展的基础。根据普赖斯公式,发表X篇以上的论文的作者就属于高产作者,其中X=0.749Y1/2,Y表示最高产作者所发表的论文数。经统计,发现以第一作者(含独立作者)发文量最多的是徐拥军,发文数量为11篇,故X=0.749*111/2=2.483,也即发表论文在3篇以上的就可以算是该领域核心作者。

经过Cite Space运行之后的统计结果表示,发文量大于或等于3篇的高产作者总共是12人,占作者总人数的9.7%,累计发文数量为61篇,占总论文数量的2.7%,远远低于50%。因此,我国档案管理研究领域尚未形成严格意义上的核心作者群。现将发文量大于或等于3篇的高产作者列表如表2所示。

表2 发文量大于或等于3篇的作者

由表2可知,其中最高产的作者是徐拥军,发文量为11篇;其次是杨茜茜,发文量8篇;侯衡和周文泓每人7篇;陈永生,苏焕宁每人6篇;刘永,吴建华每人4篇;其余作者都是3篇。这表明该领域高产作者少,作者间合作力度不够,对档案管理这一领域的研究热度还不够。现将档案管理领域研究人员图谱绘制如图3所示。

难度稍大的 “图图,我们刚才在操场爬梯子是怎么爬的?爬不上去是不是抓住梯子栏杆来借力就上去了呢?那现在我们可以抓什么东西来借力呢?”(这个时候他很有可能就会想起被子,也可能是床单,或者是旁边的柜子,如果还没有想起来,那就需要继续搭脚手架,比如“我们试试看被子是不是可以借力啊?”)

由图3可知,苏焕宁、侯衡、陈永生、杨茜茜具有较密切的合作关系,且这4人的发文量都是发文量大于3篇的高产作者;赵芳、刘岩、王家君、张苏、郭全胜、李怀斌等人具有密切的合作关系,但发文量都少于3篇;其中中国人民大学信息资源管理学院的徐拥军发文数量做多,四川大学公共管理学院的周文泓发文量为7篇,但是他们的合作网络很分散。

整体来看,档案管理领域的合作研究并不明显,除少量同一研究机构之间有合作之外,跨机构,跨学科的合作网络几乎没有,也未出现特别突出的高产作者。

图3 档案管理领域研究人员图谱

3 研究热点与趋势分析

3.1 研究热点分析

3.1.1 关键词知识图谱分析

研究热点是指在某一时间段内, 有内在联系的、数量相对较多的一组文献所探讨的学问或专题。关键词是对一篇文献内容最直接简练的浓缩与概括, 因此对某一领域内的关键词进行分析, 有助于确定该研究领域的热点问题。为勾勒档案管理领域的热点及其发展动向,对该领域作者给出的关键词进行统计和分析,通过Cite Space绘制的档案管理领域文献的关键词知识图谱见图4,关键词词频排名前十列于表3。文章在运行Cite Space时,设置时间为2008~2018年,以一年为时间区域,阈值为每个时间片出现频率最高的50个关键词,然后进行聚类操作,生成如图4所示的档案管理研究领域关键词知识图谱。图4中节点共273个,连线共有1 216条,网络密度为0.0328。其中节点大小代表关键词在文章中出现的频率高低,节点越大关键词出现的频率越高。节点之间的连线表示关键词间在文章中的共现关系,连线越粗说明关键词之间出现在同一篇文献中的可能性越大。

图4 关键词知识图谱

通过对图4进行分析,可以发现,档案管理研究领域主要有8个关键词,这些关键词所反映的都是当前档案管理领域的研究热点。梳理这些关键词,可以总结出当前档案管理研究热点表现为以下三点:

(1)从档案管理的类别来看,档案管理研究主要集中在工程档案、会计档案的研究上。近年随着国家经济的飞速发展,人们生产生活需求的不断高涨,各类建设工程项目增长迅速;工程项目越大,其出现问题的可能性就越大,解决起来的难点就会越多,有时一个小问题就可能影响整个工程进程,使之陷入困境或者停滞不前,甚至造成不可估量的损失与后果;而工程档案原始地记录了建设项目全过程,全面、真实地反映了工程建设的详细情况,对于项目的建设、管理、维护、改造具有不可替代的作用。会计档案的原始记录性具有很强的凭证作用,不仅是经济决策的重要依据,还对保护国家财产,执行财经纪律具有重要意义,它可以监督管理企事业单位,及时发现违法犯罪行为,从而确保国家经济安全,防止贪污腐败行为的发生。所以,近十年来,为适应当前经济发展的需要,与国家、社会经济生活密切相关的工程档案和会计档案越来越被重视,其研究文献的数量也越来越多,并逐渐形成研究热点。与此同时,关键词知识图谱也表明了在其他类型档案如人事档案等方面研究相对较少。

(2)从档案管理的安全性来看,“违法违纪行为”、“档案密集架”这两个重要关键词出现频次较高,显示出当前随着档案作息化的发展,电子档案与档案信息网络安全变得越来越重要,对档案管理安全性提出了新的挑战,随之出现较多研究档案管理违法违纪行为的文献;同时对纸质档案馆藏的保管与利用也提出了新的要求,档案密集架因其智能化、容量大、保密性等特点而受到青睐。

(3)从档案管理的流程来看,收集与分类是当前档案管理研究的热点之一。档案的收集与分类是确保档案材料准确完整的重要前提,亦是开展档案工作、发挥档案价值的有力保障,一直以来都是档案管理研究的重要内容与对象,随着我国电子政务与电子商务的快速发展,电子文件数量激增,形式也呈现出日益多样化的趋势,电子文件归档与电子档案管理成为当前研究与探索的重点之一,与之相随,电子档案的收集与分类研究无可避免地成为当前研究热点。

3.1.2 关键词词频排列分析

关键词词频排列分析可以直观地看到档案管理领域中哪些词语成为研究热点以及该词出现的频次。现将档案管理领域词频排名前十的关键词及其词频列表,如表3所示:

表3 关键词词频排列表

由表3可知,档案保管(216)、档案收集(214)、档案整理(198)等高频关键词表明档案管理研究围绕最多的是档案保管、档案收集、档案整理等核心概念,同时也表明档案管理方面研究热点主要集中在档案收集、整理等方面,这些方面不仅是档案管理现在的研究热点所在,也是档案管理永恒的研究热点。从传统档案管理到数字化档案管理,在管理方法和信息技术日新月异的新形势下,档案界在不断探索与研究如何推进档案学基础理论与业务的发展。

3.1.3 关键词中心性排列分析

在网络中, 关键词的中心性反映了其在整个关键词共现网络中的重要性[15]。下图为档案管理研究领域关键词的中心性排列:

表4 关键词的中心性排列

分析表4可知,档案整理(0.21)、档案管理(0.18)、档案收集(0.1)、档案保管(0.9)等关键词中心性比较高,表明在档案管理研究中对于档案整理、档案收集、档案保管等的研究十分重要,是档案管理的核心所在,是进行档案管理的前提和基础,它们决定了档案管理工作的质量,是档案能够充分为用户所用的关键。在互联网+时代,无论纸质档案还是电子档案,档案的收集、整理、管理与保管工作始终贯穿于档案管理工作之中,是各个单位、机关开展管理活动时的重要环节,同时也是提升单位管理工作效率和质量的基础。

3.2 研究趋势分析

研究前沿 (Research Front) 是指“一组突现的动态概念和潜在的研究问题。而研究前沿的知识基础 (Knowledge base) 是在科学文献中, 被前沿术语所在的文献引用的科学文献所形成的演化网络和共引轨迹”。突变词能够分析词频的时间分布和动态变化, 其基本原理为, 如果出现激增的关键词, 代表一段时间内该领域研究兴趣的突然增长。突变分析通过分析某种类型的数据源在某段时间内突然产生的现象,生动形象地展示研究热点随时间的变化。为探究档案管理领域研究热点的变化规律,本文研究利用Cite Space软件绘制出关键词知识图谱之后,在Export中导出突变权重排名前二十的话题词经整理之后得到如表5所示的主题突变词及其权重表,突变权重大小代表短时间内该关键词出现的频次多少,中间的持续时间长度代表研究热度。通过分析主题词的突变特征,梳理出该领域的热点话题发展趋势。

表5 主题突变词及其权重表

分析表5,可以总结出,档案管理研究领域近十年来的研究趋势主要表现为以下五个方面:

(1)档案管理在大数据环境下的发展。“大数据的出现必将颠覆传统的数据管理方式,在数据来源、数据处理方式和数据思维等方面都会对其带来革命性的变化。”大数据时代,档案部门作为存储信息和提供信息服务的信息中心,服务网络化思维、信息化思维、技术思维、资源共享性思维四大思维已经成为档案管理在大数据时代发展的一个趋势,不断转变档案管理思维方式,学习和利用大数据技术、创新档案工作,是各个档案部门和档案工作人员的未来所面临的挑战和机遇。

(2)数字档案馆建设如火如荼。随着信息时代的发展,传统档案馆已经过渡到数字档案馆,数字档案馆(室)建设成为推进档案信息化的重要抓手,推动着档案馆从信息存储机构转变为信息服务机构。对数字档案馆建设来说,数据就是一切,是数字档案馆的生命,以档案数字化建设、云计算和元数据及大数据时代下档案数字信息挖掘为核心的研究与探索方兴未艾,引领着档案管理事业的发展,现在及今后把这些新技术、新方法运用到数字档案馆建设中成为一个必然的、长期的趋势,也是今后档案事业发展一项十分重要的内容。

(3)档案信息化建设成为重要工程。随着“数字化社会”、“数字化城市”时代的来临,全国档案学界深入贯彻国家信息化发展规划,档案信息化建设步入快速发展通道,及时跟进电子政务、电子商务以及大数据、云计算、人工智能的发展应用,不断加强电子文件归档、电子档案管理、档案信息系统安全保护等重点难点问题研究,探索利用电子政务内网开展档案利用、信息报送、业务监督指导等工作,以业务应用驱动档案信息化,档案管理微机化、档案馆藏数字化、档案信息共享化,已成为当今档案工作发展的趋势。同时,档案信息化建设是一个宏大的系统工程,在发展进程中会遇到各种问题、困难和挑战,需要档案同仁们不断分析新形势、解决新问题、研究新方法,加快推进档案信息化建设。

(4)《档案法》将会在未来档案管理事业发展中发挥越来越重要的作用。依法治国是党领导人民治理国家的基本方略,依法治档是推动档案事业的前提和基础,依法治档首先要有法可依,《档案法》不仅是顺应新时期国家民主与法制的需要,也是我国社会主义档案事业的建设和发展的根本遵循。随着档案工作领域新情况新问题的不断涌现,颁布实施多年的《档案法》已不能很好适应当前的形势任务,修订工作势在必行,经过多年的努力,修订工作迈出了重要的步伐,《档案法》修订项目列入国务院年度立法工作计划和十三届全国人大常委会立法规划第一类项目;待条件成熟时,也将会启动《档案法实施办法》等配套法规制度的修订调研计划。

(5)民生档案关注度高涨。党的十九大报告吹响了2020年全面建成小康社会的号角,民生问题更加突出地成为了全党工作的重点,它关系到百姓安居乐业、国家兴旺发达、社会长治久安。同时,在改善民生、服务民生的过程中,形成了大量有价值的民生档案资料,如社保、人事劳资、低保、婚姻登记、土地承包、村民建房、林权改革等档案资料,这些档案资料切实地与人民群众的利益息息相关,是党和国家化解社会矛盾,制定各项惠民、利民政策的依据和参考。因此,从维护社会和人民群众切身利益的高度出发,加强对民生档案的收集整理工作,确保民生档案的完整性和安全性已然成为档案管理的研究趋势之一。

4 结语

本文借助Cites Space 软件,对2008~2018年间收录在中国知网(CNKI)的2233篇文献进行统计分析,所取的样本文献中未包含报告类、教学类等学术成果,且选择年份为近十年,实际上档案管理领域的研究远远不止这十年历史,所以文章分析得到的结果具有一定的局限性,但就档案事业作为人们的历史经验而言,近十年的研究状况可以反映与体现该领域的研究现状与趋势。总而言之,本文利用可视化软件进行档案管理领域的研究分析,具有一定的创新性,这些逐步积累演进的知识基础,为知识图谱在档案管理领域的应用提供了思路。未来,档案管理研究将继续与我国档案事业发展并行,从理论与实践上推动档案事业向前迈进。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!