当前位置:首页 期刊杂志

中文文献内容自动标引研究的回顾与展望*

时间:2024-05-19

刘 峰 杨 斐 解 荣

(常熟理工学院图书馆,江苏常熟 215500)

0 引言

在学术期刊和学术论文中,自动标引是“连接科技传承与创新的一个重要环节”[1]。在论文撰写时,论文的引用标准和精确性,直接体现了作者对论文的认真程度。在期刊评价、论文影响力评价、人才评价等方面,自动化文献标引的功能越来越突出。2009 年,科技部发布了《科研活动诚信指南》,再次强调了对学术不诚实行为的“零容忍”[2]。文章的自动标引是我国高校科研工作的一个主要内容,探讨其在我国高校图书馆开展的一些不符合标准的问题,对于指导高校科研工作具有一定的指导意义。

1 中文文献自动标引研究简评

引用是一种科学的交流手段,是一篇文章的重要内容。引语是指在自己的著作中,由别人引用的观点或资料,是由别人的文献所引起的,是由自己在公认的学风观念和准则的作用下产生的一种可以考察和分析的学术交流的一种形式[3]。“自动标引程序”指的是“自动标引程序”,是指按照学术发展的规则、学术发展的需要,自动标引(引用)的各项标准和要求,是衡量自动引用(引用)的标准(指南)[4]。当前,国内的文献自动标引规范着重于文后引用的格式,1986 年,《文后参考文献著录规则》(GB/T7714-1987)颁布,并于2005 版进行了修改。

2 文中自动标引规范调查—以图书情报领域部分论文为例

2.1 数据采集

拟从《情报学报》《图书情报工作》《中国图书馆学报》《图书馆建设》等CSSCI 来源的学术期刊(《大学图书情报学刊》《情报探索》《图书馆学研究》《科技文献信息管理》等)与8 个非 CSSCI 来源的学术期刊,共计50余篇。通过对256 个中文引文的溯源,得到230 个完整的引文,其中26 个不能溯源到原文。以武汉大学、北京大学、南京大学为例,选择了24 个硕士、博士生的论文作为研究对象。其中,中文学术刊物有154 个引用文献。在这些文献中,可以检索到128 条中文学报引文,26 条则无法检索到。

2.2 数据统计与分析

2.2.1 文中自动标引方式的统计

参考朱大明归纳的4 种自动标引方法,分别采用摘录式、复述式、报道式和指示式4 种自动标引表述方式进行数据统计分析。

研究结果显示,410 份中文学术刊物的文章,其中13%没有回溯到原始资料,而硕士学位和博士学位占18%和15%,核心刊物不能追踪到原始资料。抽样中的统计数据如表1、表2 所示。

表1 引用不规范现象统计

表2 不同文献类型的引用方式

根据表1 和表2 的数据,可以得出以下结论。在所有可追溯文献中,报道式自动标引是作者引述文献的主要方式,共计147 篇,占比41.06%;其次是摘录式,共计99 篇,占比27.65%;复述式为82 篇,占比22.91%;而指示式最少,仅有30 篇,占比8.38%。在报告型自动化检索中,学报类文献的非标准化检索率(4%)比硕博士文献的非标准化检索率(2%)要高。与期刊文章相比,硕士和博士论文的不规范程度较高。其中,期刊文章不规范比例为12.61%,而硕士和博士论文不规范比例更高,达到了21.09%。

2.2.2 文中自动标引不规范现象的统计

朱大明调查发现,文献中自动标引不规范现象主要包括4 种情况,即“滥引”“用而不引”“过度自动标引”和“模糊转引”。其中,“用而不引”指论文使用了他人的研究成果,但未注明出处或未进行说明,“模糊转引”是指作者在某“中介文献”中看到了该中介文献自动标引的文献,而未亲自阅读和分析就将其转引到自己的论著中,导致自动标引失真[5]。由于这两种情况在追溯原始文献过程中难以核实和统计,只对两种非正规的情况,即“滥引”与“过量的自动索引”进行分析与统计。

“滥引”有两种表现,一种是在撰写文章时,忽略文章题目,引用与题目毫不相干的文章,甚至引用无法查找到原文信息的文献作为参考文献。例如,学位论文《利用引文分析图书馆学的相关学科》引用了一篇没有自动标引的文献《关于情报学相关学科的定量研究》。第二种是直接将原始文献内容直接标引,但不加引号。例如,在《图书馆实名认证微博的话语责任探析》一文中,引用了《微博传播的十大特点及对言论生态的影响》,但是直接将135个字进行了标引,并未使用引号区分,属于“滥引”的行为。

“过度自动标引”是指作者没有恶意地占有或侵害别人的版权,文中标引的文献过多,但这些文献都符合引文著录规律并已在文后著录[6]。过度自动标引有两类,一是过度自动标引内容,二是过度自动标引观点。比如,在一项调查中,根据当前大学图书馆对外公开的情况,运用计算机自动检索系统,共检索到136 次《高校图书馆社会开放的困惑与思考》。另一份调查报告是关于大学图书馆所收藏的专业“核心出版社”的评价,《基于组合权重的灰色关联理想解法及其应用》的文章将大部分题目(被引用的主要内容)都标注到自己的论文中,属于过度的自动标引,或者是学术抄袭。

在回溯的358 份文件中,有108 份出现问题。其中52 份无法找回原始文件,另外56 份能够找回,但是存在一些自动索引不符合标准(见表3)。

表3 不规范引用现象的统计

由表3 分析可以发现,滥引是作者在自动标引过程中出现最多的不规范现象,占所有不规范自动标引的73.21%。学术论文与学术论文在引用不当上存在着一些差异,主要表现在以下两点。(1)缺失引号20 次,占比35.71%;由于无法找到原作而造成的重复引用21 次,占比37.5%。(2)学报与硕博士两篇文章被引用的非正规性比率差异较大,学报与硕博两篇文章分别为26.79%与46.43%。但在非标准化检索中,学报与硕士研究生的非标准化检索词的平均词量差异并不显著,仅为68%与69%。

在自动标引过程中,由于过度的自动标引内容导致出错的比例是所有不规范现象的17.86%,而出错较少的比例是所有不规范现象的8.93%。在核心期刊中,约有75%的文章存在“追溯不到引文”和“过度自动标引”的情况。而在非核心期刊中,约有53.85%的文章存在“追溯不到原文”的情况。在硕士论文中,约有40%的文章存在“不加引号”的情况。在博士论文中,“不加引号”的情况同样占40%,过度自动标引的情况最少。

3 文中自动标引现状总结

3.1 作者倾向于用报道式自动标引表述方式

在自动搜索时,作者通常使用较广泛的概念表示引用的内容。一方面,采用报道式自动标引方式能够有效地防止因大量的论文被自动标引而导致的学术不端行为;另一方面,报道型的自动标引表达具有很大的用途,不管是研究性论文、综述还是评论性论文,都能起到很好的效果。然而,这种报道型的自动标引方式也有不足。比如,对“高度概括的语言”的界定不够精确,且没有相关衡量标准,很可能会给作者可乘之机。

3.2 作者对参考文献文中自动标引表述规则的认识不统一

由于缺乏对文中引用的自动标引资料的理解,致使各种类型的文章在不同的著者之间产生了大量的自动标引,以及各种类型的自动标引误差。比如,一些作家在引用他人的文章时,只会注明引用的编号,而不会用引用描述,很可能使读者产生误解,误导其他作者。发生这种现象的原因之一可能是作者对直接引用时需要标注资料来源的规定不够了解,作者在收集资料时可能没有及时记录出处页码,并且在后续查找时也没有找到或者已经遗忘出处页码[7]。这些行为均可能导致自动标引的失真,在学术研究中是不负责任的行为。此外,一些作家对引用标准的理解不足,对参考文献的认识不足,实际使用的引用标准也没有足够的关注,使论文中自动引表不规范问题多次出现。

3.3 文中自动标引不规范现象严重

调查结果表明,自动标引不规范的现象在论文中普遍存在,尤其是在学位论文中更为严重,有些论文甚至出现了多处不规范的现象,出现这种情况的原因有两方面。第一,硕博士论文审核标准不如期刊审稿标准高,可能导师只审核内容和科学性,忽略了参考文献规范这一点。第二,学位论文答辩评委可能由于时间关系没有仔细审读论文,只关注论文的结构和逻辑,文中自动标引不规范的问题则被忽略,导致自动标引不规范的现象较为普遍。

4 建议

4.1 在全国范围制定并执行统一的参考文献自动标引规范

作者对标引规范模糊以及缺乏足够的关注,造成文章编著者在不科学的情况下进行自动标引。因此,应该从目前使用最为普遍的中文文献自动标引技术入手,制定一套统一的中文文本标引标准,本规范参照国内外大多数杂志出版后的参考文献文本自动标引规范,以我国图情领域知名的高校和科学院为主导制定,进行试点推广。

4.2 以研究生群体为主要对象,严格进行学术规范督促与审核

研究生是刚刚进入学术领域的人,对其进行监督,对促进学术标准的更新大有裨益。中国的硕士教育采用了“导师责任制”,即由导师组成的导师团队,采取“单独辅导”与“五至七人”的“团队辅导”的方式。但是,我国研究生教育更注重招生考试,而忽视了后续教育,导致学生在入学后缺乏学术督促,出现学术不规范的现象。为了改变这种情况,可以学习美国的高淘汰制度,从教学内容、学术报告等多个环节对学员提出较高的标准。

4.3 提倡论文作者提交论文时附上自动标引的文章全文

在毕业论文的答辩和编辑审稿过程中,对引用的文献进行严密审核。在投稿过程中,评稿人需要在投稿时,将参考文献的全文连同投稿一起递交,防止作者为了提高论文的质量,而对知名学者的论文进行滥引,从而造成无法追踪到原著的问题。同时,也能促进著者对引用书目进行标准化,降低误注的发生。与此同时,指导教师和编者应按要求严格对待不符合标准的文章,存在错误自动标注以及不标准引证等问题的文章,要及时退回。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!