当前位置:首页 期刊杂志

基于提高检准效率的著录项主题叙词化

时间:2024-06-19

代林雪

(佳木斯大学 图书馆,黑龙江 佳木斯 154007)

文献检索是文献信息在时间与空间上的传递。伴随着信息时代的到来,文献呈海量增长,文献检索标识的规范性对文献检索的检准率与检全率的影响变得越来越重要。高效率的检索是基于检索标识与标引标识高度吻合的基础上实现的。数字化环境下,只有标引深度大于或等于检索深度,也就是标引词在数量和专指度上都大于或等于检索词的数量和专指度,文献检索的检全率和检准率才能有所保证。

1 叙词在文献标引中的作用

进入数字化时代,计算机检索技术日益完善,对于普通情报用户,传统的分类号检索逐渐失去其检索意义。今天利用数据库或网络进行文献检索的情报用户,几乎很少使用分类语言检索,而主要使用主题语言进行标引和检索。分类语言受到情报用户冷遇主要有以下原因:

1)先组式检索语言的局限性。由于分类语言采取的是由符号系列构建的知识树表达模式,这种模式决定了它的表达方式是先组式的,对于不断涌现的新知识,尤其是交叉学科与边缘学科的新知识,其符号表述的混乱就在所难免。

2)《中国图书馆分类法》的先天的缺陷。与DDC和UDC相比,《中国图书馆分类法》的五部分类系统是一个退步,尽管在第四、第五版中对这部有着浓厚政治因素的分类法予以大力纠正,但仍然难以解决其主导思想所带来的混乱,反而使各修订版本之间的承接性出现偏差,特别是在A、B、D三大类中表现得尤其突出。

3)作者与读者分类知识不足易造成误标与误检。大量的文献分类代码的误标,说明作者分类知识的不足;另一方面,多主题的文献标引缺乏合理的分类号组配,造成以分类号检索文献的漏检。对于作者和读者来说,将主题检索词转化为分类检索词一是要借助工具,二是要耗费时间,同时也会产生误差,这都会影响检索效率。所以,对于期刊文献的检索项著录,分类号标引越来越如同鸡肋。

目前,人们主要通过主题词检索来获取科技文献。而科技文献中的主题词作为规范处理的科技术语所构成的检索符号更容易为科技人员所理解和掌握,科技文献中的题名、摘要和关键词都是作者利用学科术语对文献主题思想的不同反映。而这些学科术语,则转化成了最适合计算机系统检索的叙词。因此,合理处置主题词语言,使之成为文献的题名、摘要和关键词要素是提高科技文献检索效率的关键。

在主题语言的成员中,传统的标题词与单元词语法与词法僵化,已不适用于多变灵活的基于字符串的计算机检索。而叙词更接近于科技术语,少有语法与词法的限制,易为科技人员自觉地接受。所以,对文献采取叙词化的主题描述更容易反映作者的主题思想,也更容易建立起作者与读者间的对话通道,提高检索效率。

2 叙词在科技文献题名中的合理使用

拟定科技文献题名的最基本原则是平实、严谨、便于检索,而便于检索的最基本要求是叙词表述正确而规范。中国科学技术期刊编辑学会的《科学技术期刊编辑教程》一书中,对题名的要求是:题名应简短,题名用字不宜超过20个汉字,外文题名不超过10个实词。题名应尽量避免使用化学结构式、数学公式、不太为同行所熟悉的符号、简称、缩写以及商品名称等。而这一规范在实际操作中往往得不到重视。

如某刊近期的一篇科技论文《钙钛矿BaBO3(B=Ti,Fe,Co,Ni)密度泛涵理论研究》中的BaBO3(B=Ti,Fe,Co,Ni)作为化学通式,既没有揭示主题的意义,也没有检索意义。通常没有人会将化学分子式作为检索词,氧元素化学符号下的下角标在机检对话框中也无法体现其意义。而将“钙钛矿BaBO3(B=Ti,Fe,Co,Ni)”用叙词“钡基钙钛矿”表示,题名改为《多种钡基钙钛矿密度泛涵理论研究》则更符合检索要求。

造成题名标引错误的另一个重要原因是主题概念的误用。以该刊的文章《磁场中关于电流元之间相互作用是否满足牛顿第三定律的讨论》为例,这篇文章的题名远远超过了20个汉字,给读者阅读和编辑排版带来困难,另一个重要问题是主题概念存在严重的误用。首先,电流元并非客观事物,而是物理学中很短一段通电导线中的电流I与导线长度dL 的乘积,作为一个物理量的电流元,与另一个物理量电流元,是不可能存在相互作用的。而“相互作用是否满足牛顿第三定律的讨论”意思是“相互作用是否满足相互作用定律的讨论”,存在明显的“同意反复”逻辑错误。该论文摘要如下:

例1 用两个运动的带电粒子代替电流元,且忽略库仑场和涡旋场,只考虑磁场相互作用,根据磁感应强度和磁矢势推导出两电流元服从牛顿第三定律的一个充分条件,从而得出在非稳恒情形下运动电荷与电磁场一起的总动量和总角动量是守恒的。

从摘要中可知,作者意图表述的是两个运动电荷在磁场中,在忽略库仑场和涡旋场情况下,相互作用服从牛顿第三定律的充分条件,而对于已经成为公理的动量守恒的推导则无疑是画蛇添足。

从这一摘要中提取相关主题词:运动电荷(不是电流元),磁场,作用力,牛顿第三定律。文章的题名于是可以更正为:磁场中运动电荷间作用力的牛顿第三定律验证。

同理,另一篇论文题名长达30个汉字的《基于自然边界归化的椭圆外区域各向异性问题的重叠型区域分解算法》,其摘要为:

例2 以Helmholtz方程为例,基于坐标变换及自然边界归化理论,提出了一种带圆型人工边界的重叠型区域分解算法。构造其算法并讨论其相应的收敛性。证明了算法是几何收敛的。

从中提取的主题词是:坐标变换,自然边界归化理论,人工边界,区域分解算法,收敛性。文章的题名于是可以更正为:一种人工边界的区域分解算法及其收敛性证明。

3 叙词在科技文献摘要中的合理使用

GB 6447-86《文摘编写规则》规定:摘要是以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。摘要主要功能一是向读者介绍文献的主要内容,二是为情报用户提供更全面的检索标识符号。摘要的检索功能随着文献的数字化而增强。相对于题名和关键词,摘要包含更多的信息量,故能更准确、更全面地反映文献的主题思想,同时也能提供更广泛的检索入口。

学术论文的摘要基本上可分为3类:指示性文摘、报道性文摘与评论性文摘。指示性文摘对原始文献作简单叙述,是指明一次文献的论题及研究内容、取得的成果的性质和水平的简要说明,以帮助读者确定是否需要阅读原始文献,起到检索作用。科技文献以指示性文摘居多。指示性文摘要具有浓缩性、客观准确性和完整独立性,这需要通过准确选择与合理搭配主题词来实现的。如此,准确的利用规范叙词是撰写合格文摘的根本保证。

摘要是文章的精炼提要,合格的摘要应该是对文章内容的简明扼要的概述,要对文章创见性的观念、结论予以全面的揭示。

由例1可以看到,作者在忽略以速度v 两个运动电荷q的库仑场和涡旋场的前提下,得出总正则能量和动力动量守恒的结论,推导出满足这一要求的必要条件与充分条件并找出服从与不服从牛顿第三定律的两个特例得出在恒定条件理电磁场的却是和角动量守恒,满足牛顿第三定律的结论,而在非恒定条件下却是与角动量随时间变化,不满足牛顿第三定律的结论。指出运动电荷在磁场中服从牛顿第三定律的物理意义。

将上面对文章的描述中的主题词转换为叙词,并去除无检索意义的数学版式,按照文摘的写作规则,例1可修正为:

在忽略库仑场和涡旋场的前提下,推导出两个运动电荷在磁场中的总正则能量和动力动量守恒的结论,和满足这一要求的必要条件与充分条件,找出服从与不服从牛顿第三定律的两个特例。得出在恒定条件理电磁场的却是和角动量守恒,满足牛顿第三定律的结论,而在非恒定条件下却是与角动量随时间变化,不满足牛顿第三定律的结论。指出运动电荷在磁场中服从牛顿第三定律的物理意义。

4 关键词的叙词化处理

关键词是科技论文的一个重要著录款项。在数字化检索中,关键词是重要的入口,关键词的叙词化无疑是提高检索效率的有效手段之一。传统的科技文献著录要求给出3到5个关键词,这是限于印刷目录卡片的信息容量而设计的。但对于数字化文献而言,并不存在信息容量的问题,对于一篇多元复合主题的科技文献来说,少于5到8个主题词是很能描述文献主题思想的。

纸质文献主题词遴选的原则是主题词规范化、标引深度适中。所谓的主题词规范化,就是根据专指性原则,首选主题词表已有的先组主题词;对于主题过于专指,词表中既无专指主题词,又无法组配标引的采用靠词标引;对于没有相近主题词的选用最直接的上位主题词标引;对于多元或复合主题的采用主题词交叉组配与主题词-副题词组配的方式来标引。

例如,上位词:甲基莲心碱→生物碱类;近义词:上消化道出血→胃肠出血;主题词交叉组配:胃溃疡出血→消化的溃疡出血+胃溃疡等。

但对于惯于使用计算机检索的中青年科技工作者来说,传统的标题词框架的主题词检索已由以叙词为核心的主题词检索所代替。而由于叙词中存在大量的代用词、相关词和近义词,作者与读者在标引与检索时很有可能出现肩偏差,这就要求作者采用尽可能多的词汇进行标引,概念的内涵尽可能大,代用词、相关词和近义词尽可能全。

对于例1,考虑到读者在检索时可能出现的规范化与专指度不够的问题,在正式叙词之外应该添加其代用词和上位词,于是有关键词:运动电荷,电流元,磁场力,洛沦兹力,电场力,库仑力,正则能量,角动量守恒,牛顿第三定律,作用力与反作用定律。

在数字化检索的环境下,对于叙词的选词,应本着标引字符串尽可能覆盖检索字符串的原则,这样才能保证检索人在给出专指度不够高的检索词的情况下仍然能获得理想的检索结果。

5 结语

数字化文献的检索方式和检索习惯已经完全颠覆了传统的模式,文献的生产方(作者)与利用方(读者)之间,通过更接近自然语言的叙词交流实现情报传递。生产方为达到传递的准确性,利用方为达到获取的全面性,必须要为对方着想,而对于生产方,为利用方提供通畅的检索渠道显得更为重要。

[1]戴剑波.叙词在网络环境中的应用[J].情报科学,2004(4):502-505.

[2]陈立华.从叙词语言与自然语言的结合看后控制问题[J].情报杂志,2003(8):57-58.

[3]马建平,李伏秀.浅析文献叙词与关键词的标引方法[J].情报探索,2010(11):36-38.

[4]王王君.关于《中国图书馆分类法》第五版编制问题的研究[J].新世纪图书馆,2010(6):32-33.

[5]陈立红.对《中国图书馆分类法》(第5版)有关问题的探讨[J].科技情报开发与经济,2011(13):113-115.

[6]洪漪.汉语叙词语言的兼容问题研究[J].图书情报知识,1988(2):49-51.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!