时间:2024-08-31
张莹
(常州大学经济管理学院 常州 213164)
三大全文数据库收录质量类期刊的比较分析
张莹
(常州大学经济管理学院 常州 213164)
从期刊种类、收录完整性、时效性、期刊影响因子、发文量和总被引频次五个方面,对国内三大全文数据库(中国知网、万方数据、重庆维普)所收录的质量类期刊进行调查、统计和比较,为用户获取与利用国内质量类的学术资源提供参考与帮助,同时有助于全文数据库的评价。
全文数据库 中国知网 万方数据 重庆维普 质量类期刊 评价
全文数据库是广大学者获取学术资源最重要的来源之一。我国主要有三大全文数据库:中国知网、万方数据和重庆维普,收录文献类型包括期刊、博硕论文、会议论文、报纸等。根据各文献数据库官方网站提供的信息,中国知网(http://www.cnki.net/)的中国学术期刊网络出版总库(简称CAJD)是目前世界上最大的连续动态更新的中国学术期刊全文数据库,截至2012年10月收录国内学术期刊7 900余种,其中创刊至1993年3 500余种,1994年至今7 700余种,全文文献总量3 500万篇[1]。万方数据知识服务平台(http://www.wanfangdata.com.cn/)的学术期刊数据库是全文资源,收录自1998年以来国内出版的各类期刊7 000千余种,其中核心期刊2 800余种,论文总数量近2千万篇[2]。重庆维普资讯有限公司(http://www.cqvip.com/)成立于1989年,是中国第一家进行中文期刊数据库研究的机构,其全文期刊数据库名称是中文科技期刊数据库(全文版),收录中文期刊12 000余种,全文3 000余万篇,引文4 000余万条[3]。
笔者于2013年11月通过网络调研,对这三大全文数据库收录的质量类期刊进行统计调查、比较与分析,为用户选择、使用、开发电子资源、办刊等提供一些参考,同时也可以通过质量类刊物的情况分析对比,对三大全文数据库进行评价。
2.1 期刊种类比较
笔者通过访问中国知网、万方数据和重庆维普这三大数据库平台的期刊论文数据库,选择检索入口“刊名”、用检索词“质量”进行检索。同时,考虑到三大数据库的分类导航无法检全质量类的期刊,因此,为避免遗漏,笔者还辅之以互联网搜索引擎百度[4]检索,补充通过刊名检索或分类导航遗漏的刊物。两者相结合,调研数据库收录质量管理类期刊情况,
检索结果如表1所示。为方便起见,后文的数据库一律使用简称:CNKI、万方、维普。
表1 三大全文数据库收录质量类期刊种类统计表
根据表1,统计分析如下:
(1)刊物中有现刊、停刊和修改刊名等情况。三大库用检索词“质量”检索刊名得到的期刊检索数量分别为:CNKI37种、万方47种、维普75种;现刊数量是检索刊数与实际浏览查询到的期刊数量的集合。实际上三大全文库收录的质量期刊现刊数量为:CNKI37种、万方34种、维普37种;与用刊名检索的数量不同。三大库收录的现刊数量相近,而停刊数量差别比较大,CNKI停刊8种、万方停刊4种、维普停刊25个;特别是维普收录有19种刊物,是仅仅收录了期刊名称和更改了刊物名称的期刊,其中原因可能是在1989年开始建设文献数据库的时候是《中文科技期刊篇名数据库》收录的篇名与全文没有区分。
(2)三大全文库收录率和重复率。三大库实际共收录质量类期刊刊数84个,其中现刊38个、停刊27个、其它19个(改变刊物名称或在维普期刊大全中有刊名但是没有收录刊物文章)。现刊收录率:CNKI为97.37%、万方为89.47%、维普为97.37%;实际总收录率(包含过刊、停刊):CNKI为53.57%、万方数据为52.38%、重庆维普为96.43%;三大库完全重复收录的同样刊名的期刊数量为32种,在被查的84种质量期刊中重复率为38.1%,在38种现刊中重复率为84.21%;也就是说,有84.21%的现刊在三大库中都可以查到。虽然三大全文数据库中质量类现刊数量上差别不太大,但是在期刊收录的连续性和完整性方面有差别,见下文2.2节。
2.2 期刊完整性比较
根据中国知网的期刊影响因子评价,从质量类期刊中选择期刊综合影响因子排名前十位的期刊为调查样本,调查样本占全部质量类期刊现刊的1/4,能够反映出质量类期刊在三大文献数据库中存在的问题。调查指标为文献数据库收录期刊的收录范围。
表2 三大全文数据库收录质量类期刊的完整性调查
调查数据分析如下:
(1)收录的完整性。在这10种期刊样本中,从期刊创刊年开始收录的杂志,CNKI有6种、万方仅2种、维普3种;CNKI收录比较完整、年代最久,万方收录的时间比较晚,文献数量最少。
(2)收录的连续性。除了收录的年份不同、文献的数量不同以外,在收录范围之内存在缺少刊期、收录不连续的情况。例如:《中国卫生质量管理》杂志,CNKI在其收录范围1995~2013年之内缺刊期8本(1995-3/4,2000-3,2001-2/3/4/5/6)、万方数据从2003年开始收录,缺少8年的刊期(从创刊的1995年至2002年)、维普在其收录范围1995~2013年之内缺8期(1995-4,1999-3,2000-3,2001-2/3/4/5/6)。
表3 三大全文数据库收录质量类期刊的期差
2.3 期刊时效性比较
调查三大库收录最新刊期的情况,可反映出各个文献数据库的时效性,如表3所示。
据表3的调查统计,这10种期刊样本按出版频率,月刊有6种,双月刊有4种。同一期刊不同传播方式的时效性差异用期差表示。参考叶新明文[5],期差是指某个统计时间点不同出版或收录方式的同一期刊与其印刷型期刊出版期数之间的差值。期差为正数时,表示该出版或收录方式的期刊早于其印刷型期刊的出版;期差为零时,表示该出版或收录方式的期刊与其印刷型期刊的出版同步;期差为负数时,表示该出版或收录方式的期刊晚于印刷型期刊的出版。表3是在统计时间点(2013-11-29)的收录情况和期差信息。
期差情况分析:①没有期差大于0的情况,这说明我国三大期刊数据库的报道时效普遍落后于印刷型期刊;②期差等于0的情况(即数据库的报道时效与印刷型期刊同步),CNKI有3种,万方有4种,维普无,说明维普的时效性落后于CNKI和万方;③期差小于等于-1的情况,万方有8种,表明了万方收录速度与印刷型期刊保持同步或基本同步的期刊比例较高,因而时效性也较高;④期刊数据库的收录存在不确定或不稳定的情形,例如:《中国质量》在万方中最近的是2010年第12期、在维普中最近的是2011年第12期,出现中断收录的情况。
2.4 期刊影响因子比较
这三大全文数据库均有自建的期刊评价系统。CNKI在期刊入网主页提供“查看本刊出版统计报表”,可查看到网络出版文献量、复合影响因子、综合影响因子、总被引次数等指标,并建有《中国引文数据库》和《中国学术期刊影响因子年报》。万方在期刊入网主页提供“统计分析”,可查询到影响因子、发文量、总被引频次等指标,期刊指标年为2004~2011年,提供《中国期刊引证报告》期刊统计分析与评价。维普在期刊入网主页提供“引文评价”,可查看被引次数、影响因子、立即指数、发文量、被引半衰期、引用半衰期、期刊他引率、平均引文率,期刊指标年为2003~2011年。查询近两年的数据或某些统计指标,有权限限制。
影响因子是国际上通行的期刊评价指标,用以反映近年该期刊的学术影响力及其作用。从表4中可以发现,由于各个全文库期刊影响因子的来源数据不同,因此排序会有所不同,但没有比较严重错位的情况。《中国质量》有些特殊,在万方中的排名靠前,而在CNKI和维普中排名靠后。排序完全一致的有两种期刊。整体上看,各期刊在万方数据库中的期刊影响因子大于维普和CNKI。
2.5 发文量和总被引频次比较
表5中的发文量是统计期刊的年度发文量,总被引频次指统计期刊在创刊以来所登载的全部论文在统计当年被引用的总次数,可以一定程度上显示该期刊被使用和受重视的程度以及在学术交流中的作用和地位。从表5中可以发现,发文量与引文量之间不呈正相关。在发文量上,CNKI的全部发文量指标均大于万方和维普;在总被引次数上,万方优于CNKI和维普。发文量最大的CNKI引文量并不大。
表4 三大全文数据库收录质量类期刊的影响因子及排名比较
表5 三大全文数据库质量类期刊发文量和总被引频次比较
经过以上的调查分析,为提高质量类文献资源的利用率,在使用全文数据库时应注意以下情况:
(1)收录质量类期刊的种类。数据库中收录期刊的种类,往往成为用户选择使用数据库的重要因素。数据库中收录的质量类期刊,有现刊、有过刊、有停刊、有的是改换刊名,有的仅收录期刊名称而没有文章,有的收录全文、有的只有摘要、有的只有题录。另外,有的期刊名称中包含“标准化”,没有合计到本文中的质量类期刊里。
(2)期刊收录的系统性和完整性。文献数据库收录期刊缺年份分两种情况:一种是数据库没有从期刊创刊年开始收录,另外一种是对期刊的收录存在中断现象;严重地影响了收录的连续性和完整性,影响文献数据库的质量。在网络出版中出现未收录刊期,原因可能有未授权/保密,或者由于时间久远,找不到原刊。在检索工作中,对于查新、查准、查全都有影响。在选择检索工具时,应该注意到这种情况。在CNKI的“期刊大全”中,在期刊入网主页中设置了收集期刊的超链接“本刊缺少以下刊期 欢迎作者或读者提供原文或线索,为共享学术文献作贡献”,可在线上传原刊电子版或留言提供线索。
(3)数据库的时效性。我国三大期刊全文数据库的报道时效普遍落后于印刷期刊,信息滞后。三大全文数据库之间存在差异,万方数据和CNKI时效性较高,维普时效性稍差。
(4)期刊评价与刊物质量问题。在期刊评价指标中,影响因子反映了论文的平均被引率,是能反映期刊相对学术水平和学术影响力的重要指标。影响因子适用于基础研究、应用研究、工作研究型期刊,而质量类期刊大多是不列入统计源的行业指导型期刊和技术应用型期刊,虽然质量类刊物的主办机构大多具有权威性,但是在期刊的评价中,质量类期刊的影响因子普遍比较低,这是质量类期刊无核心期刊的原因之一。
本文所选的三大全文数据库都是国内最具权威的全文数据库。通过调查和比较,我们发现,应该正确认识和选择全文数据库,不可主观地认为使用了期刊全文数据库就拥有了全部期刊文献,更不能因为购买了全文数据库就放松对印本期刊的收藏和管理,目前数字化期刊并没有完全替代印本期刊,三大期刊数据库的报道时效普遍落后于印刷期刊。有的期刊并没有被三大全文数据库收录,例如江苏省质量协会会刊《江苏质量》和浙江省质量技术监督局主办内部刊物《质量时刊》,CNKI和万方数据均没有收录,重庆维普中断收录。在调查期刊时我们还发现,在38种质量类现刊中,按出版地域分布,北京地区有26种,占68.42%,京外地区有12种,占31.58%,主办单位大多是国家级、省部级的单位,学科领域广泛,但办刊地域不广泛。
[1]中国知网——期刊大全[OL].[2013-11-20].http://www.cnki.net.
[2]万方数据知识服务平台——期刊[OL].[2013-11-20].http://www.wanfangdata.com.cn/ResourceDescription/Periodical.
[3]维普网——关于我们[OL].[2013-11-20].http://www.cqvip.com/corp/about.shtml
[4]百度[OL].[2013-11-20].http://www.baidu.com/.
[5]叶新明,陈益君.我国开放存取中文科技期刊与全文数据库期刊的时效性比较[J].大学图书馆学报,2011,29(1):31-35.
(责任编校 田丽丽)
A Comparative Analysis of the Quality Periodicals Collected by the Three National Full-text Databases
Zhang Ying
School of Economics and Management,Changzhou University,Changzhou 213164,China
With a view to offering reference and help to users while they access and use periodicals on quality and contributing to evaluating full-text databases at the same time,this article makes an investigation and analysis of the periodicals on quality included in the three full-text databases,namely CNKI,Wanfang Data and CQVIP,in the following aspects:types of the periodical,completeness of collection,timeliness,impact factor,number of published articles and their total citations.
full-text database;CNKI;Wanfang Data;CQVIP;periodical on quality;evaluation
G235
张 莹,女,1964年生,副教授,研究方向为信息组织与检索,发表论文10余篇。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!