当前位置:首页 期刊杂志

作者合著网络节点重要性评价指标的属性

时间:2024-08-31

, ,

合作研究能够将分散的知识和能力连接成新的思路和新的研究路径,简单地说,合作研究就是连接不同的人才共同进行科研生产[1]。自20世纪60年代以来,运用合著网络测量科研合作一直是一个重大课题[2]。

作者合著网络属于复杂网络,其研究方法一般是建立某一领域(如生物医学、化学和计算机科学等)的作者合著网络,分析网络的各种属性,如点度中心度、中间中心度、接近中心度和特征向量等,从而筛选出网络中的重要节点,确定该领域的重要科研人员及所属机构,同时发现合著网络中合作频繁的团体[3]。

近年来,合著网络研究逐渐成为复杂网络研究的热点。本文以传统文献计量学评价指标和合著网络评价指标为对象,通过研究作者发文量、被引量与合著网络节点重要性评价指标(点度中心度、中间中心度、接近中心度和特性向量中心度指标)之间的相关性,探索作者合著网络的结构与特征,以此发现作者合著网络节点重要性指标的评价意义。

1 数据来源与方法

1.1 数据来源

本文以2014年JCR中肿瘤学领域影响因子最高的3种期刊CA-ACancerJournalforClinicians,NatureReviewsCancer,LancetOncology在2012-2015年发表的研究论文为数据样本。

从检索角度看,由指定期刊获得文献数据能够有效避免主题词检索带来的漏检;从学科领域看,肿瘤学是发展比较成熟、覆盖面比较广的一个学科,其数据适用于分析作者发文量、被引率与合著网络节点分析指标之间的相关性研究。检索上述期刊2012-01-01至2015-08-11期间发表的论文,将文献类型限定为“article”、“review”、“proceedings paper”,最终得到905篇研究论文。

1.2 方法

1.2.1 原始数据处理

BICOMB是中国医科大学崔雷教授及其团队研发的一款书目共现分析系统,可对重要生物医学文献数据库(如PubMed、SCI、中国知网、万方等) 进行字段抽取、统计,对重要字段构建共现矩阵(如作者合著矩阵、论文同被引矩阵、主题词共现矩阵等)导入SPSS和UCINET等软件进行聚类分析和网络属性分析[4]。本文利用BICOMB 2.01 处理原始数据,统计作者字段,并构建作者共现矩阵。

1.2.2 构建作者合著网、计算网络节点属性指标

UCINET是由加州大学欧文(Irvine)分校的Linton Freeman教授编写的社会网络分析软件,包括大量的网络分析指标,如中心度分析、二方关系凝聚力测度、子群分析、因子分析[5],还提供数据转换和数据处理的工具,可以将图论程序转换成矩阵代数语言[6]。UCINET还集成了用于一维与二维数据分析的NetDraw和正在发展应用的三维展示分析软件Mage等,同时还集成了Pajek用于大型网络分析的Free应用软件程序,是一种功能强大的社会网络分析软件[7]。本文将作者共现矩阵导入 UCINET 6.186,绘制作者合著网络,并计算各个节点的点度中心度、中间中心度、接近中心度和特征向量中心度。

1.2.3 统计学处理

将分析数据导入SPSS 19.0,进行Spearman秩和相关分析,以P<0.01时为差异具有统计学意义。

2 结果与分析

2.1 作者合著论文及被引情况

2.1.1 作者合著论文情况

905篇论文中,61篇文献为独著,844篇文献(占93.26%)为合著(表1)。

其中主要为2-10人合著,也有更多人合著的情况;有2篇论文作者人数超过100,作者人数最多的文献共有302位作者。905篇论文共涉及7 815位作者,参与合著的作者达7 774人,占作者总数的99.48%。

表1 作者论文合著情况

本文对作者参与论文篇数作进一步统计。其中,参与1篇论文的作者6 474人,占82.84%;参与2-5篇论文的作者1 299人,占16.62%;参与6-9篇论文的作者37人,占0.47%;参与论文≥10篇的作者5人,占0.064%。参与论文≥8篇的13位高产作者见表2。

表2 参与论文篇数的高产作者

2.1.2 作者论文被引情况

作者论文被引频次是指作者参与的所有论文的被引频次之和。

论文累计被引频次超过10 000的有2位作者(表3),其中Jemal A参与论文的总被引频次高达13 677,位居第一;Siegel R参与论文的总被引次数为12 949,位列第二。

表3 作者论文被引频次

2.2 作者合著网络图谱

将作者共现矩阵导入UCINET 6.186,绘制作者合著网络,并计算各个节点的点度中心度、中间中心度、接近中心度和特征向量中心度。其中,点度中心度是指与该节点直接相连的邻居节点的数目, 直接反映网络中一个节点对其他节点的影响力,度值较高的节点在维持网络结构完整性上有重要意义;中间中心度是指网络中所有节点对的最短路径之中经过该节点的数量占所有节点对最短路径数量的比例,通过中间中心度可以准确找到网络中某些“流量”非常大的重要节点[8];接近中心度是指节点到网络中所有其他节点的最短路径之和,反映节点在网络中居于中心的程度[9],网络中较短的距离意味着更少的消息传递时间和花费[10];特征向量中心度是指把复杂网络中单个个体的影响力看作是其他所有成员影响力的线性组合,因而得到一个线性方程组,该方程组最大的特征值所对应的特征向量即为每个节点的重要性指标,就是一个个体具有与高特征向量中心度的个体相连的程度[11]。本文共涉及7 815名作者,数量庞大。为了得到更好、更清晰的合著网络图,同时为了更好地表现和分析合著者之间的合作关系,本文绘制了参与合著论文≥2篇的1 341位作者的合作图(图1),图中节点的大小代表节点的度数。

图1 作者合著网络图

如图1所示,作者合著网络图中节点的点度中心度最大为436,最小为0,整个图的中心势为3.7%;节点中间中心度最大为51 000.816,最小为0,图的中间中心势为5.48%;节点接近中心度最大为1 795 600.000,最小为66 959.000,因为本图为非连通图,故无法计算图的接近中心势;节点特征向量中心度最大为25.916,最小为-0.000,图的特征向量中心势为25.52%。

2.3 作者发文、被引频次与网络评价指标的相关性

2.3.1 作者发文与网络评价指标的相关性

我们利用UCINET绘制出作者合著网络图,并通过Network-centrality,分别计算出作者合著网络各个节点的点度中心度、中间中心度、接近中心度和特征向量中心度等属性指标。

作者发文量≥8篇的作者及其网络评价指标见表4。

表4 高产作者的发文量与网络评价指标

本文所指的“发文量”是指作者独著或合著论文的总量。

以参与论文≥2篇的1 341条作者数据为基础,利用SPSS 19.0计算出作者发文量与点度中心度、中间中心度、接近中心度和特征向量中心度的相关性,分析结果见表5。

表5 作者发文量与网络评价指标相关性

由表5可知,发文量与点度中心度、中间中心度、接近中心度和特征向量中心度的P值<0.01,差异具有统计学意义,可认为作者发文量与4个网络指标之间具有相关性。其中发文量与点度中心度、中间中心度和特征向量中心度呈正相关关系,作者发文量与接近中心度呈负相关关系。

2.3.2 作者论文被引频次与网络评价指标相关性

作者论文被引频次是指作者参与的所有论文的被引频次之和。论文被引频次大于900的前10位作者见表6。

表6 作者论文被引频次与网络评价指标

统计参与论文≥2篇的1 341位作者的论文被引频次、点度中心度、中间中心度、接近中心度和特征向量中心度,数据导入SPSS,分析作者论文被引频次与4个网络节点评价指标值的相关性,结果见表7。

表7 作者论文被引频次与网络评价指标相关性

由表7可知,作者论文被引频次与点度中心度、中间中心度、接近中心度和特征向量中心度存在相关性P<0.01,具有统计学意义。其中作者论文被引频次与点度中心度、中间中心度和特征向量中心度呈正相关关系,作者发文量与接近中心度呈负相关。

3 结论

以上统计分析发现,905篇研究论文中,93.26%的论文是由2位及以上作者合作完成的,而且99.48%的作者与其他作者有过合作,论文合著率和作者合作率都比较高,说明肿瘤学领域研究人员知识交流活跃,新成果分享频繁,这有利于该领域学术知识合作范围的扩大、学术水平的提高以及研究领域的拓展成熟。

通过相关性分析发现,作者发文量、被引频次与4个网络指标之间有相关性。其中发文量、被引频次与点度中心度、中间中心度和特征向量中心度呈正相关关系,即作者发文量或被引频次越高,其在合著网络中的点度中心度、中间中心度和特征向量中心度3个指标值也高。

点度中心度高说明发文越多或论文被引频次越高的作者,与其合作的作者也越多,在合著网络中表现为与该作者节点直接相连的邻居作者数目越多,对其他作者节点的影响也越大,反映了其对维护网络结构完整性上有重要意义;中间中心度高说明发文越多或论文被引频次越高的作者在合著网络中表现为该作者处于许多作者交往的最短路径之上,具有控制其他作者合作的能力,反映了该作者在网络中的重要地位;特征向量中心度高说明发文越多或者论文被引频次越高的作者在该领域的人气程度也越高,与高特征向量中心度作者合作的机会越大,在网络中表现为该节点对网络的影响也越大。相关性分析还发现,作者发文量、论文被引频次与接近中心度呈负相关关系。

作者接近中心度越低,则到达其他所有作者的距离越短,即处于合著网络中心位置,与其他作者越容易发生合作,故该作者的发文量会越高,论文被引的机率也越高。

本文通过分析作者发文量、被引量与合著网络节点重要性评价指标之间的相关性,找到传统文献计量学指标与网络指标的具体联系,以此发现合著网络节点重要性指标的具体评价意义,使合著网络节点重要性评价指标更具针对性,更有助于理解网络中不同位置的节点所蕴含的信息。本文结果可能会受所选学科领域、时间跨度等因素影响,未来应拓展至其他学科领域进行深入对照研究,得出更客观完善的结果。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!