当前位置:首页 期刊杂志

冠状病毒研究的文献计量学分析

时间:2024-07-28

陈静飞,王怀璋,高文博,陈耕耘,梁婷*

1解放军陆军防化学院,北京 102205;2解放军32169部队,西藏林芝 860000;3四川省地震局,成都 610000

近年来,随着全球冠状病毒疫情多次暴发[1-2],科研人员对冠状病毒的研究也随之增多。2019年底,中国湖北省武汉市暴发了一种以新型冠状病毒(SARS-CoV-2)为病原的肺炎(corona virus disease 2019,COVID-19)疫情[3];为尽快控制疫情,各地科研人员对SARS-CoV-2展开了相关研究[4]。文献计量学是一种对某学科领域的文献进行分析,评估一段时间内研究活动趋势的研究方法。为了全面了解冠状病毒的研究状态,并为后期冠状病毒的研究者提供直观明了的参考依据,本研究运用文献计量学、可视化等方法对冠状病毒的研究结果进行系统整理,并分析冠状病毒在全球的研究情况,以期为当前乃至今后研究冠状病毒提供帮助。

1 资料与方法

1.1 数据来源 在Web of Science(以下简称WoS)文献检索平台,选择WoS核心合集,检索主题:Coronavirus;时间跨度:1968-2019;索引:SCI-EXPANDED、SSCI、A&HCI、CPCI-S、CPCI-SSH、BKCI-S、BKCI-SSH、ESCI、CCREXPANDED及IC。共检索到13 959篇文献,其中论文(Article)11 242篇,综述(Review)1198篇,其他类型(Other types)1519篇(图1)。本研究使用的数据集包括所有文献类型,为避免跨学科文献的丢失,未对文献来源进行精简。

图1 冠状病毒相关文献类型分布(1968-2019年)Fig.1 Distribution of document type related to coronavirus (1968 to 2019)

1.2 方法 所有数据均独立收集,并以TXT格式下载。将数据导入Microsoft Excel 2019和CiteSpace 5.5.R2软件(由美国Drexel大学陈超美教授基于Java开发的程序[5])进行定性和定量分析。运用Microsoft Excel 2019软件对文献类型分布、年度发表文献数量趋势进行分析;运用CiteSpace 5.5.R2软件确定国家、机构之间的合作关系,描绘期刊、研究者共引关系,进行文献共引分析及关键词突现分析,并将上述所有项目进行可视化呈现。

2 结 果

2.1 每年度发表文献 1968-2019年每年度发表文献数量分布如图2所示:第1篇与冠状病毒相关的文献发表于1968年;年度发文量出现了2个波峰,第1个波峰在2004年,即中国严重急性呼吸综合征(severe acute respiratory syndrome,SARS)暴发的第2年;第2个波峰在2016年,即中东呼吸综合征(Middle East respiratory syndrome,MERS)暴发之后。

2.2 国家合作网络 统计结果显示,全球有138个国家/地区发表了13 959篇冠状病毒相关文献。将1968-2019年所有文献加载至CiteSpace 5.5.R2软件生成国家合作网络图谱,结果显示其由121个网络节点和952条连接线组成,如图3所示,表明研究冠状病毒的国家/地区之间进行了紧密合作。

统计排名得出发表冠状病毒相关文献数量最多的10个国家(表1)。其中美国(USA,4698篇)贡献最大,其次是中国(China,2660篇)、德国(Germany,857篇)、英格兰(England,805篇)和荷兰(the Netherlands,738篇)。中心性数值显示,西方国家与其他国家建立的合作关系较紧密,如美国(0.38)、英格兰(0.23)、荷兰(0.23)和德国(0.19);亚洲国家与其他国家之间建立的合作关系较薄弱,如中国(0.09)、日本(0.09)、沙特阿拉伯(0.03)和韩国(0.00)。

表1 发表冠状病毒相关文献数量最多的10个国家Tab.1 The top 10 countries contributed to publications of coronavirus-related literature

图2 冠状病毒相关文献发表年份分布(1968-2019年)Fig.2 Annual distribution of published coronavirus-related literature (1968 to 2019)

图3 参与冠状病毒研究的国家/地区网络图谱Fig.3 Network map of countries/regions engaged in coronavirus research

2.3 机构合作网络 统计结果显示,全球有7119个机构发表了13 959篇冠状病毒相关文献。将1968-2019年所有文献加载至CiteSpace 5.5.R2软件生成机构合作网络,结果显示其由1473个网络节点和8567条连接线组成,如图4所示,表明研究冠状病毒的机构之间进行了广泛合作。与国家间合作相比,机构间的合作亦同样紧密。

图4 参与冠状病毒研究的机构网络图谱Fig.4 Network map of the institutions engaged in coronavirus research

统计排名得出发表冠状病毒相关文献数量最多的10个机构(表2)。其中香港大学(Univ Hong Kong,511篇)贡献最大,其次是中国科学院(Chinese Acad Sci,354篇)、乌得勒支大学(Univ Utrecht,216篇)、香港中文大学(Chinese Univ Hong Kong,215篇)和美国疾病控制与预防中心(Ctr Dis Control Prevent,214篇)。中心性数值显示,香港大学与其他机构建立的合作关系最为紧密。

表2 发表冠状病毒相关文献数量最多的10个机构Tab.2 The top 10 institutions contributed the most publications of coronavirus-related literature

2.4 期刊发文量与期刊共引 统计结果显示,有2048种学术期刊发表了13 959篇冠状病毒相关文献。在发表文献数量前10名的期刊中(表3),《病毒学杂志》(Journal of Virology,1166篇,8.35%)发表文献数量最多,然后是《病毒学》(Virology,516篇,3.70%)、《实验医学与生物学进展》(Advances in Experimental Medicine and Biology,371篇,2.66%)、《普通病毒学杂志》(Journal of General Virology,338篇,2.42%)和《病毒学档案》(Archives of Virology,271篇,1.94%)。

选取1968-2019年每一年中被引次数最高的前100篇文献,加载至CiteSpace 5.5.R2软件后生成期刊共引网络,结果显示其由291个网络节点和2294条连接线组成,如图5所示,表明发表冠状病毒相关文献的期刊之间存在广泛的引用关系。

表3 发表文献数量最多的10种期刊Tab.3 The top 10 journals with most published literature

图5 期刊共引网络的可视化图谱Fig.5 Visualized map of the journal co-citation network

在期刊共引前10名中(表4),影响因子(IF 2019)为4.324的《病毒学杂志》在冠状病毒研究方面的被引频率最高,然后是《病毒学》《美国科学学院学报》《普通病毒学杂志》和《科学》。

表4 共引次数最多的10种期刊Tab.4 Top 10 journals with most cited count

2.5 研究者发文量与研究者共引 统计结果显示,共有35 039名研究者参与了冠状病毒相关研究。研究者发表文献的数量(表5),Yuen KY排在第一位(216篇),然后是Perlman S(187篇)、Enjuanes L(176篇)、Baric RS(171篇)和Weiss SR(150篇)。

表5 发表文献数量最多的10名研究者Tab.5 The top 10 researchers with most published literature

选取1968-2019年每一年中被引次数最高的前100篇文献,加载至CiteSpace 5.5.R2软件生成研究者共引网络,结果显示其由943个网络节点和7971条连接线组成,如图6所示,表明冠状病毒研究者之间存在广泛的引用关系。

在研究者共引前10名中(表6),Peiris JSM被引频率最高,其次是Drosten C、Ksiazek TG、Woo PCY和Lai MMC。

图6 研究者共引网络的可视化图谱Fig.6 Visualized map of the researchers co-citation network

表6 共引次数最多的10名研究者Tab.6 The top 10 researchers with most co-citation count

2.6 文献共引分析 选取2010-2019年每一年中被引次数最高的前100篇文献,构建当年的共被引网络,将每年的共被引网络合成,得到文献共引网络图谱(图7)。该图谱由452个网络节点、2400条连接线和12个主要聚类组成。

12个主要聚类详细信息中(表7),最大的聚类#0被标记为“MERS-CoV感染(MERS-CoV infection)”;轮廓值最高的聚类#8被标记为“流行性腹泻病毒(epidemic diarrhea virus)”;时间最晚的聚类#13被标记为“中国西南(southwestern China)”。

2.7 关键词分析 选取2015-2019年每一年中被引次数最高的前100篇文献突现关键词,加载至CiteSpace 5.5.R2软件生成突现关键词图谱(图8)。该图谱由156个网络节点、1046条连接线和19个突现关键词组成。

图7 冠状病毒相关文献共引网络图谱(2010-2019年)Fig.7 Co-citation network map of coronavirus-related literature (2010 to 2019)

表7 冠状病毒相关文献共引聚类Tab.7 Co-citation cluster of coronavirus-related literature

图8 冠状病毒相关文献中突现关键词网络图谱(2015-2019年)Fig.8 Network map of burst keywords from publications of coronavirus research (2015 to 2019)

19个突现关键词详细信息如表8所示,在2019年仍然有10个突现关键词,按照突现强度排列依次为:“SARS冠状病毒(SARS-CoV,8.3124)”“传染病(infectious disease,8.0148)”“冠状病毒S蛋白(coronavirus spike protein,7.1222)”“核因子κB(NF-kappa B,7.1222)”“中国(China,7.1015)”“单克隆抗体(monoclonal antibody,5.0540)”“MERS病毒感染(MERS-CoV infection,4.2241)”“遗传多样性(genetic diversity,3.9357)”“猫(cat,3.3408)”和“埃博拉病毒(Ebola virus,3.2633)”。

3 讨 论

3.1 一般数据 根据每年度文献发表数量,目前可将冠状病毒研究分为3个阶段。第1阶段(1968-2003年)可视为冠状病毒研究的初始阶段,该阶段相关文献的数量增长缓慢。第2阶段(2004-2012年)冠状病毒相关文献数量随SARS暴发急剧增加,随后略微回跌,但文献数量仍多于第1阶段。该阶段可视为冠状病毒研究的第1个黄金发展时期。第3阶段(2013-2019年)冠状病毒相关文献数量随MERS出现快速增加,该阶段可视为冠状病毒研究的第2个黄金发展时期。由此,笔者预计,2019年的这次COVID-19疫情暴发后会迎来冠状病毒研究的又一个黄金时期。

表8 19个突现关键词(2015-2019年)Tab.8 Top 19 burst keywords (2015 to 2019)

在发表文献数量前10名的国家中(亚洲4个国家、欧洲4个国家、北美洲2个国家),美国排名第一,中国排名第二且是唯一一个发展中国家。香港大学是发表文献最多的机构,亦是与其他机构建立合作关系最为紧密的机构。发表文献数量前10名的期刊合计发表文献数量占总量的26.95%,但仅《新发传染病》(Emerging Infectious Diseases,IF2019为7.185)影响因子超过5.000,其余期刊影响因子为1.000~5.000,表明研究者在高影响因子期刊上发表冠状病毒相关文献具有挑战性。

3.2 共引数据 在发表文献数量前10名的研究者中,每名研究者发表的文献≥119篇。因此,他们可被认定为“高产研究者”。然而,这些高产研究者中仅有3名进入共引次数前10名。

在研究者共引中,Peiris JSM提出了冠状病毒可能是导致SARS的原因[6];Drosten C报告了利用细胞培养和分子技术从SARS患者的临床标本中完成了新型冠状病毒的鉴定[7];Ksiazek TG明确提出新型冠状病毒在SARS中具有致病作用,并命名了第1个与SARS相关的冠状病毒分离株[8]。虽然这些研究者中仅Drosten C属于高产研究者,但其余非高产研究者对冠状病毒研究亦做出了重要贡献。

根据文献共引分析得到的文献共被引聚类中,时间最晚(2015年)的聚类#13(Southwestern China)引起了笔者的注意。该聚类中排名第一的文献题为《在中国西南地区少量马蹄蝙蝠中发现的新冠状病毒和遗传分析》[9],明确提出马蹄蝙蝠携带着遗传上类似SARS的冠状病毒。由于蝙蝠冠状病毒之间重组的可能性很高,将来可能会出现其他类似蝙蝠SARS的冠状病毒。为了更好地预测并预防蝙蝠起源的冠状病毒引起的疾病,有必要保持对蝙蝠冠状病毒的长期监测。值得一提的是,该聚类中另一篇文献《中国蝙蝠冠状病毒》由Fan等[10]于2019年3月发表于Viruses,指出很有可能未来的SARS或MERS样冠状病毒暴发将源于蝙蝠,且在中国发生的可能性更大。因此,关于蝙蝠冠状病毒的研究已成为检测预警信号的紧迫问题。结合当前的COVID-19疫情,笔者发现这两篇文献具有很强的前瞻性。但令人遗憾的是,这些文献提出的观点在当时并未引起足够的重视。

3.3 研究前沿 突现关键词提供了对研究前沿的合理预测[11]。通过检测突现关键词,可发现相关研究领域中发展迅速的课题[12]。本研究应用CiteSpace 5.5.R2软件锁定2015-2019年冠状病毒的研究前沿。按照突现强度排列,至2019年冠状病毒研究的三大前沿如下。①SARS-CoV:SARS于2002年底在中国首次发生,并扩散至东南亚乃至全球。SARS-CoV具有极强的传播力和较高的致死率。由于没有特定的抗病毒药物,SARS的救治给医护人员带来了难题,也给人类卫生安全带来了重大挑战。因此,有研究人员进行系统回顾,试图梳理出对抗新型冠状病毒的最新措施[1],总结冠状病毒的流行病学、病毒学、临床特征和最佳治疗策略[13]。而部分研究者致力于研究SARS-CoV的起源和演变,并强调为未来类似SARS样疾病的出现做好准备的必要性[14]。②传染病:在人满为患的急诊室中,患者所携带的MERS-CoV传播潜力增加[15],为全世界医疗机构预防和控制此类传染病增加了难度。研究表明,60%~80%的新出现的人类传染病(EID)源自野生生物[16]。Wu等[17]于2016年首次报道了许多新型蝙蝠病毒,并发现了一些与已知的人类或动物病原体密切相关的蝙蝠病毒。③冠状病毒S蛋白(coronavirus spike protein):冠状病毒进入细胞是由跨膜S糖蛋白介导的。Walls等[18]观察到了冠状病毒S蛋白三聚体的低温电子显微镜结构。Haagmans等[19]提出可用MERS-CoV S蛋白的改良痘苗病毒疫苗赋予单峰骆驼黏膜免疫力。Kirchdoerfer等[20]介绍了人冠状病毒S蛋白融合前的结构,为基于β-冠状病毒疫苗免疫原的结构设计奠定了基础。

本研究有助于研究者了解冠状病毒的研究趋势。美国、中国和德国是进行冠状病毒研究的主要国家;西方国家之间的合作较为紧密,特别是美国占主导地位。香港大学是发表冠状病毒相关文献最多的机构,亦是与其他机构建立合作关系最为紧密的机构。发表文献居前三位的期刊是《病毒学杂志》《病毒学》和《实验医学与生物学进展》。Peiris JSM、Drosten C和Ksiazek TG可能是冠状病毒研究领域合作的较好人选。SARS-CoV、传染病、冠状病毒S蛋白可能是研究前沿,相关研究可能在未来几年深入这些领域。

本研究从WoS核心数据库中检索和收集了冠状病毒相关文献的数据,数据分析较全面客观。WoS核心数据库可提供较为详细的数据(如国家和机构信息、期刊来源、作者信息等),研究者对此可有一个较全面的把握。然而,本研究仍存在一定的局限性:第一,该数据库中的大多数出版物是英文的,非英语文献很少;部分数据库(如PubMed、Scopus和Google Scholar)未进行分析。第二,分析软件可处理的数据类型有限,本研究仅选取WoS数据库中核心合集的文献作为数据来源,未来研究可进一步丰富数据来源。第三,本研究仅对1968-2019年的国际文献研究趋势与特点进行讨论,下一步研究可结合国内的冠状病毒研究做进一步分析和对比。第四,文献计量分析的结果与实际研究情况仍存在差异,因为近期发表的部分文献的引用率并不高。所有数据均于2020年2月2日检索,但未纳入2020年相关文献。尽管如此,本研究包含了1968年以来的绝大多数文献,少量新数据可能不会改变结论。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!