当前位置:首页 期刊杂志

基于CiteSpace知识图谱“健康中国”背景下健康大数据领域研究

时间:2024-05-13

李子俊

[摘要] 目的 基于CiteSpace軟件对选取的236篇相关文献进行可视化分析,通过了解在“健康中国”背景下健康大数据领域的研究现状、研究热点和发展趋势,为健康大数据领域的研究提供借鉴意义与展望。方法 选取中国知网(China National Knowledge Infrastructure,CNKI)数据库中2013–2022年以健康大数据为主题的236篇相关论文为数据样本,进行知识图谱可视化分析研究。结果 基于CiteSpace软件对所选取的236篇论文进行可视化分析,得出年度发文量总体呈上升趋势;关键词共现图谱中得出最高中介中心性(centrality=0.6)的关键词是大数据,形成云计算、健康医疗、医疗健康、健康、健康管理、区块链等6个聚类词;医疗健康是突现强度最高的关键词。结论 健康大数据领域的研究重点主要集中在大数据、医疗健康、应用与发展,人才培养和隐私保护方面的应用有待继续深入研究,筑牢“健康中国”之路。

[关键词] 健康中国;健康大数据;可视化图谱分析;CiteSpace

[中图分类号] R-05      [文献标识码] A      [DOI] 10.3969/j.issn.1673-9701.2023.24.015

Research on health big data in the context of “Healthy China” based on CiteSpace knowledge graph

LI Zijun

School of Public Health and Management, Guangzhou University of Chinese Medicine, Guangzhou 510006, Guangdong, China

[Abstract] Objective Based on the CiteSpace software, this study visualizes the analysis of 236 selected relevant literatures, aims to understand the current status, research hotspots and development trends of health big data in the context of “Healthy China”, and provides reference and future prospects for research in the field of health big data. Methods Totally 236 relevant journal papers with health big data as the theme from the China National Knowledge Infrastructure (CNKI) database from 2013 to 2022 were selected as the data sample and a knowledge map visualization analysis was conducted. Results Based on the visualization analysis of the 236 selected journal papers using CiteSpace software, the overall trend of the annual number of publications was increasing; The keywords with the highest intermediary centrality (centrality=0.6) in the co-occurrence graph of keywords were “big data”, forming 6 clusters of words, including cloud computing, health care, medical health, health, health management, and blockchain; Medical health was the keyword with the highest sudden strength. Conclusion The research focus in the field of health big data is mainly focused on big data, medical health, application and development, and the application research in personnel training and privacy protection still needs further research by scholars to secure the path of “Healthy China”.

[Key words] Healthy China; Health big data; Visualization map analysis; CiteSpace

现代科学技术的进步使医疗卫生进入新时代,大数据的整合在彻底改变健康信息的收集、分析和利用方式方面发挥至关重要的作用。基于“健康中国”的背景,研究者倡议改善医疗体系,因而健康大数据的研究变得越来越重要。本研究旨在深入了解“健康中国”背景下健康大数据领域的现状、热点和发展趋势。本研究利用CiteSpace软件对236篇相关文献进行可视化分析,旨在为该领域的研究提供有价值的见解和展望。

1  数据收集与研究方法

1.1  数据收集

本文所研究的相关期刊论文数据均从中国知网(China National Knowledge Infrastructure,CNKI)数据库进行精确检索,并采用期刊高级检索方法。笔者检索文献的主题词为“健康大数据”,文献的来源类别是北大中文核心期刊和中文社会科学引文索引(Chinese Social Science Citation Information,CSSCI)期刊,选取其中236篇有效文献,用Refworks格式下载,后续运用CiteSpace软件进行数据分析。文献检索的时间为2022年12月5日,所选取的期刊论文发表时间为2013–2022年,各年论文发表量见图1。在检索时间范围内,期刊论文发表量呈快速上升趋势,其中2020年发文量最多,达43篇。2013–2015年发文量均处于低位;从2015年后关于“健康大数据”的发文量呈现迅速增长趋势,2017年更是发文量的第二高峰,其原因是“健康中国”概念于2017年10月18日在中国共产党第十九次全国代表大会报告中首次提出,国民健康与卫生的观念逐渐普及,因此,引发大量学者深入研究[1]。

1.2  研究方法

本研究主要运用CiteSpace 6.1.R4可视化分析软件对所选取的236篇相关论文进行数据分析和展示,以期体现所选文献之间的关联度、规律性和分布情况,了解相关文献的发文作者和发文机构,充分展现在“健康中国”背景下健康大数据领域的研究热点和研究现状,从而进一步总结经验并提出健康大数据研究领域在未来的发展建议。

2  结果

2.1  作者数据

通过CiteSapce软件对所选取的236篇文献作者的数据进行可视化分析,得出作者节点数量n=229,各作者间连线E=206(密度=0.0079)的网络图谱(图2)。其中,关于健康大数据研究领域发表文献达到3篇及以上的作者有10位。陈敏、张学高、胡建平、李岳峰和其他作者共同为健康大数据研究领域作出具有重要借鉴意义的科研成果。陈敏在此期间以第一作者和第二作者发表论文6篇,主要注重大数据的应用、医疗健康大数据的发展现状、健康医疗大数据的开放管理等方面的研究[2-4]。

2.2  机构数据

以236篇文献为可视化分析数据样本,利用CiteSpace软件对在健康大数据研究领域发文的机构进行分析,见图3,华中科技大学同济医学院医药卫生管理学院发文量最多,达10篇;其次是国家卫生健康委员会统计信息中心,发文量为6篇。发文3~4篇的机构分别为合肥工业大学管理学院、上海健康医学院、中国医学科学院医学信息研究所、中国医学科学院北京协和医学院生物医学工程研究所和湖北省卫生健康委员会。其中,华中科技大学同济医学院医药卫生管理学院在卫生管理领域的众多科研成果被各级政府决策所采纳,为国家医疗卫生改革提供依据,形成较强的社会影响力,在健康大数据研究领域也作出巨大贡献。

2.3  关键词数据

2.3.1  关键词共现  关键词作为研究内容的核心,通过CiteSpace软件对236篇文献进行可视化分析,得出n=213,E=318(密度=0.0141)的关键词共现图谱(图4),圆圈越大的关键词,出现频次越高。对关键词进行排序,得出2013–2022年在健康大数据研究领域中介中心性达到0.02的前7位关键词排序表,见表1。其中,“大数据”出现的频数高达87次,中介中心性为0.60。综合来看,大数据、健康医疗、医疗健康、健康管理、应用等关键词出现频次较高,期刊论文主要注重对健康大数据的现状、处理、分析、应用与未来发展等研究。

2.3.2  关键词聚类  在关键词共现图谱的基础上,运用CiteSpace软件中的对数似然比(log-likelihood ratio,LLR)算法对关键词进行进一步聚类可视化分析,得出2013–2022年健康大数据研究领域关键词聚类图谱(图5)。通过对213个关键词节点分析,生成6个聚类团块,分别为#0云计算、#1健康医疗、#2医疗健康、#3健康、#4健康管理、#5区块链。由分析数据可见,模块化度量值(modularity)Q=0.63,模塊度大于0.3,加权平均聚类轮廓值(weighted mean silhouette)S=0.8736,加权平均聚类轮廓值大于0.7,聚类高效且结构显著。在关键词聚类的可视化分析图谱上进行相应分析,得出关键词聚类分析表(表2)。

2.3.3  关键词突现  除以上利用CiteSpace软件可视化分析获得的关键词共现和关键词聚类图谱外,笔者另外对关键词进行突现可视化分析,得出突现强度前13位的关键词,见图6。“医疗健康”和“数据挖掘”开始年份最早,随着互联网的发展,人们对移动设备和移动互联网有了更大的需求,因此,2014年开始,互联网医疗健康由大数据开启了新模式。随后,2016年开始,公共卫生和医疗卫生渐入人们的视野,2016年10月25日,中共中央、国务院印发了《“健康中国2030”规划纲要》[5],卫生与健康观念上升到国家战略层次。2019年,《“物联网+区块链”应用与发展白皮书》[6]将“大数据时代”推向高潮,“健康大数据”应运而生。

2.3.4  关键词时区  采用CiteSpace软件对健康大数据研究领域的关键词时区共现可视化分析图谱见图7。通过观察时间列表,发现2013–2015年大数据、医疗健康、健康、应用等关键词频发;2015–2020年,健康医疗、医疗卫生、健康管理、精准医疗等关键词开始涌现;2020–2022年,隐私保护、疫情防控、数据安全、数据治理等关键词凸显。

3  讨论

3.1  健康大数据领域研究现状

笔者利用CiteSpace软件对236篇论文进行可视化分析后,获得了中介中心性排名前7位的关键词,依次为大数据、健康医疗、医疗健康、健康管理、数据挖掘、应用和发展。对关键词进行聚类可视化分析得出6个聚类团块,分别为#0云计算、#1健康医疗、#2医疗健康、#3健康、#4健康管理、#5区块链。综合以上可视化分析结果,可以看出人们利用大数据、云计算、区块链、人工智能等互联网技术为医疗健康服务提供信息已成普遍现状。特别是基于“健康中国2030”的背景下,健康大数据主要集中在医疗健康领域,在科研、医疗数据分析、智慧医疗设备等方面取得较大进展。各地逐渐建立公共卫生、疾病预防、健康体检、卫生监督等数据中心,患者使用便携医疗设备也可向医疗机构提供健康医疗大数据。针对新型冠状病毒肺炎疫情,健康大数据也为疫情防控、远程医疗等提供有力的数据支撑[7]。当前我国健康大数据领域的现状为人口基础数据库建设取得新进展、居民健康档案和电子病历覆盖面显著提高、区域性健康医疗大数据初具雏形、非临床健康数据兴起及医院数字化加速推进等[8]。缩小少数群体健康差距一直是大数据科学的难题,美国等西方国家注重利用大数据以解决少数群体健康差距问题,主要研究通过纳入社会决定因素信息、提高服务不足人群的护理质量、改善公共卫生监测、了解病因并加以指导等方式进一步缩小群体间的健康差距[9]。在全球健康的大环境下,各国间的健康大数据更需要相互共享、相互交流,以促进全人类的健康。

3.2  健康大数据领域研究热点

3.2.1  临床诊疗健康大数据研究  临床诊疗的管理与决策是能精准分析包括患者体征、费用和疗效等数据在内的大型数据集,是可以帮助医生确定最有效和最具有成本效益的治疗方法的系统支持[10]。基于医疗数据驱动的临床决策支持是一个复杂问题,涉及数据来源、数据处理方法、决策模型和应用程序等多个方面。具体而言,从患者和医生两个角度出发,需要考虑患者与医生之间的交互关系,主要包括医疗信息和临床经验信息等,其中医生视角的临床决策支持更具有挑战性。目前,有研究表明临床决策支持系统能通过标准临床知识体系、临床路径指南、说明書及通用逻辑规则等,结合健康医疗大数据,在临床应用中为医务人员提供全面智能辅助决策支持,帮助医院杜绝诊疗风险,提升医疗质量,提高诊疗水平[11]。未来临床诊疗的管理与决策系统需要基于患者信息和临床数据对诊疗决策过程、医院管理系统性能进行优化。

3.2.2  公共卫生健康大数据研究  健康大数据是国家应对疫情的一种重要手段。通过依托大数据中心、公安局实现健康码、重点人群信息互通共享,建设“疫情监控平台”和“健康大数据疫情分析预警平台”,能够筑起事前、事中、事后“三早防线”,实施动态及追踪管理,实现精准防控和闭环管理[12]。此外,Dolley[13]认为利用健康大数据可提高公共卫生的精度,包括疾病监测、风险预测、有针对性的治疗干预和疾病研究。而风险因素的发现可以帮助制定预防疾病和人口行为改变的战略。因此,健康大数据将成为新时代公共卫生领域发展的重要推动力,可指导民众规避健康风险、预防疾病、提升生命质量[14]。

3.2.3  健康管理领域健康大数据研究  健康管理是指根据疾病的发生发展规律,对患者健康状况进行持续跟踪观察,并进行相应干预的一系列活动。随着大数据的出现和迅速发展,国家陆续出台《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》[15]等多个战略性文件,推动健康大数据在健康管理领域的迅速发展和全面深化,大数据与健康管理的结合应用迎来新的发展机遇[16]。目前,我国健康管理的发展主要集中在健康管理应用上,而如何利用大数据分析技术实现大数据健康管理是值得关注的课题。大多数慢性病可通过预防保健避免,通过早期发现得到有效控制,通过有效地信息沟通提高治疗效果[17]。国外的许多研究表明,移动健康应用程序在家庭自我健康管理中发挥重要作用,但与此同时,在考虑使用移动健康应用程序和管理健康行为时,个人的健康需求和负担能力也都有所差异[18]。因此,研究者可对如何实现应用健康医疗大数据平台落到实处并针对个体健康差异问题进行深度研究。

3.3  健康大数据领域研究趋势

基于“健康中国”背景下,健康大数据领域逐渐成为社会普遍研究的热点和趋势。从具体研究热点来看,结合关键词共现、聚类和突现图谱可知,随着时间演变、理论完善、技术支撑及国家战略补充,健康大数据的研究领域逐渐从疾病诊治向疾病预防转变、从健康医疗向健康管理转变、从单一领域向多专业交叉融合转变[19]。在健康大数据的不断驱动下,人类健康实践也将不断丰富与发展。

3.4  健康大数据应用的风险与挑战

大数据技术给人类的生活带来巨大变革,对健康信息管理的研究与信息化建设产生深远影响。科学地应用大数据技术,对我国的健康大数据进行专业的分析和处理,可有效解决过去在医疗卫生领域遇到的一些棘手问题。但是,如何利用大数据技术将健康大数据应用到医疗卫生实践中,仍然面临着诸多的风险和挑战。

在医学大数据的收集过程中,必然会牵扯到患者的个人隐私和社会基础信息,健康大数据安全和隐私保护措施的欠缺将会泄露居民个人信息[20]。患者数据的匿名化、维护健康大数据的隐私及对医疗保健中的欺诈性检测至关重要,这需要学者们努力保护健康医疗大数据免受黑客攻击和侵犯[21]。当前,要尽快制定明文法规,明确健康数据的产权,同时强化管理、物理设施和技术等多个体系的保密性、一致性和可用性,是打破健康信息交流和共享的最佳途径[22]。

在掌握大量数据后,由于数据挖掘技术的特殊性,要求有一定的计算机背景的人才支撑[23]。我们已经进入了大数据时代,人类的所有活动都可以变成数据,在输入系统后,通过对这些数据进行深度整合和加工,从而发现某些心理模式,最终产生相应的价值[24]。可见,如何将健康大数据运用到实处是目前乃至未来的一大挑战。

随着健康大数据技术的发展和产业规模的扩大,基于“健康中国”的背景下,健康大数据必将成为引领未来科学研究的新热点。在未来健康大数据应用的普及中及面对发展过程中的风险与挑战,有关研究者需要重视以下发展建议:①加大对健康大数据的研究和开发力度,在确保数据安全的前提下,为更多的人群提供更有效的健康管理服务;②积极利用人工智能、大数据分析、云计算等技术,建立健康大数据应用平台;③加强政府支持,为健康大数据提供良好的环境;④加快健康大数据平台标准制定工作;⑤培养健康大数据应用复合型人才;⑥加大健康大数据资源共享开放力度;⑦建立标准化、规范化的健康医疗大数据服务体系,为广大群众提供安全、有效、便捷的医疗服务,保障人民群众身体健康和生命安全[25]。

综上所述,基于CiteSpace軟件对所选取的236篇文献进行可视化分析,通过可视化知识图谱的方式,揭示在“健康中国”背景下健康大数据领域的研究现状、研究热点和研究趋势,为健康大数据领域的研究提供借鉴意义与未来展望。但健康大数据在人才培养和隐私保护方面的应用研究较少,有待继续深入研究。如何更好地运用健康大数据平台助力“健康中国”战略仍是未来研究的目标与方向。

[参考文献]

[1] ***. 决胜全面建成小康社会 夺取新时代中国特色社会主义伟大胜利——在中国共产党第十九次全国代表大会上的报告[J]. 党建, 2017, (11): 15–34.

[2] 陈敏, 刘宁, 肖树发, 等. 医疗健康大数据应用关键问题及对策研究[J]. 中国数字医学, 2016, 11(8): 2–5.

[3] 陈敏, 刘宁. 医疗健康大数据发展现状研究[J]. 中国医院管理, 2017, 37(2): 46–48.

[4] 牟海燕, 陈敏. 健康医疗大数据开放管理探讨[J]. 中华医院管理杂志, 2019, (8): 660–663.

[5] 中共中央 国务院. 中共中央 国务院印发《“健康中国2030”规划纲要》[J]. 中华人民共和国国务院公报,2016(32): 5–20.

[6] 佚名. 中国通信标准化协会物联网技术委员会发布《“物联网+区块链”应用与发展白皮书》[J]. 电信工程技术与标准化, 2019, 32(11): 11.

[7] 张振, 杨翠湄, 徐静, 等. 健康医疗大数据应用发展现状与数据治理[J]. 医学信息学杂志, 2022, 43(7): 2–8.

[8] 许培海, 黄匡时. 我国健康医疗大数据的现状、问题及对策[J]. 中国数字医学, 2017, 12(5): 24–26.

[9] ZHANG X, PEREZ-STABLE E J, BOURNE P E, et al. Big data science: Opportunities and challenges to address minority health and health disparities in the 21st century[J]. Ethn Dis, 2017, 27(2): 95–106.

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!