当前位置:首页 期刊杂志

中医药大数据平台的构建

时间:2024-05-04

吴燎

摘要 大数据、云平台、物联网等新技术的不断发展和应用,促进了我国中医药信息化建设。为了打破传统中医药管理方式和思维模式,中医药大数据平台的构建应运而生。本文首先探讨了中医药数据的来源和分布,以及中西医大数据特点对比。其次,发表了自己对大数据平台构建的设想,以及层次的搭建。然后评估了大数据平台的应用范围。最后,表达了对大数据平台未来的展望。

关键词:大数据;平台构建;中医药

中图分类号:G642        文献标识码:A

文章编号:1009-3044(2019)17-0022-03

开放科学(资源服务)标识码(OSID):

1 概述

1.1中医药数据来源和分布

大数据平台构建的核心是数据,中医药数据广泛分布在中医药领域。古典著作经过现代学者研究引申,形成今天的电子文献。然而促动中医发展的数据更多是在临床诊疗过程形成的。中医根据望闻问切,通过舌苔,脉象,面相,主诉,辩证地确定患者病情,通过病例把数据保存下来。最后就是现代化社会产生的信息。包括患者的行为,社交网络,摄像头、传感器等产生的数据。

1.2中医药与西医——大数据特点

中医与西医有着不用的思维模式,数据特点上有很大差别。具体表现在如下几个方面:

1)数据类型不同。中医诊疗依靠医生望闻问切,根据辩证开具处方,中医数据基本上为文本类型的数据。而西医对疾病的确诊依靠的是各种检查仪器,以及病理检测等,数据类型呈现多样化。包括文本型,数字型,图像型,音频,视频等。

2)数据的规范化程度不同。由于中医自古以来没有机构进行统一的规范和整理。对于症状,药名等术语的规范性不够。出现一症多名,一药多名等情况。而西医的规范化程度相对较高,对于病名,药名,以及各项指标单位等都有一个统一的标准和规范。

3)数据的量化程度不同。中医的数据强调整体[1],记录为属性性数据,比如,舌面黄,苔白,脉沉等,是定性的指标,量化程度低。而西医的检查数据强调具体。多为各项理化生理指标,比如血常规,肝肾功能等。数据的量化程度高。

4)数据单位大小不同。中医的数据主要是文本类型,所以中医的单位数据占用的存储空间小,是KB级别。而西医的数据包括CT图像,B超图像,基因组序列等,单位数据占用数据达到MB,甚至GB级别

5)数据价值密度不同。价值密度体现在单位密度的数据中能挖掘的价值大小。中医文本型数据的类型单一和占用存储空间小的特点,使中医相对于西医数据挖掘更加容易。而西医数据类型多样化[2],文本,声音,图像,视屏等,导致数据复杂,连通性降低,数据挖掘困难,单位数据量挖掘价值量低。

6)数据的完整性不同。中医数据主要来源为电子处方,记录的数据大多为病型,症状,药方等数据,对于问诊和病史等病例记录较少。而西医的数据涵盖了各种检查,治疗方法,而且对患者的问诊数据着重记录,包括一般项目,主诉、现病史、既往史等。记录的数据较为细致、完整。

2 平台构建

2.1中医药大数据平台构建

中医药领域学术观点及思想来源主要有四个方面:个人经验、个人实践、师徒关系传承、学科发展和传承,然而四种方式信息处理和传播速度缓慢,难以满足社会对中医药知识的需求。因此需要构建庞大的临床数据库,使得数据持续地产生,对诊疗的数据动态处理,分层管理,最终将数据整体关联,挖掘数据价值,分析辨证论治个体化诊疗方案。通过构建中医药大数据平台,将中医药大数据应用于医院临床,更好地指导中医药临床,传承中医药宝贵遗产。

2.2中医药大数据平台—数据的持续

建立中医药大数据平台,首先要解决的问题是数据的收集问题,针对这样的问题,可以建立统一的中医药数字化诊疗数据上传平台,平台提供统一、便捷、兼容的上传接口,支持实时文件处理情况查询、上传批次管理以及问题数据回滚。

2.3数据——质量评估算法

利用中医药大数据平台我们解决了数据的收集问题,然而收集的数据质量如何?是否能够作为大数据研究?针对这样的问题必须采用一套质量评估机制。解决的方法是:利用大数据平台项目采用了高度结构化的电子病历系统[3]。将中医临床电子病历,通过数字化中医临床术语应用系统支撑转化为结构化电子病历。随后根据结构化电子病历制定一套质量判定标准,再利用算法对电子病历进行质量判定。

2.4搭建三层结构

中医药大数据平台采用的是三层结构,第一层是数据整合层,数据整合层中包括了来自各个不同信息源的各种结构化的数据库。第二层是中间层,是数据计算存储管理层,第三层是应用层。在第一层利用ETL处理:将分散的,异构数据源中的数据等抽取到临时中间层,对数据清洗、转化、装载。中间层利用第一层处理后的大数据分布式Hadoop集群[4],采用分布式存储、流计算、数据挖掘和大数据算法,通过OLAP建模成立一个叫作分析服务的数据集市。最后第三层应用层,大数据平台将按照自己的需要从数据集市提取数据,形成分析报表和决策报告等最终的价值产品。通过搭建这样的三层系统的部署形成低成本高效率的模式。

3 平台应用

在大数据平台构建成功之后,“大数据平台”技术,能够给中医药行业带来五个方面的变化[5]:

3.1提升临床业务水平

利用大数据平台的数据可以对中医临床能力进行定性定量地判断,具体可以通过大数据获得以下指标:

3.2医疗质量控制

大數据精细化分析可以应用于科学合理的评估医疗费用及质量。例如根据门海量诊费用制作诊费点阵。

3.3工作效率提升

通过数据分析处理,形成报表可以辅助医生提高诊治的效率。例如,通过建立医生用药对比分析报表,比较诊断疾病各种配方的药效。可以为患者提供最有效的用药配方。

3.4公共管理

可以根据大数据平台确定疾病云图,也可以与搜索引擎相结合,疾病控制可以做到以下几点:

3.5机器学习AI

1)医疗领域人工智能应用重要分支——专家系统[6],模拟医学专家诊断疾病的思维过程,推荐处方。专家系统具有如下的优势:

(1)集中专家知识,丰富诊断决策,帮助医生解决复杂的医学问题;

(2)为医生提供疾病诊断的有效信息,作为医生诊断的辅助工具,提高工作效率,减轻工作强度;

(3)继承和发扬医学专家的宝贵理论和丰富的临床经验。

2)中医辨证人工智能深度学习模型

人工智能对300多万结构化电子病历和文献数据进行机器学习,形成对不同优势病种的参数调优,通过算法调优,可以将小儿咳嗽、肝病、心血管等疾病的辨证算法诊断符合率将提高到82.9%和92.4%等[7],此外,根据病人的诊疗数据(望闻问切)信息的采集,从海量病例库里自动学习,找出最佳治疗方案提供给患者,可以避免医生能力不均匀带来的误诊。

4展望

“大数据+中医药”的模式将中国传统中医和第三次工业革命互联网结合起来,促进中医进一步发展。但是,保证中医药大数据的平稳高效运行必须做好以下两点[8]:

4.1 完善的运营机制

1)完善的医疗卫生信息化基础建设。中医药大数据的收集,处理和分析离不开信息化,诊疗软件的开发,网络的搭建,数据库的建设,云平台的构造都建立在完善的信息化基础建设上。

2)相关的政策、法律保障。互联网+中医药的模式的发展离不开国家政策的支持,包括研发资金,研发人员等。而发展过程中涉及的环节需要法律提供保障,比如涉及大数据的电子病历的个人隐私的问题,还有软件和数据的使用权等都离不开法律的保护。

3)大数据组织体系建设。大数据从采集到最终应用整个过程需要一个完善的体系,包括一定的采集机制,监督检查机制,分析机制,存储机制等,系统地服务于整个大数据体系。

4)应用基础设施、战略规划。信息基础设施建设离不开规划。包括短期的规划和长远的战略规划,为应用设施的建设、更新做好短期规划,对未来应用的发展做一个科学长远的规划。

4.2开放共享——中医药大数据平台

1)完善的认证机制。利用大数据平台的搭建,获取了规范化的数据。然而对于数据的使用安全和合法性必须要建立完善的认证机制。因为数据开放平台要确定数据的使用人群,数据使用规则,数据使用目的等,以确保数据使用和合法性和安全性。所以完善的认证机制是必不可少的,通过认证机制,保证数据使用群体来源可查,去向可追,责任可咎。

2)灵活的开放细则。针对不同的群体,机构,大数据平台要有不同的开放程度和开放细则。针对企业公司的需求和数据使用特点,确定数据的开放量和使用规则。针对教研机构,医院、研究所[9]等根据不同的需求和特点,制定相应灵活的开放细则。确保满足不同群体和组织机构不同的需求。

3)有效的数据管理。对于数据的使用和开放中医药大数据平台必须有一套完善的管理规范和监测机制。根据管理规范,要确定数据的使用人群、数据的使用规则、数据使用的目的等。同时,在数据使用过程中,利用监测机制,监测数据使用的情况,保证数据合法安全地使用。

4)安全的数据脱敏[10]。数据的开放涉及的个人的隐私问题,比如电子病历的姓名,住址,电话等个人安全信息要进行隐私保护,所以对于数据的脱敏尤为重要,要保证使用的数据不涉及个人隐私和秘密的泄露。

参考文献:

[1] 何伟. 大数据时代与中医药学术创新[J]. 中医杂志,2014(23):1981-1984.

[2] 陈静锋,郭崇慧,魏伟. “互联网+中医药”:重构中医药全产业链发展模式[J]. 中国软科学,2013(03):1-3.

[3] 杜含光,陳霞波,李灿东. 论中医电子病历的中医方向[J]. 江苏中医药,2011(6):83-84.

[4] 吕婉琪,钟诚,唐印浒,等. Hadoop分布式架构下大数据集的并行挖掘[J]. 计算机技术与发展,2014 (1):22-25.

[5] 陈世敏.大数据分析与高速数据更新[J].计算机研究与发展,2015(2):333-342.

[6] 黄欣荣,钟平玉,马纲. 人工智能与中医智能化[J].中医杂志,2017(24):2076-2079.

[7] 杨硕,崔蒙,李海燕.  基于支持向量机和人工神经网络的心血管疾病中医证候分类识别研究[N]. 北京中医药大学学报,2011(8):539-543.

[8] 张建英,何建成. 大数据在中医学中应用的可行性分析与展望[J]. 中医杂志,2017(01):17-20.

[9] 王济,王琦. 大数据技术在中医体质学中应用的思考[J]. 中华中医药杂志,2014(19):1621-1625.

[10] 殷亦超,徐铖斌,刘珉,等.  研究型医院临床大数据研究平台的建设[J].上海中医药杂志,2016(s1):5-7.

【通联编辑:王力】

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!