当前位置:首页 期刊杂志

基于文献数据挖掘的前列腺癌中医证候规律研究

时间:2024-05-14

许晨璐 梁建庆 王佳华 董海玉 韩政阳 李斐

【摘 要】 目的:通過文献数据挖掘探讨前列腺癌中医证素及症状/体征分布规律,为辨证论治提供参考。方法:检索中国知网、万方、维普及中国生物医学文献数据库中前列腺癌中医证型、证素及症状/体征相关文献,建立数据库,运用SPSS Statistics 26.0和Gephi 0.9.2软件进行因子、聚类及复杂网络分析,挖掘前列腺癌患者的中医证候特点和分布规律。结果:前列腺癌证型分布以下焦湿热证多见,总体以虚证为主。证素分布显示病位多在肾、脾、肝及下焦,病理性质正虚邪实,正虚以气、阴、阳、血的亏虚为主,实以血瘀、湿、热、毒、痰为主。证素聚类分析结果分为7类:肾阳亏虚证、毒瘀互结证、脾气血两虚证、肝阴亏虚证、下焦湿热证、痰浊内阻证和气机郁滞证。症状/体征复杂网络分析核心症状/体征为尿频尿急、小便不利、神疲乏力、纳呆、腰膝酸软、腰痛、失眠、夜尿多、舌红、腹部胀痛、大便干燥、口干口渴、排尿疼痛、消瘦、畏寒肢冷。症状/体征因子及聚类分析最终聚为5类:气阴亏虚证、肾阳亏虚证、肾虚湿热证、气虚血瘀证、热毒内蕴证。结论:正虚邪实是前列腺癌变化发展的主要病机,肾阳亏虚证、气阴亏虚证、下焦湿热证、毒瘀互结证是前列腺癌的临床常见证型。

【关键词】 前列腺癌;证候;证素;症状/体征;数据挖掘

【中图分类号】R737.25   【文献标志码】 A    【文章编号】1007-8517(2023)08-0107-07

Abstract:Objective To explore the distribution of TCM syndromes and symptoms/signs of prostate cancer by literature data mining, and to provide reference basis for syndrome differentiation and treatment. Method The literatures related to TCM syndrome types, syndrome elements and symptoms/signs of prostate cancer were retrieved from CNKI, Wanfang, VIP and Chinese Biomedical literature database, and the database was established. SPSS Statistics 26.0 and Gephi 0.9.2 software were used for factor, cluster and complex network analysis.Explore the TCM syndrome characteristics and distribution of prostate cancer patients. Results The syndrome type distribution of prostate cancer is mainly damp-heat syndrome of lower coke, and generally deficiency syndrome.The distribution of syndrome elements showed that the disease location was mostly in kidney, spleen, liver and lower coke. The pathological nature of positive deficiency was mainly deficiency of qi, Yin, Yang and blood, while the latter was mainly blood stasis, dampness, heat, poison and phlegm.The results of cluster analysis of syndrome elements were divided into 7 categories: deficiency of kidney-yang syndrome, combination of poison and stasis syndrome, deficiency of spleen-qi and blood syndrome, deficiency of liver-yin syndrome, damp-heat syndrome of lower jiao, obstruction of phlegm and turbidness, and stagnation of qi.Symptoms/Signs Complex network analysis Core symptoms/signs were frequent urination, urination difficulty, fatigue, lethargy, soreness in the waist and knees, lumbago, insomnia, nocturia, red tongue, abdominal distension, dry stool, dry mouth and thirst, painful urination, emaciation, chills and cold limbs.Symptoms/sign factors and cluster analysis finally clustered into five categories:Qi Yin deficiency syndrome,kidney Yang deficiency syndrome,kidney deficiency and heat syndrome,Qi deficiency and blood stasis syndrome,heat poison accumulation syndrome.Conclusion Positive deficiency and pathogenic solid are the main pathogenesis of prostate cancer. Kidney Yang deficiency syndrome,Qi Yin deficiency syndrome,lower coke dampness and heat syndrome,poison and blood stasis mutual junction syndrome are the common clinical syndrome of prostate cancer.

Key words:Prostate Cancer; TCM Syndromes; TCM Pattern Elements; Symptoms/Signs; Data Mining

前列腺癌(prostate cancer,Pca)为泌尿系恶性实体肿瘤,多发于中老年男性,至2020年居西方国家男性癌症发病率第二,死亡率第五[1]。当前西医治疗主要采取手术、内分泌、免疫、放化疗、分子靶向治疗等方法,常导致神经、免疫及内分泌功能紊乱等一系列不良反应。中医疗法强调辨证论治指导个体精准用药,目前已成为Pca的重要综合治疗手段,中西医结合对于减轻放化疗不良反应、控制Pca复发和转移、延长去势抵抗性前列腺癌(castration resistant prostate cancer,CRPC)生存时间取得了良好的临床疗效。但目前关于Pca的中医辨证分型多具有临床醫家主观性,尚未建立统一的辨证体系,制约了中医辨证论治在本病的发挥应用。本文通过多种数据挖掘方法,从传统中医角度探求Pca的病机特点和辨证规律,为完善Pca的中医辨证体系及后续随证施治提供思路及参考。

1 资料与方法

1.1 文献来源与检索方法 计算机检索中国知识资源总库(China national knowledge infrastructure,CNKI)、万方数据学术论文总库(Wanfang database,Wanfang)、维普中文科技期刊全文数据库(VIP database for Chinese technical periodicals,VIP)及中国生物医学文献数据库(China biology medicine disc,CBM)中收录的Pca中医证候及症状/体征相关文献,选用高级检索方式,以“前列腺癌”或“前列腺恶性肿瘤”合并“中医”或“中西医”或“中药”或“证候”或“证型”或“验案”为主题词或关键词,检索时间为建库至2022年3年31日,其余默认数据库设置。

1.2 文献纳入标准 ①研究对象经西医明确诊断为Pca,使用中医药或中西医结合治疗的临床观察、研究、经验总结;②中医辨证分型明确或症状/体征清晰明了;③临床疗效观察文献总有效率不低于70%。

1.3 文献排除标准 ①药理、动物及细胞实验类文献,综述及理论探讨类文献;②未确诊Pca的前期治疗、合并其他原发肿瘤或其他系统疾病、中医药治疗手术或放化疗后并发症的文献;③文献来源相同且研究内容重复,或引用同一个医案者仅选择资料相对完整的1篇;④无法获取全文的文献。

1.4 数据库建立 由两人按照统一纳入和排除标准进行双人双机独立筛选及录入,出现意见分歧时再由两名高级职称老师讨论决定,录入结束后比对录入结果确保数据准确性,以降低误差。在数据录入过程中为了避免主观判断对结果的影响,描述性数据未进行整理及分析。利用Excel 2019软件提取符合纳排标准的文献的标题、作者、疾病类型、证型、证素、症状/体征等内容,同一篇文献中多次出现的数据,记作1频次,建立数据库。

1.5 数据规范

1.5.1 证型规范 参考《中医诊断学》[2]《中医临床诊疗术语·证候部分》[3]把相同病因病机的证候规范为同一证型,如气血两虚证、气血不足证统一为气血亏虚证,以上规范中未收录的证型,按照原文的证型进行统计。

1.5.2 证素提取 参考《证素辨证学》[4]中的50项证素,将规范后的证型拆分为病性证素与病位证素,如脾肾阳虚证可以拆分为病性证素阳虚和病位证素脾、肾。

1.5.3 症状/体征规范 参考《中医临床常见症状术语规范》[5]《中医诊断学》[2]对症状/体征进行规范处理,将含义相近的症状/体征进行归类,如眠差、失眠、寐差、寐欠佳等统一记录为失眠;对部分症状/体征进行分解录入,如头晕耳鸣分解为头晕、耳鸣;对于无法规范的症状/体征按原文保留,如阴囊潮湿。

1.6 统计学方法 将文献编号,运用Excel 2019软件对文献中的证型、证素及症状/体征进行频次分析,运用Gephi 0.9.2软件对症状/体征进行复杂网络分析,将高频证素、症状/体征导入IBM SPSS Statistics 26.0软件进行因子与聚类分析。

2 结果

2.1 文献检索结果 通过检索策略及其他途径手动检索共计检出3518篇文献(其中CNKI中1009篇,Wanfang中1372篇,VIP中328篇,CBM中785篇,根据参考文献手动检索22篇),去除重复后共计1043篇,通过对题目和摘要进行初筛后剩余288篇,按照纳排标准对全文进行复筛后剩余125篇,最终纳入125篇文献。

2.2 中医证型分布 对125篇文献中的证型规范化处理后共得到83种,其中,单证证型32种,复合证型51种,证型总频次为215次。经统计频次≥5的证型(包括单、复证)共13个,累计频率为51.63%,详见表1。

2.3 中医证素分析

2.3.1 频次分布 对规范后的证型进行拆分,共提取26个证素,其中病性证素15个,病位证素11个(详见表2、表3)。虚性病性证素主要为气虚、阴虚、阳虚、血虚;实行病性证素主要为血瘀、湿、热、毒、痰、气滞;病位证素主要为肾、脾、肝、下焦。

2.3.2 聚类分析 将频率>5%的14个高频证素导入IBM SPSS Statistics 26.0进行系统聚类,选用“组间联接”“Pearson相关系数”,生成聚类分析树状图(如图1所示)。对证素进行聚6类、7类、8类实验,当截距为15时,聚类结果较稳定,结合中医辨证理论,将Pca中医证素聚为7类,详见表4。

2.4 中医症状/体征分析

2.4.1 频次分布 纳入文献中载有Pca详细中医症状/体征的共162条,规范化处理后提取一般症状124种,舌象45种,脉象40种,总频次为1895次。频率>10%的一般症状共23个,排前十的为小便不利、神疲乏力、纳呆、尿频尿急、腰膝酸软、腹部胀痛、失眠、夜尿多、腰痛、排尿疼痛。频次≥10的舌象11个、脉象9个,排前五的舌象主要为舌红、苔黄腻、苔少、舌有瘀斑瘀点、舌淡;排前五的脉象主要为细数脉、弱脉、沉细脉、沉弦脉、滑数脉。详见表5、表6。

2.4.2 复杂网络分析 将症状/体征进行共现分析,以“.CSV”格式保存并导入Gephi 0.9.2软件进行复杂网络分析。字符集选“GB2312”,图的类型为“无向的”,布局为“Fruchterman Reingold”,结果显示本复杂网络共包含211个节点,4523条边(详见表7)。选取拓扑结构下的“K-core层次分析”对上述复杂网络图进行过滤,最大“K-core”值为37,此时共有68个核心症状/体征(如图2所示),位于图中心排前15的为尿频尿急、小便不利、神疲乏力、纳呆、腰膝酸软、腰痛、失眠、夜尿多、舌红、腹部胀痛、大便干燥、口干口渴、排尿疼痛、消瘦、畏寒肢冷。这一结果与频次分布中排前十五的症状/体征相吻合,说明这些症状/体征可能是Pca的关键临床特征。[KH*2D]

2.4.3 因子分析 选取频次≥15的40个高频症状/体征作为变量,导入IBM SPSS Statistics 26.0软件中进行因子分析。首先进行KMO和Bartlett球型度检验,KMO=0.591>0.5,P<0.01,证明数据有进行因子分析的意义。选用主成分分析法,提取公因子共14个,选取旋转后的成分矩阵表中得分绝对值>0.5的症状/体征,按贡献度降序排列,可以得出14个公因子(分别用F1~F14表示)的具体症状/体征条目,详见表8。

2.4.4 公因子信息聚类分析 运用IBM SPSS Statistics 26.0软件对14个公因子旋转后的成分矩阵得分表进行聚类分析,采用“系统聚类”“最远邻元素”法、“欧氏测量距离”“Z得分”进行标准化,绘制树状图(如图3所示)。对结果分别进行聚为不同类群的实验,依据中医理论指导,将不合理的症状/体征排除,最终确定聚5类,并根据《中医诊断学》[2]对所得出的中医症状/体征群进行辨证分型,详见表9。[FL)]

3 讨论

中医没有“前列腺癌”病名,结合其临床表现可归于“癃闭”“淋证”“积聚”“癥瘕”等范畴。目前中医对本病无明确辨证分型,不同医家根据病机、症状、舌脉等,将Pca分为不同证候类型。贾英杰认为Pca病因可概括为虚、毒、瘀、湿[6]。魏睦新依发病进程将Pca中期阶段归为肝肾阴虚证[7]。王树声等[8]认为晚期激素非依赖性Pca证属脾肾阴阳亏虚。高瞻等[9]认为Pca患者在等待观察期间多属湿热下注膀胱证。张亚大认为Pca虚实夹杂,以肾虚为本,癌毒为标[10]。中医诊疗的核心是辨证论治,Pca辨证分型尚无标准,对于指导临床辨证及后续随证用药、提高疗效有局限性,故亟待制定规范统一的临床辨证标准。数据挖掘可以找出大量无直观联系的数据背后隐藏的规律。多种数据挖掘技术联合应用在中医药领域已非常成熟,可为中医辨证论治提供更加系统、客观、精准的科学理论依据[11]。本研究对多种数据挖掘方法进行联合使用,意在充分、有效挖掘Pca中医证型、证素及症状/体征分布组合特征,为临床辨证分型及后续随证施治提供客观化参考。

本研究证型频次分析显示,Pca以下焦湿热证最为常见,总体上以虚证为主。证素频次分析显示,Pca病位多在肾、脾、肝及下焦,病理性质正虚邪实,正虚以气、阴、阳、血的亏虚为主,邪实以血瘀、湿、热、毒、痰为主。本病下焦湿热证最为常见,究其原因,前列腺位于会阴部属下焦,患者饮食不节,过食肥甘厚味导致脾失健运、痰湿内生,日久郁而化热,湿热下注,而成下焦湿热证[12]。湿热是本病早、中期发病的主要原因,进一步发展导致膀胱气化不利,局部气血津液运行受阻,则气滞、痰浊、瘀血等相继产生,甚者酝酿成毒。上述为Pca发病外因,究其内因,则在于正气亏虚,《素问·上古天真论》云:“丈夫……八八,天癸竭,精少,肾脏衰,形体皆极,则齿发去。”Pca患者多为中老年男性,人老而肾气衰、肾精不足,加之手术、放化疗等疗法,机体正气进一步损耗,导致正气更虚而邪实更甚,甚者阴阳离决而成Pca晚期危重证候。

证素聚类分析显示,类1~类7分别对应肾阳亏虚证、毒瘀互结证、脾气血两虚证、肝阴亏虚证、下焦湿热证、痰浊内阻证、气机郁滞证。这一结果与证型频次分布结果基本吻合,进一步验证说明本病正虚邪实的病机特点。《医宗必读》言“积之成也,正气不足,而后邪气踞之”,Pca患者素体亏虚而气血津液运行异常形成湿、热、瘀、毒、痰,病理产物进一步影响气血津液运行,最终使正气更虚而邪气更甚。证素结果表明Pca正虚邪实,临床分型上当以把握“肝”“脾”“肾”三脏的“阴”“阳”“气”“血”虚损状态为根本,尤其以肾脏亏虚为主,并综合考虑下焦湿、热、痰、瘀、毒等病理性质的兼夹进行判断。

症状/体征复杂网络分析显示,排前15的核心症状/体征为尿频尿急、小便不利、神疲乏力、纳呆、腰膝酸软、腰痛、失眠、夜尿多、舌红、腹部胀痛、大便干燥、口干口渴、排尿疼痛、消瘦、畏寒肢冷。这一结果与症状/体征频次分布结果一致,说明这些症状/体征可能是Pca的关键临床特征。其中小便不利、尿频尿急、排尿疼痛、腰痛、腹部胀痛考虑为前列腺占位性病变导致的疾病层面的特征;神疲乏力、纳呆、腰膝酸软、夜尿多、畏寒肢冷、消瘦反應了脾肾两脏虚损,以气虚、阴虚与阳虚为主;失眠、舌红、大便干燥、口干口渴则是邪实的体现,此处湿热瘀毒痰体现不明显,考虑Pca以正气亏虚为本,此为本病的核心症状/体征群,故以正虚为主,未能体现对邪实的具体分类情况。

症状/体征因子及聚类分析最终聚为5类,分别为气阴亏虚证、肾阳亏虚证、肾虚湿热证、气虚血瘀证、热毒内蕴证。该结果反应了本病病位主要在肾,正虚以气虚、阳虚、阴虚为主,邪实以湿、热、瘀、毒为主。对比证型、证素、症状/体征三者数据挖掘证型推断结果,证素及症状/体征的证型推断结果均可在证型频次分布中得见,且两者结果基本相符,均包含肾阳虚、气虚、阴虚、湿热、血瘀、毒结;不同点在于,证素聚类较症状/体征聚类所涉及脏腑还包括脾和肝,且多出血虚、痰浊和气滞。推测其可能原因为,所纳入的文献中Pca复合证型虽频次较低但种类较多(复合证型共51种,总频次为67次),多兼见毒、瘀、痰浊、气滞等,证素是对证型的拆分提取,故对此体现较明显。而在症状/体征分布中,脏腑气血亏虚常作为症状/体征采集的重点,而毒、瘀、痰等多为次症,聚类主要体现高频核心的症状/体征,故对后者体现不明显。两者之间虽略有出入,但均与Pca证型频次分布情况相吻合。综上所述,Pca常见临床基本证型可归纳为:肾阳亏虚证、气阴亏虚证、下焦湿热证、毒瘀互结证。

症状是辨证的前提,证素是辨证关键,中医辨证的规律是从症状到证素到证名的过程。本研究综合应用数据挖掘技术,从证素及症状/体征两方面进行综合考量,深入探索Pca的中医辨证分型规律,以期为建立Pca临床辨证分型标准提供参考依据,扩宽临床遣方用药思路,提高中医药对Pca的临床防治疗效。现有数据挖掘技术在一定程度上克服了中医辨证过程中的局限性,但由于临床辨证论治的复杂性,本文纳入的文献数量较少,加之二次分析、人机交互等因素存在主观性与局限性,故还需进一步的临床检验和改进。

参考文献

[1]SUNG H,FERLAY J,SIEGEL R L,et al.Global Cancer Statistics 2020:GLOBOCAN Estimates of Incidence and Mortality Worldwide for 36 Cancers in 185 Countries[J].CA Cancer J Clin,2021,71(3):209-249.

[2]陈家旭,邹小娟.中医诊断学(第四版)[M].北京:人民卫生出版社,2021:118-167.

[3]国家技术监督局.中医临床诊疗术语:证候部分[S].北京:中国标准出版社,1997.

[4]朱文锋.证素辨证学[M].北京:人民卫生出版社,2008.

[5]黎敬波,马力.中医临床常见症状术语规范(修订)[M].北京:中国医药科技出版社,2015.

[6]王金秀,李小江,陈军,等.贾英杰论前列腺癌的中医病机与治疗[J].新中医,2014,46(4):20-23.

[7]马国花,吴燕敏,魏睦新.魏睦新采用中医待机疗法治疗早期前列腺癌经验[J].中国中医药信息杂志,2008,15(9):88-89.

[8]王树声,古炽明.中医药治疗前列腺癌的探索与优势[J].中国中西医结合外科杂志,2010,16(3):263-265.

[9]高瞻,邵魁卿,沈建武,等.前列腺癌的中医药辅助治疗概况[J].北京中医药大学学报(中医临床版),2011,18(3):37-39.

[10]張扬,顾晓箭,朱清毅,等.张亚大诊治晚期前列腺癌的经验[J].江苏中医药,2014,46(10):26-27.

[11]徐玮斐,刘国萍,王忆勤.多元统计学方法在中医证候分类识别中的应用及展望[J].中国中医药信息杂志,2015,22(8):124-128.

[12]张雪薇,袁晶晶,王瑞平.中医药治疗前列腺癌研究进展[J].河南中医,2021,41(1):141-146.

(收稿日期:2022-08-05 编辑:徐 雯)

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!