当前位置:首页 期刊杂志

基于K-means聚类算法的临床科室运营效率评价

时间:2024-05-15

何昱林

四川省德阳市人民医院运营管理部,四川德阳 618000

随着医疗卫生体制改革的不断深化,外部环境变化给公立医院的发展带来了巨大的压力和严峻的挑战。在这种形势下,医院需要不断创新,在满足社会医疗服务需求的前提下,必须加强对医院人财物信息资源的管理,通过强化精细化管理来提高医院的整体运营管理效率[1]。医院运营效率的提升依赖于临床科室运营效率的提升[2],如何能够准确反映医院临床科室的运营水平,这就需要对数据进行提取、挖掘,对临床科室运营效率进行客观、真实评价。本文将运用K-means聚类算法以德阳市人民医院的31 个临床科室为例,对其运营效率进行科学分析,分析结果有助于医院掌握临床科室的运行发展,能更好地配置现有医疗资源,也有助于为医院及科室管理提供发展思路,同时也有助于为临床科室绩效评价提供参考依据。另外,随着医院管理由粗放式向精细化转变,在借助信息技术的基础上医院已经积攒了大量的数据,因此,更需要掌握并运用一定的数据挖掘方法,来寻找数据内部的潜在联系,旨在为分析问题解决问题提供一个新的思路。

1 K-means 算法介绍

聚类算法是无监督学习中应用较广的学习算法[3]。聚类,顾名思义是按照一定的规则将数据分为若干个类,同一类簇内数据的相似度很高,类与类间的数据差异性很大[4]。通过聚类划分,每一类可能对应一些潜在的概念,可为进一步的数据分析提供基础。K-means 是解决聚类问题的经典算法,这种方法简单快捷也称为快速聚类法[5]。K-means 是一个反复迭代的过程,并采用距离作为相似性指标。首先要选择k 个对象作为初始类簇中心,然后根据最小距离原则将数据分配到最邻近类簇,每个类簇中所有对象所对应的均值再作为新的类簇中心,重复上述步骤,通过对凝聚点进行不断修正或迭代,直至聚类比较合理或迭代稳定为止[6]。

K-means 算法具有较高的高效性,但也有一定的局限性:①对噪声和离群点比较敏感;②变量共线会对聚类效果产生影响;③对初始聚类中心敏感,选择不同的聚类中心会产生不同的聚类结果和不同的准确率[7];④一般用于凸的样本集聚类,对于样本数据是非凸的情况聚类效果都不是很好[8]。

聚类结果的评价指标有平均轮廓系数、误差平方和(sum of squared errors,SSE)等。平均轮廓系数的取值范围为[-1,1],且平均轮廓系数越大,聚类效果越好。SSE 也称为手肘法,随着聚类数k 的增大,SSE 会逐渐下降,当k 达到真实聚类数时,SSE 的下降幅度会骤减,并随着k 值的继续增大而趋于平缓,这个肘部对应的k 值就是数据的真实聚类数[9]。但我们在实际分析中聚类不一定存在最优划分,确定类别个数往往要结合多种方法,多方面进行综合考虑确定。

2 运营效率指标的构建

运营效率指标的确定是一项非常重要而又复杂、困难的工作,由于各临床科室间的技术差异性,指标的选择既要考虑代表性、又要考虑可得性,更要考虑可比性[10]。2019年国务院办公厅印发《关于加强三级公立医院绩效考核工作的意见》[11],《关于加强三级公立医院绩效考核工作的意见》中公布了三级公立医院绩效考核指标体系,其中运营效率考核指标包含资源效率、收支结构、费用控制、经济管理4 个部分,共19个指标(表1)。

表1 三级公立医院绩效考核运营效率指标体系

本文以19 个指标作为参考,根据医院实际情况,建立能客观、真实反映科室运营效果的运营效率指标(表2)。指标的选择不需要太繁琐,要易提取、可操作性好、概括性好,通过指标的设立,能透过现象看本质,更好地帮助科室查找自身在运营管理中的问题。本文中的运营效率指标包含业务指标3 个、经济指标4 个,业务指标体现科室工作量及效率,经济指标旨在促使科室调整费用结构,逐步降低患者经济负担,提高科室医疗服务价值。

表2 医院运营效率指标

3 应用K-means 算法分析临床科室运营效率

3.1 数据来源

医院31 个临床科室2021年1月至6月的医院信息系统(Hospital Information System,HIS)数据、病案统计报表,财务报表,数据字段包括每百门诊入院患者、每床位出院患者、平均住院日、门诊均次医疗服务收入、出院患者均次费用、每床位日均医疗服务收入、成本率,共7 个指标数据,数据真实可靠。

采用Excel 2007 进行数据整理,运用datahoop 平台建立算法模型进行统计分析。

3.2 分析过程

3.2.1 数据预处理

3.2.1.1 数据形态探索 绘制变量的直方图,发现某些变量有明显的右偏,需要通过Box-cox 变换调整数据形态,否则可能会影响模型效果。

3.2.1.2 相关性分析 通过相关系数矩阵分析变量之间的相关性,结果见表3。若相关系数>0.7,说明相关性较强,数据存在信息冗余,信息重叠会增加该变量在数据分析中的权重,需要进行变量删除、替换或是采用因子分析进行降维处理。

表3 医院运营效率指标相关系数矩阵

3.2.1.3 标准化 为了消除变量量纲影响,进行零均值标准化处理,结果见表4。

表4 医院31 个临床科室运营效率指标零均值标准化结果

3.2.2 K-means聚类

建立K-means 算法模型对31 个临床科室的运营效率指标进行聚类分析。根据平均轮廓系数(图1)、SSE(图2)评价指标,再结合医院实际情况,聚成4 类效果较好,且每一类别样本个数相对均衡。

图1 不同类簇个数下平均轮廓系数变化情况

图2 不同类簇个数下SSE 变化情况

3.3 结果分析

根据运营效率指标,将医院31 个临床科室分为4 类,结果见表5。

表5 医院31 个临床科室运营效率指标的K-means聚类分析结果

将聚类结果可视化,根据雷达图(图3,封四)分析每一类别的数据指标意义。

第0 类:运营效率次高。有肝胆外科、骨科、基本外科、泌尿外科、神经外科、胃肠外科、心胸外科、心血管内科8 个科室。该类科室每百门诊入院患者、门诊均次医疗服务收入、出院患者均次费用、每床位日均医疗服务收入、成本率指标数据相对较高。此类科室属于病种复杂程度较高,能体现医务人员医疗技术价值,但需要加强成本管控的科室。

第1 类:运营效率低。有儿科、风湿免疫科、内分泌科、皮肤科、中医科5 个科室。该类科室每百门诊入院患者、门诊均次医疗服务收入、出院患者均次费用、每床位日均医疗服务收入指标数据低,在医院的整体运营效率低。

第2 类:运营效率高。有产科、耳鼻咽喉科、妇科、肛肠科、口腔颌面外科、乳腺外科、消化内科、眼科8个科室。该类科室每床位出院患者、门诊均次医疗服务收入、每床日均医疗服务收入指标数据相对较高,平均住院日、出院患者均次费用指标数据较低。此类科室病种复杂程度不高,周转较快,运营效率较好。

第3 类:运营效率次低。有感染科、呼吸内科、康复科、全科医学科、烧伤整形科、神经内科、肾内科、心身医学科、血液科、肿瘤科10 个科室。该类科室收治的患者住院时间较长,周转缓慢,每床位出院患者、每床位日均医疗服务收入指标数据相对较低,整体运营效率偏低,需要加强病种的选择、管理。

4 讨论与建议

4.1 合理选择运营效率指标

运营效率指标的选择是分析评价的重点也是难点,指标的选择既要具有代表性也要避免信息的重叠,要根据医院管理的实际需求,不同的分析目的所选择指标的侧重点也是不同的。由于不同科室间的差异性,全院临床科室不能用一把“尺子”丈量,本文重点分析31 个临床科室,如重症监护室(intensive care unit,ICU)、神经科重症监护室(neurological intensive care unit,NCU)、冠心病重症监护室(coronary intensive care unit,CCU)、急诊科等科室的效率指标需要慎重选择且能与其他临床科室建立对等的量化评估,这也可以作为下一步的研究方向。

4.2 多方考量确定分类结果

聚类分析是将随机现象归类的探索性随机方法[12],初始中心点、最大迭代次数选择的不同,结果指标都会有差别。类别数的确定虽然有相应的评价指标,但需要多方考量,并不是平均轮廓系数最大的分类结果最好,要判断聚类结果与医院临床科室实际状况是否接近、吻合。

4.3 结果可作为医疗资源分配的依据

由于医院各科室的发展情况不同,基于临床科室运营效率数据,运用K-means聚类方法将临床科室进行分类。医院通盘考虑所拥有的医疗资源,根据临床科室的运营效率档次,将床位、人员、设备等资源的投入进行适当调整、科学规划,通过合理的资源匹配来提高医院的总体效率。同时,在医院给予各临床科室帮扶的情况下,各科室也要知道自己科室的短板[13],根据指标数据,积极调整管理思路,有针对性地采取相应管理措施,使科室资源达到最大化的利用。

4.4 结果可作为临床科室绩效评价的依据

医疗绩效评价是政府、大众和医院自身关注的焦点,而科室绩效评价有利于促进医院的健康可持续发展[14]。评价科室绩效合理性,通常科室自身进行纵向比较,或是科室间在某一维度指标进行横向比较来作为绩效评价依据,缺乏全面、深度的纵横分析,结果往往缺乏说服力。运用K-means聚类方法,将全院临床科室放在多个维度指标上进行综合对比,整个分析过程客观、科学,对临床科室绩效评价具有一定指导意义。同时,也帮助科室寻找运营过程中的闪光点和薄弱环节[15],为加强临床科室精细化管理提供参考依据。

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!