时间:2024-07-28
姜灵芝
(西安航空职业技术学院, 教务处, 陕西, 西安 710089)
当前人民生活节奏加快,社会竞争激烈,致使人们心理压力增加,不同程度的心理问题普遍存在,为社会与家庭带来隐患。因此,如何保持心理健康是当今社会急需解决的问题[1-2]。
面对当前社会中人们心理问题的现状,杨倩等[3]提出基于互联网技术的老年人心理健康服务系统设计,该系统只针对老年人心理健康情况,无法对青少年以及中年人心理情况做出分析;蔡金芷[4]提出跨平台的个人健康管理系统,该系统无法全面评估用户所有心理健康指标;龚焕燊等[5]提出基于新媒体技术的大学生心理健康管理平台构建系统,该系统采用的接口方式会受当前网速影响,容易导致准确度降低。
网络信息日益发达,使大数据技术得以快速发展,大数据技术可以从复杂多样的数据中,快速提取有价值信息[6-7]。为此本文针对当前人们面临的心理健康问题,提出了基于大数据分析技术的心理健康智能评测系统设计,依据前人研究的心理行为和心理活动的自然反映大数据,记录用户的行为并进行分析,了解个体的主观感受,评估心理特征,考量用户的基本行为、语言特征和时间序列特征。基于用户行为的数据和对应的心理特征进行对照,可以有效评估用户的人格、心理健康、主观幸福感等心理特征,了解用户的心理健康状况,并进行心理疗愈和疏导,提高人们心理健康总体水平。
该系统由用户层、功能层与数据层组成,图1为系统体系结构图。其中,用户层由问卷管理员、系统管理员、用户等组成;功能层由用户管理子系统、问卷管理子系统、用户答题子系统、数据分析子系统、心理疗愈子系统组成,该层负责管理评估用户答题信息,对用户信息进行分析梳理[8-9]以及对用户进行心理疏导治疗[10-11];数据层用来存储用户信息,由用户信息、问卷信息及评测结果组成。
图1 系统三层结构体系
心理测评系统功能架构如图2所示。图2中,问卷管理子系统具体职能为实时更新问卷状态、对问卷进行修正、保管问卷数据;用户答题子系统职能为用户登录系统后提交测评申请,问卷管理员与系统管理员通过用户申请之后,用户可进行答题,用户答题子系统可查询测评者评测数据;数据统计分析子系统实现用户查询、导出以及解析评测结果功能[12],其运用k-means聚类算法与改进神经网络算法对评测数据进行分析总结[13],以实现用户的心理健康智能评测;心理疗愈子系统可以根据评测结果对产生心理健康问题的用户展开针对性的心理干预治疗,有效协助用户解决心理问题。
图2 心理测评数据库结构
用户管理子系统通过Internet可为测评者提供登录、账号注册等功能,其运作流程如图3所示,其中括号内数字代表用户状态“UserType”在数据库中的数值。测评者通过用户层使用浏览器申请问卷测评,并将测评者信息存储到数据层,功能层从数据层提取测评者信息并对信息进行计算测评[14-15]。
图3 用户管理流程图
系统功能层的数据分析子系统应用大数据分析技术中的k-means聚类算法,从海量评测数据中挖掘隐藏规律和有价值信息,以此为基础,采用具有5个隐层的深度神经网络进行心理健康特征提取,获取更为准确的心理健康智能评测结果。
k-means聚类算法是对已知数据进行划分,该算法的评价指标是距离,即两个对象距离越近,其相似性越高,而距离近的对象组成簇,其终极目标是独立的簇[14]。k-means聚类算法采用特定聚类目标函数,运用多次迭代更新算法,最终得到目标函数的最小值,提高分类结果精确度。将n个用户评测数据对象分为k个聚类,即k个簇作为输入数据,里面包含n个用户评测数据集,输出是k个最后聚类中心和用户评测数据对象所在的簇。图4为k-means聚类算法工作流程。
图4 k-means聚类算法工作流程图
k-means聚类算法流程如下。
(1) 聚类中心初始化。从n个用户评测数据对象样本集中选取k个对象。
(2) 分配数据点。将余下的评测数据对象分配到与其距离最近的聚类中。
(3) 在所有用户评测数据对象完成就近分配后,基于得到的聚类计算聚类中心。
(4) 如果新聚类中心与原来的不同,则回到步骤(2),否则继续步骤(5)。
(5) 将k个最终的聚类中心和用户评测数据对象所在的簇作为聚类算法的最终结果。
依据DNN的隐马尔科夫模型提取聚类数据特征,它是具有多个隐含层的前向神经网络,其输入层、输出层分别代表聚类数据的底层特征、降维之后的典型特征[15],使用sigmod,其表达式为
yhj=Sig(xj)=11+e-xj,xj=bj+∑iyh-1iwij
(1)
其中,yhj、xj、bj分别代表第h层第j个节点的非线性输出数值、节点输入数值、偏置量,wij代表节点j与节点i之间的权重。通过神经网络算法迭代训练获得DNN,其公式为
J=1N∑Ni=1(xi-i)2
(2)
使用RBM受限玻尔兹曼机对初始网络参数初始化后将深度神经网络建模单元视为基本单位,由三个HMM状态组成一个多维特征,该状态与DNN输出层节点相对应。输入选用8维的特征,包含1 024个节点的5个隐含层。
将用户评测数据作为深度神经网络的输入,对其降低维度后,将其类型特征输出,运用深度神经网络加强其特征。隐含层处理心理特征不明显的数据,以确保最后提取出的特征维数降低幅度大,并增强区分度。采取隐含层输出均值可以使心理问题使特征趋势与高斯分布接近,节点的输出值决定深度神经网络隐层节点是否激活。设∪ii=1σi代表得出的聚类特征,σi与第i个心理问题特征对应,特征在隐含层的均值为
Hi,t=1L(hi,1+hi,2+…+hi,L)
(3)
其中,hi,L表示第i个特征在第L排的非线性输出矢量,网络特征由隐含层特征均值得到:
F=1T∑Ni=1∑Tt=1Hi,t
(4)
其中,T表示特征维数。
使用式(5)可得到降低维度后的实用特征,依据此特征可算出隐含层均值特征中有效特征分量。
E=Hi,t-F
(5)
为验证本文系统实际应用效果,对某城市年龄在18~40岁之间的成年人进行心理评测,将该人群2019年12个月的心理评测数据分为4个数据集,分别为3个月、6个月、9个月和12个月,分别用K、N、X、Y表示,数据集容量为K=640 M,N=1 280 M,X=2 560 M,Y=5 120 M。将该城市人群的四个心理评测数据集作为本文系统实验数据集,展开以下实验。
从心理评测数据集中随机选取2400个数据样本,运用文献[3]、文献[4]、文献[5]系统和本文系统分别对其进行数据聚类性能测试。其中,文献[3]是基于互联网技术的老年人心理健康服务系统;文献[4]是跨平台的个人健康管理系统;文献[5]是基于新媒体技术的大学生心理健康管理系统,对比结果如图5所示。
图5 2 400个数据聚类性能对比图
为验证样本数据集大小对设计方法的聚类性能产生的影响,从心理评测数据集中随机选取4 800个数据样本,同样采用4种方法验证数据聚类性能,结果如图6所示。
图6 4 800个数据聚类性能对比图
分析图5和图6可知,系统聚类所需时间与数据样本个数成正比,其中文献[3]、文献[4]、文献[5]系统聚类时间随着样本数量增加上升迅速,用时较长,本文系统聚类所需时间短,并且时间保持在0.005—0.015 s之间,并不因数据集大小而产生较大变化,运行稳定,说明本文系统聚类性能强。
选取数据集K为该部分实验数据集,以均方误差(MSE)、绝对误差(MAE)、平均绝对百分比误差(MAPE)数值为测量标准,统计分别采用四种系统进行心理健康评测的实验结果,可验证系统的评测性能,衡量系统优劣。对比结果如表1所示。
表1 四种系统MSE、MAE、MSE实测结果
从表1数据可知,本文系统的评测MAE、MSE、MAPE数值均低于其他对比系统,该数据表明本文系统心理健康智能评测误差低、性能强,可实现用户心理健康准确评估。
为进一步测试本文系统的心理健康评测性能,以数据集K作为实验对象,将不同大小的噪声添加到数据集K中,检测四种系统评测精确度,实验结果如图7所示。
图7 精准度测试结果
从图7分析可知,本文系统与对比文献系统的评测精确度都是随着噪声的增加而降低,本文系统的评测精确度降低幅度较平缓,数值保持在90%~99%之间,文献[3]、文献[5]系统的评测精确度在80%~90%之间,但其评测精确度曲线呈波浪状,显示其系统评测精准度波动显著,温度性较差。而文献[4]系统,评测精确度曲线下降趋势明显,证明其评测精确度较低。通过对比分析可知,噪声的添加对本文系统评测效果影响不大,评测精确度高。
使用四种系统分别对K、N、X、Y四种数据集实行评测,对比其处理用时,对比情况如图8所示。分析图8可得,本文系统在评测4个数据集所用的时间低于文献[3]、文献[4]与文献[5]系统的评测时间。随着数据集容量的增多,其评测时间也随之缓慢提高,其平均评测时间为1.825 min,文献[3]、文献[4]与文献[5]的平均评测时间分别为4.05 min、4.575 min、5.525 min。评测时间随着数据容量增多而增长。三种对比系统评测时间上升迅速,尤其是文献[4]在评测X、Y数据集时,其时间走势几乎呈直线上升状态。通过对比可看出,本文系统评测效率高且性能稳定。
图8 评测时间对比
数据库的占用比率随着数据量的变化而变化,以心理评测数据集中数据作为实验对象,对比四种系统的数据库占用比率,对比结果如图9所示。由图9可知,本文系统的数据库占用率随着数据数量增多而上升,但上升趋势比较平缓且数据库占用率始终较低。当数据量达到640万条时,本文系统数据库占用率也未超过40%,证明本文系统数据库占用率低且系统运行稳定,而文献[3]、文献[4]、文献[5]系统数据库占用比率较高,并且文献[4]、文献[5]系统随着数据量增加,数据库占用比率时高时低,显示系统运行的不稳定性,影响系统功能实现。
图9 数据库占用比率
为验证本文系统实际使用效果,从实验数据集中随机选取1 000人的心理数据作为评测数据集,对该人群进行为期12个月的心理跟踪评测,计算该人群在使用本文系统前和使用本文系统12个月后的心理数据变化占比,对比结果如图10所示。从图10可看出,经过12个月的心理跟踪评测,该人群的心理问题占比较使用本文系统前显著降低,各类型心理问题人群占比基本小于10%,而在使用本系统前,各类型心理问题人群,尤其是抑郁症倾向人群占比达到35%,使用本系统后其占比在7.5%左右,可见本文系统在实际应用中效果显著,可有效改善人们心理问题。
图10 使用本文系统前后效果对比
信息时代为社会各领域带来了改革,基于大数据分析方法很多,其中k-means聚类算法和深度神经网络算法应用比较广泛,将二者同时运用到心理健康智能评测系统中可有效提升系统的应用效果。经过试验证实,本文设计的基于大数据分析技术的心理健康智能评测系统具备显著优势。通过对比使用本文系统前后人群心理问题占比,使用后人群各项心理问题都得到有效解决,因此本文系统实用性强,可实现人们心理健康智能评测,提升人们心理健康水平。
我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!