一种用于鉴别体域网动作模式的近邻快速鲁棒协作表示分类算法

时间：2024-08-31

吴建宁凌雲王佳境林英杰

(福建师范大学数学与信息学院，福州 350117)

引言

近年来，随着微机电系统(micro-electro-mechanical system, MEMS)、嵌入式技术、移动互联网等先进信息技术的快速发展，可穿戴体域网 (wearable body sensor networks, WBSNs)技术在远程监测人体步态行为动作模式研究中得到广泛关注和应用，对于远程疾病诊断治疗、老年慢性疾病康复评价以及预防老年人跌倒等具有重要意义[1-5]。目前大多相关研究的主要思路是将传感器佩戴于人体不同运动解剖部位(诸如肩、手臂、手腕、腰部、腿部等)构建体域网，获取人体步态运动状况的相关生理或病理信息，并通过互联网将相关信息传送至远端医疗数据处理中心，准确评价人体步态动作模式变化。就技术实现手段而言，其中一个研究难点问题在于如何有效基于体域网多传感数据，准确鉴别步态行走动作模式变化。为解决上述问题，相关专家和学者相继提出构建体域网动作模式分类模型，从而探寻准确鉴别人体动作模式变化的技术手段。较早相关研究提出基于传统机器学习分类模型(诸如人工神经网络[6]、马尔科夫模型[7-8]、随机森林[9]和决策树[10-11]等)，构建准确鉴别体域网人体动作模式的分类模型。文献[8]鉴于传感节点有限存储容量和加速度数据随机特性，提出了分层隐藏马尔科夫(hierarchical hidden Markov models, HHMMs)的体域网动作模式分类模型虽然该模型可将数据收集、预处理及动作模式分类等分层处理，但仅能鉴别5种动作模式，且分类准确率低，仅为80%。文献[10]提出了一种基于决策树算法的体域网步态动作模式分类模型，可鉴别6种动作模式，平均识别率为90%。总体来看，早期相关研究仅局限于鉴别少量种类动作模式，未考虑所构建分类算法复杂、分类准确率低等问题。

近年来，一些学者尝试基于先进机器学习分类算法，探寻新的有效鉴别体域网动作模式技术手段。特别是，一种新兴稀疏表示分类算法 (sparse representation classification, SRC)[12-13]在相关研究中得到高度关注，其基本思路是：尝试将所有动作模式样本训练集构建一个过完备字典，以期稀疏表示测试样本；通过范式优化问题求解稀疏表示系数，定义最小残差判别原则，以期准确鉴别测试样本所属类别。文献[14]提出一种基于单传感加速度数据的体域网动作模式稀疏表示分类算法，鉴别9种不同体域网动作模式，平均分类准确率可达95%。文献[15]鉴于多传感加速度数据，提出了一种基于随机投影的稀疏表示分类算法 (sparse representation classification based on random projection, SRC_RP)，对9种不同动作模式识别，平均准确率为90%。虽然近年来的相关研究有效探讨了稀疏表示分类算法在鉴别体域网动作模式应用中的可行性，但就其分类算法而言，其相关工作较侧重于通过求解l1范式优化问题来获得最优稀疏表示系数，而忽略采用大量高维动作模式样本数据集直接构建过完备字典，显著提高动作模式分类算法复杂度，影响其分类性能等问题。如何从高维多传感加速度数据中挖掘满足数据结构相似性的样本训练集，构建包含少量样本的线性表示基和过完备字典，去除样本训练集冗余信息，有效提高动作模式分类性能，已成为近年相关研究领域探讨的热点问题。

目前，一些学者尝试探讨基于优化字典构建稀疏表示体域网动作模式分类新模型，其基本思路是：从大量训练样本数据中优化挖掘更多蕴含动作模式间差异性信息的少量样本，重新构建过完备字典，以期降低分类算法复杂度，有效提高分类性能。文献[16]提出了一种基于K-SVD优化算法的快速稀疏表示动作模式分类模型，尝试通过K-SVD优化算法设计过完备字典，以期降低分类算法复杂度，提高分类性能。文献[17]提出一种基于最近邻 (nearest neighbor, NN)算法的快速稀疏表示动作模式分类模型，尝试基于最近邻算法，寻找一个与测试样本相似且数量较少训练样本集作为优化过完备字典，以期确保较高分类性能及较低分类算法复杂度。此外，文献[18]提出一种基于随机投影算法的快速稀疏表示动作模式分类模型 (fast sparse representation classification base on random projection, FSRC_RP)，其基本思路就是首先采用随机投影算法压缩原始动作模式数据，然后基于简化KNN近邻算法，优化重组包含少量样本的训练样本集稀疏表示测试样本。该研究对 9种不同动作模式分类测试，可有效降低分类算法复杂度，平均识别率可达92%。目前相关工作大多注重在保持稀疏表示系数的稀疏特性基础上，降低体域网动作模式分类算法复杂度，而未充分考虑训练样本数量不足可导致稀疏表示系数残差偏大、影响动作模式分类性能的问题。更重要的是，就人体运动生理系统而言，人体各关节和肢体在行走时必保持其内在的相关性和协调性。然而，目前相关工作未能从体域网多传感动作模式数据结构中，挖掘更多蕴含动作模式协调性和相关性信息的样本训练集，难以准确稀疏线性表示动作模式变化。为此，需要探寻能够蕴含更多动作模式协调性和相关性信息的体域网动作模式分类模型，以便准确鉴别动作模式变化。

近年来，一种新兴的协作表示分类 (collaborative representation classification, CRC)算法在人脸识别、图像处理等研究领域得到广泛关注[21-23]。该算法可利用少量样本内在相似性，协作表示测试样本，通过求解范式优化问题来获得测试样本协作表示系数，定义正则化残差样本判别规则，寻找样本类别的差异性，准确判定测试样本所属类别。从理论上讲，协作表示分类算法能够有效发挥协作表示机制优越性，从少量样本数据结构中获取更多与样本类别信息密切相关性信息，可避免稀疏表示分类算法高复杂度的问题，显著提高分类性能。迄今为止，基于协作表示的体域网动作模式分类模型相关研究未见报道。

为此，本研究提出一种近邻快速鲁棒性协作表示体域网步态分类(fast robust collaborative representation classification, FRCRC)算法，旨在尝试有效提高体域网动作模式分类性能。该算法的基本思路是：基于体域网多传感动作模式数据结构的内在相似性，利用最近邻原则，寻找与测试动作样本密切相关的少量近邻类别和近邻训练样本，重新构造训练样本集；然后基于新训练样本集构建快速鲁棒协作表示动作分类模型，通过扩展拉格朗日乘数 (augmented Lagrange multiplier, ALM)算法[24-25]，求解测试样本协作表示系数和表示残差，定义判定测试样本所属类别规则。本研究采用公开的美国加州伯克利大学多传感动作模式数据库 (wearable action recognition database, WARD)验证所提算法有效性[13]。结果表明，本研究所提算法能够从体域网多传感数据中获得更多与动作模式密切相关的协调性和相关性，有效降低算法复杂度，分类性能明显优于稀疏表示动作分类性能。

1 方法

本研究所提分类模型旨在基于最近邻原则，从大量训练样本中寻找少量与测试样本密切相关的近邻类别和近邻样本，构建近邻样本训练集，协作表示测试样本，通过准确求解协作表示系数和参差，鉴别动作模式类别，其算法如图1所示，详细求解过程如下所述。

1.1 基于最近邻原则构建近邻训练样本集

本研究通过定义欧氏距离选取与测试样本相似性较密切的近邻类别和近邻样本。假设原始体域网动作类别训练样本集合X=[X1,X2,…,Xk]，k表示所有动作模式类别。对于任意测试样本y，基于最近邻原则寻找其m个近邻动作模式样本类。本研究首先求解所有动作模式类别样本中心点(sample center, SC)，然后计算所有动作类别样本中心点与测试样本y的欧氏距离dist(y,Xi),(i=1,2,....,k)，选取与测试样本距离最小的m个动作类别作为测试样本y的近邻类别。然后，基于最近邻原则从所选取的近邻类别中寻找与测试样本y密切相关的近邻样本，其基本思路是：遍历所有近邻类别classy，计算每一类别所含动作模式训练样本与测试样本y的欧氏距离，选取距离值较小的n个训练样本作为测试样本y的近邻样本，然后级联所有选取训练样本，构建协作表示测试样本y的近邻训练样本集，其算法步骤如下：

步骤1:求解原始训练样本集中每一类别动作模式的样本中心点，即

(1)

式中，pi表示训练样本集中所有第i类动作样本数。

步骤2:计算不同动作类别样本中心点与测试样本y之间的欧氏距离，即

(2)

式中，i=1,2,…,k,SCi,j和yj分别表示第i类动作模式样本中心点和测试样本y中第j个元素值，d表示动作样本维度。

选取距离较小的m个动作类别，作为测试样本y的近邻类别classy=[c1,c2,…,cm]。

步骤3:计算classy中与测试样本y相关的近邻样本。对于classy中第i(i=1,2,…,m)类动作模式，计算第i类所有动作样本与测试样本y的欧氏距离，选取距离值较小的n个动作样本作训练样本Xiy=[xi1,xi2,…,xin]。重复上述步骤，直到找出classy中所有动作类别的n个近邻样本，级联构成协作表示测试样本y的近邻训练样本集Xy=[Xy1,Xy2,…,Xmy]。

1.2 构建鲁棒协作表示体域网动作分类模型

基于近邻训练样本集Xy=[Xy1,Xy2,…,Xym]，构建鲁棒协作表示体域网动作分类(robust collaborative representation classification, RCRC)模型，旨在充分利用近邻动作模式样本间内在相似性，准确获得协作表示测试样本y的表示系数和表示残差，提高分类性能。假设给定近邻训练样本集Xy=[Xy1,Xy2,…,Xym]，测试样本y能够被样本训练集Xy线性表示为

y=Xθ+e

(3)

式中，θ为协作表示系数，e为协作表示误差。

本研究采用l1范式求解式(3)中的表示系数θ，即

(4)

式中，λ是一个调节参数。

由于式(4)是一个限定性凸优化问题，本研究采用ALM算法求解θ。为此，式(4)可扩展为拉格朗日方程，即

(5)

式中，μ>0是一个常数，Z表示拉格朗日乘数向量。

定义迭代规则估算拉格朗日乘数及其最优解，有

当{μm}满足单调递增正序列[24]条件时，表示系数θ和表示误差e的迭代算法定义为

(8)

其求解过程可表示为

(9)

式中，S为收缩算子，定义为

[Sθ(Xy)]i=sign(Xiy)·max{|Xiy|-θ,0}

(10)

当测试样本y的协作表示系数θ和表示残差e估算求解后，本研究定义测试样本y与不同动作类别的正则化残差，有

erri(y)=‖y-Xiyθi-e‖2/‖θi‖2

(11)

式中，i=1,2,…,m，erri(y)表示测试样本y与第i类动作模式类别的正则化残差。

基于逼近残差原则，本研究选取erri(y)中最小值即可判别测试样本y的所属动作模式类别。上述分类算法步骤描述如下所示。

1)初始化：将λ、μm、Xy逐列归一化。

2)迭代更新计算如下：

收敛估算得到协作表示系数θ和表示残差e。

4)判别测试样本动作模式类别

identity(y)=argmin‖erri(y)‖。

1.3 算法验证

1.3.1多传感体域网动作模式数据

本研究采用公开的美国加州伯克利大学可穿戴动作模式数据库(WARD)，验证所提算法有效性。所选数据库采集了20名受试者(其中，男性13名，女性7名，年龄范围19～70岁，所有受试者身体健康，行走功能正常)多传感动作模式数据，每个传感节点集成一个3轴加速度计和2轴陀螺仪)。在采集过程中，每名受试者要求佩戴5个传感节点(分别置于受试者腰部、左手腕、右手腕、左脚踝和右脚踝)，在自然状态下，采集频率设置为20 Hz，采集每个受试者13种不同动作模式(站、坐、躺、向前走、逆时针走、顺时针走、向左转、向右转、上楼、下楼、慢跑、跳和推轮椅)数据。研究中，任意选取9种不同多传感动作模式数据(如站、坐、向前走、向左转、向右转、上楼、下楼、慢跑和跳)。

实验中，采用滑动窗口方法截取记录数据段作为样本数据，确保样本数据蕴含更多动作模式信息。窗口长度设置为200点，样本数据长度为1 000点(也就是样本数据维度d=1 000)。所选动作样本数据采用五阶平滑滤波进行消噪处理。每个受试者每种动作模式分别选取5个样本数据。

1.3.2算法评价

鉴于小样本数据，本研究采用10折交叉验证方法，客观评价所提分类模型性能。实验中，把所有20名受试者数据任意划分10个数据子集，每个子集均包含2个受试者数据。任意选取9个子集(包含18个受试者数据)作为样本训练集，剩余的一个子集作为测试样本数据。上述过程重复100次，每名受试者均被要求作为测试样本数据，重复平均结果作为最终分类结果。

由于动作样本数据维度d=1 000，样本数据可能存在大量冗余信息，必影响后续动作分类性能。实验中，采用随机投影方法压缩数据，以便有效降低样本数据冗余性。数据压缩率(compressive rate,CR)定义为CR=d′/d，其中d表示动作样本初始维度，d′表示动作样本数据压缩维度。实验中采用稀疏二进制矩阵作为随机投影矩阵。首先，实验选取压缩率CR=0.5，来评价基于最近邻原则选取m个近邻类和n个近邻样本对本研究所提算法分类性能的影响。

此外，为了比较，在实验中选取基于稀疏表示分类算法(诸如SRC_RP和FSRC_RP算法)，以便进一步验证所提算法(FRCRC算法)对于体域网动作模式分类的分类性能。最后，通过实验仿真，比较FSRC_RP算法与FRCRC算法基于所选9种日常动作模式数据的混淆矩阵，进一步验证所提算法的优越性。

2 结果

表1给出了数据压缩率为0.5时，本研究所提算法(FRCRC算法)性能随测试样本近邻类别数量(m)与近邻样本数量(n)的变化状况。可以观察到，基于最近邻原则选取的近邻类和近邻样本明显影响协作表示动作模式的分类性能。就比较而言，当近邻类选取为2或8时，分类性能较差；而近邻类选取为4时，可得到较好的分类性能。同样，从表1也可以发现，就挑选的近邻类而言，近邻样本数的选取也影响着分类性能，比较而言，当近邻类和近邻样本分别选取4和10，可得到最大识别率(94.94%)。这些结果表明，基于本研究最近邻原则适当选取与测试样本密切相关的近邻类和近邻样本，可有效获取与测试样本密切相关的动作模式相似性信息，显著提高其分类性能。

表1基于选取m个近邻类和n个近邻样本的动作模式识别率(%)

Tab.1Theaccuracy(%)basedondifferentnumberofneighborclassesandsamples

nm2468589.3992.0092.1792.561090.1194.9494.5693.061590.7894.5693.0692.892090.3994.3992.6790.502590.5093.7892.8990.223090.3993.8391.6190.11

图2给出了SRC_RP, FSRC_RP以及FRCRC算法基于不同压缩率所取得动作识别率的比较结果，实验中，选取近邻类数为4，近邻样本数为10。可以看到，基于不同压缩率，本研究所提算法(FRCRC算法)分类性能明显优于基于稀疏表示分类算法性能。特别是，当压缩率大于0.5，本研究所提算法能够达到几乎相同的最大识别率。这些结果表明，选取适当压缩率，可有效降低近邻类和近邻样本数据中的冗余信息，提高动作模式分类性能。

图2 基于不同压缩率的3种动作模式分类性能比较Fig.2 The comparison results of 3 action recognition algorithms based on different compressive rate

图3给出了上述3种分类算法运行识别时间。可以发现，基于不同压缩率，本研究所提分类算法运行时间几乎相同，最低仅为6.5 s，明显低于基于稀疏表示分类算法的运行时间。结果表明，本研究基于最近邻原则所获取近邻类和近邻样本能够包含更多与动作模式密切相关的相似性信息，显著减少样本训练集样本数，有效降低算法处理的数据量和算法运行时间。

图3 基于不同压缩率的3种动作模式分类算法识别运行时间的比较结果Fig.3 The comparison results of 3 action recognition algorithms’ running time based on different compressive rate

动作模式站坐向前走向左转向右转上楼下楼慢跑跳召回率/%站897307723000089.7坐010000000000100向前走113088700000088.7向左转0079876000098.7向右转1000999000099.9上楼016102935460093.5下楼11430009820098.2慢跑0027001768888088.8跳5100060098898.8识别率/%87.397.695.992.797.097.689.6100100

表3 FSRC_ RP算法基于9种动作模式的混淆矩阵Tab.3 The confusion matrix of FSRC_RP algorithm based on 9 kinds of activity patterns

另外，采用本研究所提算法对所选9种不同体域网动作模式进行分类，进一步验证本研究所提算法鉴别体域网步态模式变化的有效性。实验中，近邻类数选取为4，近邻样本数选取为15，数据压缩率为0.5，最优分类结果如表2混淆矩阵所示。在混淆矩阵中，第i行和第j列表示正确识别动作模式的总数和错误识别动作模式的总数。如表2所示，本研究所提算法对9种动作模式分类的平均识别率可达95.3%。特别是，坐、向左转、向右转、下楼和跳等5种动作模式识别率和召回率均达到98%。为了比较，基于稀疏表示分类的FSRC_RP算法也用于实验中，其比较结果如表3所示。FSRC_RP算法对9种动作模式分类的最优平均识别率仅为91%，仅对坐和向右转2种动作模式识别率和召回率可达到95%，而站、向前走、下楼、慢跑和跳5种动作模式的识别率和召回率均未超过90%。这些结果表明，本研究所提体域网动作分类算法能够更加有效发挥协作表示机制的优越性，有效解决稀疏表示分类算法难以获取反映不同动作模式协调性和相关性的样本训练集等问题，可准确监测体域网动作模式变化。

3 讨论

实验结果表明，本研究所提算法能够基于最近邻原则，寻找较少的训练样本线性重构测试样本，并构建快速鲁棒协作表示动作分类模型，有效提升体域网动作模式识别率，降低算法复杂度。

与传统稀疏表示算法相比，本研究所提算法能够发掘不同动作样本之间的相似性，基于少量动作训练样本即可准确表示测试样本。其中关键之处在于如何从大量动作训练样本中寻找与测试样本密切相关的少量近邻类别和近邻样本。本研究基于最近邻原则，采用欧式距离衡量不同动作类别和训练动作样本与测试动作样本的相关性，为测试样本构建由少量训练样本级联所得训练集，更加准确地线性表示该测试样本，并判断其所属类别。本研究所提算法基于不同数量的近邻类和近邻样本所取得的动作识别率如表1所示。可以看出，基于本研究最近邻原则适当选取与测试样本密切相关的近邻类和近邻样本，可有效获取与测试样本密切相关的动作模式相似性信息，显著提高其分类性能。然而，选取过多或过少的近邻类和近邻样本，均难以获得足够的与测试样本密切相关的动作模式相似性信息，必将影响分类性能。

此外，与文献[17-18]所提算法(SRC_RP和FSRC_RP算法)不同，基于所构建的训练样本集，SRC_RP和FSRC_RP算法采用稀疏表示技术求解测试样本的表示系数，本研究所提算法采用协作表示分类技术求解测试样本的表示系数，优势在于协作表示动作分类模型能够充分利用近邻类和近邻样本所蕴含动作模式的相似性信息，准确获得与动作模式差异密切相关的表示系数和表示残差，有效提高动作模式分类性能。相应实验结果如图2和表2、3所示，本研究所提算法的动作识别率最高可达96%以上，明显高于另外两种算法。另外，稀疏表示分类算法为了得到更好的稀疏性，一般采用l1范式求解稀疏表示系数，而鲁棒协作表示模型中采用l2范式，使得求解过程更加简单，算法复杂度降低。上述3种算法识别相同数量动作样本所消耗时间对比结果如图3所示，可以看出，基于不同压缩率，本研究所提算法运行时间几乎相同，最低仅为6.5 s，明显低于另外两种稀疏表示分类算法。

4 结论

本研究提出一种近邻快速鲁棒性协作表示体域网动作模式分类模型，该模型能够基于最近邻原则寻找与测试动作样本密切相关的少量近邻类别和近邻训练样本，构造新的近邻训练样本集，协作表示体域网动作模式，充分利用体域网多传感动作模式数据结构内在相似性，从体域网多传感数据中获得更多与动作模式变化密切相关的协调性和相关性信息，有效降低算法复杂度，解决稀疏表示体域网动作模式分类算法较高复杂度等问题，显著提高分类性能，为临床远程监测体域网动作模式变化提供一个新的辅助技术手段。

(致谢：非常感谢美国加州伯克利大学可穿戴动作模式识别数据库 (Wearable Action Recognition Database, WARD)