近年来随着智能设备内置传感器技术的快速发展,人体日常行为识别、健康检测和保健指导等众多应用领域迅速崛起。早期人体日常行为识别主要是通过在人体固定部位上捆绑专用传感器采集用户行为信息。目前随着智能设备的普及和快速发展,随身携带就能直接获取到传感器信息,在不影响用户正常工作、学习和生活的情况下可以随时随地利用这些信息识别用户行为。但是,由于智能设备品牌、种类众多,用户携带其位置的不同以及内置传感器性能的差异等因素,增加了基于传感器信息进行人体行为识别的难度,影响了识别的准确率。
为了提高人体日常行为识别准确率,国内外研究者在基于移动设备获取传感数据进行人体行为识别研究上取得了一定研究成果。主要体现在三方面:1) 通过加速度传感器采集到的数据进行特征优选。如文献[1]提出一种融合稠密光流轨迹和稀疏编码框架的无监督行为特征提取方法,得到慢跑、快跑以及散步的识别准确率为85%;文献[2]提出基于蚁群算法的行为识别特征优选方法,行为识别准确率达到了89%,时间复杂度也相对下降;文献[3]提出的一种以人的动作序列图像的轮廓为特征,且基于隐条件随机场的行为识别方法,平均识别准确率达到91.4%。2) 通过提出新算法或改进算法重构行为识别模型。如文献[4]提出一种基于智能设备的混合专家模型识别人体行为,识别准确率最高达92.56%;文献[5]提出一种基于参考坐标变化的日常行为定位模型,准确率达90.42%;文献[6]采用耦合隐马尔可夫模型提出了一个多传感器数据融合的自适应行为识别方法,站立、行走、坐以及躺四种行为的识别准确率达到了84%。3) 使用集成学习中的多分类器系统[7]理论建立模型,其中融合算法成为众多研究者研究的核心。文献[8-9]提出了选择性集成学习算法,提高集成学习机的预测分类效率,并降低其存储需求;文献[10]采用遗传算法进行参数估计的多分类器系统泛组合规则进行模式分类;文献[11]利用多个极速学习机的输出进行简单均值算法融合处理,最终模型输出识别准确率比单个极速学习机高出3.6%。
考虑到上述因素,本文提出一种高可信度加权的多分类器融合行为识别模型(Multiple Classifier Fusion Model for activity recognition,MCFM)。针对五种日常行为(静止、散步、跑步、上楼及下楼),以决策树、支持向量机以及反向传播(Back Propagation,BP)神经网络作为三个基分类器,采用一组对五种行为敏感度高的特征数据集来训练基分类器,提取出每个基分类器对每种行为的识别可信度,利用提出的高可信度加权投票(High Reliability Weighted Voting,HRWV)法,求出MCFM中的各基分类器相应行为的加权系数阈值、投票因子和投票权值,进而得到各种行为的投票数,即得到最终的行为识别结果。
1 多分类器融合模型 1.1 模型的体系结构多分类器融合的体系结构有级联方式和并联方式两种。采用级联方式时,将多个基分类器串联起来,前一级分类器为后一级分类器提供分类信息;采用并联方式时,各基分类器的设计是独立的,各基分类器都会输出分类信息,再按照融合算法将各基分类器的结果进行融合得到最终的分类结果。本文建立的多分类器融合模型采用并联方式的体系结构,使用融合器将决策树、支持向量机以及BP神经网络三个基分类器的输出结果进行融合处理,输出最终识别结果。该模型整体系统结构如图 1所示。
通过智能设备的传感器采集人体日常行为的原始加速度信号,对这些信号进行滤波去噪等预处理,获得模型需要的传感器数据[12]。针对识别行为提取各种不同的特征,本文通过基于蚁群算法的行为识别特征优选方法[2],优选出与人体日常五种行为(静止、散步、跑步、上楼及下楼)相关度最高的特征集:方差、中位数、Z轴偏度和Z轴峰值。另外,在测试样本中的每一种行为特征数据之后添加类别标签,五种行为类别标签依次为:1、2、3、4、5,构成测试样本的特征矩阵,作为识别行为模型MCFM的输入。
1.3 基分类器决策树、BP神经网络以及支持向量机(SVM)是较为成熟的分类器,尤其在模式识别中分类效果好是研究者们广泛采用的原因[13-16],故本文使用这三个分类器作为本模型的基分类器。
1.3.1 决策树本模型中一个基分类器采用的是决策树C4.5算法,C4.5算法的核心思想是计算各特征的信息增益和信息熵,两者对应相除得到信息增益率,并把信息增益率作为节点分裂的依据。以测试样本为例,分析决策树在本模型中作为基分类器对行为样本的识别过程。如图 2中所示,从根节点开始分裂,首先计算所有特征的信息增益率,得到最大的信息增益率的特征是标准差,此时根据标准差的值1.52作为节点分裂的标值,当测试样本中的标准差小于1.52时,被分裂到左子树上;大于等于1.52的被分裂到右子树上。左子树所包含的样本子集中,所有样本均被识别为上楼,该子树不再分裂。右子树重复根节点分裂的规则继续分裂,直到每棵子树都不再分裂,都为同种行为。
支持向量机(Support Vector Machine,SVM)在解决小样本、非线性及高维模式识别中有非常多优势,因此本模型使用其作为其中一个基分类器。支持向量机的主要思想是建立一个超平面作为决策曲面,使得正例和反例之间的隔离边缘被最大化。由于本模型要分类五种行为,故选用SVM的一对多分类器算法[17]。针对本模型的5分类问题,样本在训练阶段,需要4个分类函数,每个分类函数都需要所有的样本参与,且都有一个参数,通过每一个分类层参数决定每个样本分类偏移方向。如图 3所示,给5种行为打标签为1、2、3、4、5。分类决策过程就生成了一个二叉树,相当于还是将5分类问题转化为2分类问题,在第一层把1作为一类,其余4类作为一类;第二层把2作为一类,其余3类作为一类;按此方法分到最后一类只有一种行为标签为止。
BP神经网络是一种按误差逆传播算法训练的多层前馈神经网络。在BP神经网络中,同层节点之间不存在相互连接,层与层之间多采用全互连方式,且各层的连接权值可调。BP神经网络的拓扑结构包括输入层、隐藏层和输出层。本模型中的BP神经网络在训练时,如图 4所示,输入层为4个优选后的特征值,隐藏层包含15个计算单元,输出层有5个单元输出。保存对五种日常行为识别最好的BP神经网络,在模型测试阶段直接调用保存好的BP神经网络,输入测试样本后,比较输出的每行5个单元的值大小,取最大值所属的列值即为行为标签,如跑步的标签为3,当输出的一行5列单元中第3列最大,则分类此行为是跑步,依照上述过程可将所有行为分类识别。
单一的分类器通常只针对一种行为识别效果特别好,因此将多个分类器通过融合算法得到一个新的模型,往往能实现不同分类器信息的互补[11, 18]。但是,有时选用不合理的融合算法可能会导致多分类器融合模型还不如单分类器识别准确率高。可见,融合算法在整个模型建立中至关重要。本文提出的高可信度加权投票(HRWV)算法,可高效地识别出人体日常行为。
1.4.1 可信度的提取在多分类器融合算法中往往会给基分类器分配加权系数的阈值,阈值分配的合理与否直接影响到整个模型的识别准确率。大多数文献中都用专家经验值作为分类器分配加权系数的阈值,往往导致分类器识别不准确,归结原因为:1) 专家有时也会出错,导致识别准确率降低;2) 无理论依据的人工干预识别过程,导致最终识别结果不可信。本文针对这一问题,提出了一种新的思想:采用基分类器自身的分类识别可信度作为其加权系数的阈值,这样既避免人为赋值不可信,也没有人为干预机器识别的因素影响,保证了加权系数的阈值可靠性和稳定性。
${{\varphi }_{ij}}=\left\{ \begin{matrix} E\left( {{x}_{j}} \right)/E\left( {{x}_{ij}} \right),E\left( {{x}_{ij}} \right)\ge E\left( {{x}_{j}} \right) \\ E\left( {{x}_{ij}} \right)/E\left( {{x}_{j}} \right),E\left( {{x}_{ij}} \right)<E\left( {{x}_{j}} \right) \\ \end{matrix} \right.$ | (1) |
其中:φij 表示第i个基分类器输出的j行为的可信度;E(xj)表示j行为的实际样本数目; E(xij) 表示测试样本通过第i个基分类器后分类为j行为的样本数目。
$\overline{{{\varphi }_{j}}}=\frac{1}{n}\bullet \sum\limits_{i=1}^{n}{{{\varphi }_{ij}}}$ | (2) |
其中:φj 表示n个基分类器输出的j行为的平均可信度。本文建立的模型有三个基分类器,即n = 3。
${{\varepsilon }_{ij}}=\left\{ \begin{matrix} \overline{{{\varphi }_{j}}} \\ 1-\overline{{{\varphi }_{j}}} \\ \end{matrix} \right.\begin{matrix} , \\ , \\ \end{matrix}\begin{matrix} \underset{n}{\mathop{{{\max }_{i}}}}\,{{\varphi }_{ij}}={{\varphi }_{ij}} \\ \underset{n}{\mathop{{{\max }_{i}}}}\,{{\varphi }_{ij}}\ne {{\varphi }_{ij}} \\ \end{matrix}$ | (3) |
其中:εij表示第i个基分类器针对j行为的加权系数阈值。在n个基分类器对j行为分类后将可信度最大的分类器对应行为的加权系数阈值设为平均可信度,其他n-1个基分类器的加权系数阈值设为1-平均可信度。
1.4.2 改进后的投票法投票法[19]是多分类器融合的常用算法,其基本表决原则是“一人一票制”,仲裁原则是“少数服从多数”。每个分类器的性能不同,对每种分类的识别效果也不同。本文将投票法的表决原则结合其仲裁原则改进,提出一种高可信度加权投票算法(HRWV)。HRWV算法的基本思想是用可信度来衡量基分类器的表决权限,其过程如下:
首先,用式(1) 、(2) 、(3) 求出的加权系数阈值εij控制基分类器的表决权,目的是让可信度高的基分类器更有表决权,可信度低的基分类器占有少量或不占表决权。
其次,基分类器的加权系数阈值确定后,通过每个基分类器识别出每条行为所属的类别,即输出其行为类别标签向量Sj1,对比输入前的测试样本行为类别标签向量Sj,可得到每个基分类器对应每类行为的识别准确概率。结合基分类器对每类行为的识别准确率就能得到行为的投票因子,进而得到投票权值。
${{E}_{j}}=\arg \sum\limits_{\begin{smallmatrix} i=1 \\ j=1 \end{smallmatrix}}^{n,m}{{{\varepsilon }_{ij}}\bullet P\left( {{x}_{j}}|{{f}_{i}} \right)}$ | (4) |
其中:Ej 表示所有基分类器将j行为样本分类为j行为的投票因子之和; xj 表示j行为样本集;fi表示第i个分类器; P(xj|fi) 表示第i个基分类器将j行为样本分类为j行为的概率;n表示分类器个数;m表示行为种类数。
$\overline{P\left( {{x}_{j}}|f \right)}=\frac{1}{n}\sum\limits_{i=1}^{n}{P\left( {{x}_{j}}|{{f}_{i}} \right)}$ | (5) |
其中:P(xj|f) 表示所有基分类器将j行为样本分类为j行为的平均概率。
$\Delta {{E}_{j}}=\left\{ \begin{matrix} 1\begin{matrix} ,&{{E}_{j}} \\ \end{matrix}>\overline{P\left( {{x}_{j}}|f \right)} \\ 0\begin{matrix} ,&{{E}_{j}}< \\ \end{matrix}\overline{P\left( {{x}_{j}}|f \right)} \\ \end{matrix} \right.$ | (6) |
其中:ΔEj 表示分类器对j行为的投票权值。当投票因子之和Ej 大于所有基分类器将j行为样本分类为j行为的平均概率P(xj|f) 时,投票权值为1;否则为0。
${{P}_{j}}=\frac{\sum{\Delta {{E}_{j}}}}{E\left( {{x}_{j}} \right)}$ | (7) |
其中:Pj表示通过HRWV算法后j行为的识别准确率。
本文将基分类器自身的分类识别可信度设为其加权系数的阈值作为投票法的先验条件,并运用多个基分类器对同种行为识别概率的均值作为求得投票权值的后验条件,既保证每个基分类器表决的公平性,也保证了融合模型的识别准确性。具体举例如下:
测试样本X(样本特征数据矩阵)输入到MCFM中,选择其中标签为1的一条行为进行HRWV算法分析。设基分类器1将其识别为标签1,其余2个基分类器都将其识别为其他标签,若基分类器1对标签1行为的识别概率大于其余两个基分类器,当不考虑基分类器的加权系数阈值时,简化式(6) 中的条件,也就是投票因子等于基分类器1的识别概率,肯定大于三个基分类器的平均识别概率,这时基分类器1就有一票表决权判定此行为标签为1,而不考虑其他2个基分类器的识别结果。由此可见,平均识别概率在MCFM中识别的重要性。
当考虑基分类器的加权系数阈值时,就要看基分类器1的ε11 的值是否大于ε21 和ε31,若大于,则根据式(4) 求得的投票因子必大于三个基分类器的平均识别概率,MCFM输出的此条行为标签依然为1;若小于,根据式(4) 求得的投票因子也不一定会小于平均识别概率,这就要根据ε11值大小以及ε11和ε21、ε31的差值大小去比较,ε11值越小以及差值越大,根据式(4) 求得的投票因子小于平均识别率的可能性就越大,即投票权值为0的可能性就会很大,也就是MCFM模型输出的误识别率会增大,故εij 是保证MCFM输出行为识别正确的前提条件。
2 实验设计与结果分析 2.1 实验数据集本文采用的智能设备为Android系统的智能手机,品牌有SAMSUNG、HUAWEI、MX、ZTE和HTC等。实验者由15名不同年龄段、不同性别的用户组成,采集他们一天中的日常行为(包括静止、散步、跑步、上楼、下楼、骑车及跳跃等)的三轴加速度数据,手机放置位置为用户裤子口袋和手中。按照数据采集方案,以用户每种行为15s的采样时长进行样本采集。收集到静止、散步、跑步、上楼以及下楼的数据最多,骑车、跳跃及其他日常行为数据较少,共有1690个有效样本,其中1230个样本用于训练,其余460个样本用于测试,如表 1所示。
整个实验过程在Matlab仿真环境中进行。从实验采集到的数据集可以看出人体日常行为主要集中在静止、散步、跑步、上楼以及下楼,其他行为活动并不频繁,因此,我们建立的模型仅对前5种行为进行识别。具体实验步骤如下:
1) 将实验采集到的数据集进行特征优选,主要用到的优选方法为蚁群算法[2]。在对特征数据进行预处理之后,将常用特征根据蚁群算法(其参数设置如表 2所示)进行第一次敏感特征优选,得到蚁群算法的初始特征全集,通过蚁群算法的二次优选,得到最终特征集合:{方差,中位数,Z轴偏度,Z轴峰值}。从而,得到本实验需要的训练特征数据集和测试特征数据集。
2) 将训练特征数据集分别输入MCFM中的决策树、支持向量机及BP神经网络3个基分类器中,训练出与5种行为相关的基分类器。
3) 将测试特征数据集分别输入训练好的3个基分类器中,输出结果进行HRWV算法处理,得到MCFM的输出结果,即最终识别结果。
2.3 实验对比与结果分析为了验证本文所提出的基于HRVW算法的MCFM模型的优越性,筛选出多种常见的分类器融合算法[9]进行对比实验。传统投票法(MV)、取大法(MAX)及均值法(MEAN)三种算法是集成学习应用在多分类器融合中最简单可行的算法。
传统投票法是一种硬划分,容易丢失大量信息。算法的分类结果依赖于多数分类器一致表决(式(8) ),如数据集中的跳跃和上、下楼的数据部分相似,容易导致部分分类器分类错误,从而输出分类结果错误率增加。
${{Y}_{x}}=\underset{j=1}{\overset{n}{\mathop \max }}\,\sum\limits_{i=1}^{m}{{{p}_{ij}}}$ | (8) |
取大法使用于输出分类结果形式为每个行为类别标签概率情况。对每一个类别标签,首先找出所有基分类器给出的预测类别标签可能是它的概率的最大值(式(9) ),然后这些值中最大的类别标签作为最终的分类结果。
${{Y}_{x}}=\underset{j=1}{\overset{n}{\mathop \max }}\,\left( \underset{i=1}{\overset{m}{\mathop{Max\text{ }{{p}_{ij}}}}}\, \right)$ | (9) |
均值法适用于输出分类结果形式为每个类别标签概率情况。对每一个类别标签,首先将所有基分类器给出的预测类别标签可能是它的概率相加并求平均值(式(10) ),然后这些值中最大的类别标签作为最终的分类结果。
${{Y}_{x}}=\underset{j=1}{\overset{n}{\mathop \max }}\,\left( \underset{i=1}{\overset{m}{\mathop{avg\text{ }{{p}_{ij}}}}}\, \right)$ | (10) |
在式(8) 、(9) 以及(10) 中,Yx表示输出行为标签,p表示基分类器预测成某种行为的概率,m表示行为的种类数,n表示基分类器的个数。
把上述三种融合算法依次放到MCFM模型中,输入数据集不变,统计每一种融合算法的输出结果,并与HRWV算法的输出结果对比,得到行为识别准确率对比如图 5所示。
由图 5可以看出,本文提出的基于HRWV算法的MCFM模型各行为的识别准确率比基于其他三种融合算法的行为识别准确率都高,对五种日常行为的平均识别准确率达到94.88%。其中效果最好的是跑步,识别准确率达到99.18%,而其他三种算法对跑步的识别准确率最大的是92.45%;HRWV算法对散步和静止的识别准确率都达到了97%以上,其中散步的识别准确率比均值法提高了20%;均值法和传统投票法对上楼和下楼的识别效果很差,只达到了约60%和70%,而HRWV算法和取大法都达到了85%以上,相比取大法,HRWV算法在上楼和下楼的识别准确率上又高出了3.02%。总之,采用HRWV算法对五种行为识别准确率比其他三种算法都明显提高,提高范围约在3%到30%。通过以上实验数据分析,进一步验证了本文提出的算法优于其他一般算法。
3 结语为了提高人体行为识别的准确率,本文提出了行为识别模型MCFM。该模型针对五种日常行为,从智能手机中提取其传感器信息,经过预处理并基于蚁群算法进行特征优选,优选出与这五种行为相关度最高的特征集,输入到决策树、支持向量机和BP神经网络三个基分类器,并根据融合器对三个基分类器的输出进行融合处理,得到行为识别结果。本文提出的MCFM对五种日常行为的平均识别准确率达94.88%,实验结果充分证明了本模型的可行性。
[1] | 赵晓健, 曾晓勤. 基于稠密光流轨迹和稀疏编码算法的行为识别方法[J]. 计算机应用, 2016, 36 (1) : 181-187. ( ZHAO X J, ZENG X Q. Action recognition method based on dense optical flow trajectory and sparse coding algorithm[J]. Journal of Computer Applications, 2016, 36 (1) : 181-187. ) |
[2] | 王忠民, 曹栋. 基于蚁群算法的行为识别特征优选方法[J]. 西安邮电大学学报, 2014, 19 (1) : 73-77. ( WANG Z M, CAO D. A feature selection method for behavior recognition based on ant colony algorithm[J]. Journal of Xi'an University of Posts & Telecommunications, 2014, 19 (1) : 73-77. ) |
[3] | 赵海勇, 贾保先. 基于轮廓特征的人体行为识别[J]. 计算机科学, 2013, 40 (2) : 312-315. ( ZHAO H Y, JIA B X. Human action recognition using image contour[J]. Computer Science, 2013, 40 (2) : 312-315. ) |
[4] | LEE Y S L, CHO S B. Activity recognition with android phone using mixture-of-experts co-trained with labeled and unlabeled data[J]. Neurocomputing, 2014, 126 (3) : 106-115. |
[5] | THIEMJARUS S. A device-orientation independent method for activity recognition[C]//Proceedings of the 2010 IEEE International Conference on Body Sensor Networks. Washington, DC:IEEE Computer Society, 2010:19-23. |
[6] | 李军怀, 严其松, 王志晓, 等. 基于CHMMs的自适应行为识别方法[J]. 计算机应用研究, 2014, 31 (10) : 3037-3034. ( LI J H, YAN Q S, WANG Z X, et al. Self-adaptive recognition method based on CHMMs[J]. Application Research of Computers, 2014, 31 (10) : 3037-3034. ) |
[7] | KUNCHEV L I. Combining pattern classifiers:methods and algorithms[M]. Hoboken, NJ: Wiley-Interscience, 2004 : 101 -109. |
[8] | 张春霞, 张讲社. 选择集成学习算法综述[J]. 计算机学报, 2011, 34 (8) : 1399-1407. ( ZHANG C X, ZHANG J S. A survey of selective ensemble learning algorithms[J]. Chinese Journal of Computers, 2011, 34 (8) : 1399-1407. doi: 10.3724/SP.J.1016.2011.01399 ) |
[9] | ZHOU Z H. Ensemble learning[M]. New York: Springer US, 2009 : 270 -273. |
[10] | 贾澎涛, 何华灿. 多分类器系统的泛组合规则研究与应用[J]. 计算机工程与应用, 2012, 48 (17) : 48-52. ( JIA P T, HE H C. Research and application of universal combination rule of multiple classifiers system[J]. Computer Engineering and Applications, 2012, 48 (17) : 48-52. ) |
[11] | YUAN Y, WANG C, ZHANG J Z, et al. An ensemble approach for activity recognition with accelerometer in mobile-phone[C]//Proceedings of the 17th IEEE International Conference on Computational Science and Engineering. Piscataway, NJ:IEEE, 2014:1469-1474. |
[12] | 衡霞, 王忠民. 基于手机加速度传感器的人体行为识别[J]. 西安邮电大学学报, 2014, 19 (6) : 76-79. ( HENG X, WANG Z M. Human activity recognition based on accelerometer data from a mobile phone[J]. Journal of Xi'an University of Posts & Telecommunications, 2014, 19 (6) : 76-79. ) |
[13] | PARK J G, PATEL A, CURTIS D, et al. Online pose classification and walking speed estimation using handheld devices[C]//UbiComp'12:Proceedings of the14th ACM Conference on Ubiquitous Computing. New York:ACM, 2012:113-122. |
[14] | KWAPISZ J R, WEISS G M, MOORE S A. Activity recognition using cell phone accelerometers[J]. ACM SIGKDD Explorations Newsletter, 2011, 12 (2) : 74-82. doi: 10.1145/1964897 |
[15] | CLELAND I, KIKHIA B, NUGENT C, et al. Optimal placement of accelerometers for the detection of everyday activities[J]. Sensors, 2013, 13 (7) : 9183-9200. doi: 10.3390/s130709183 |
[16] | DENG W Y, ZHENG Q H, WANG Z M. Cross-person activity recognition using reduced kernel extreme learning machine[J]. Neural Networks, 2014, 53 : 1-7. doi: 10.1016/j.neunet.2014.01.008 |
[17] | CHOU P A, MOHR A E, WANG A, et al. Error control for receiver-layered multicast of audio and video[J]. IEEE Transactions on Multimedia, 2000, 3 (1) : 108-122. |
[18] | ZHOU Z H, ROLI F, KITTLER J, e d. Multiple Classifier Systems[M]. Berlin: Springer, 2013 : 37 -48. |
[19] | ROKACH L, MAIMON O, ARBEL R. Selective voting-getting more for less in sensor fusion[J]. International Journal of Pattern Recognition and Artificial Intelligence, 2006, 20 (3) : 329-350. doi: 10.1142/S0218001406004739 |