改进朴素贝叶斯算法基于手机传感器的用户行为识别方法技术

技术编号:27602979 阅读:16 留言:0更新日期:2021-03-10 10:25
本发明专利技术提出了一种改进朴素贝叶斯算法基于手机传感器的用户行为识别方法,利用手机传感器采集的原始数据来训练改进的朴素贝叶斯机器学习模型,然后对数据进行分类识别,总体流程包括以下步骤:S1,数据采集与处理;S2,特征提取;S3,分类识别。首先利用智能手机所集成的传感器,采集不同行为下的数据信息并且进行预处理;然后对传感器单轴数据提取标准差、均值、波峰波谷、波峰间隔、相关系数等特征属性,对两轴间数据提取均值比和绝对差均值特征属性;其次利用改进的朴素贝叶斯算法,该算法将属性加权和实例加权相结合,核心是将属性权重纳入朴素贝叶斯分类公式,利用实例加权训练数据估计先验概率和条件概率。最后根据训练集得到各分类的先验概率,然后获得未知类别样本的后验概率,通过比较概率大小得到未知类别样本的分类实现对行为的分类。的分类实现对行为的分类。的分类实现对行为的分类。

【技术实现步骤摘要】
改进朴素贝叶斯算法基于手机传感器的用户行为识别方法


[0001]本专利技术涉及用户行为识别方法,尤其是涉及一种改进朴素贝叶斯的基于手机传感器的行为识别方法。
技术背景:
[0002]用户行为识别技术是通过对用户的外在行为进行分析从而得到用户行为模式的过程,在人工智能、模式识别等领域有着广泛的应用前景。由于传感器数据能够反映出人体行为的不同特征,目前有大量可穿戴传感器的相关研究,比如采用三轴加速度传感器和陀螺仪结合的方式构造了老年人活动感知设备,两个加速度传感器佩戴在右手臂前后来解决交互式游戏中的上肢动作识别问题。但是研究者需要在在不同的身体部位,如臂膀、腰部、大腿、手腕、脚踝等,设置专用运动传感器来捕获行为数据,这些传感器对佩戴者日常生活工作造成影响,不能为活动监督或行为预测提供长期有效的解决方案,同时可穿戴设备存在市场价格昂贵,日常穿戴不便等不足随后研究热点转移到智能手机传感器上。
[0003]随着手机终端制造水平的不断提高,人们对行为识别理论研究的深入,智能手机自身集成了各种传感器,利用加速度计、陀螺仪、磁力计等传感器采集人体行为模式下的多种数据信息,结合机器学习的能力,可以识别出用户的行为。目前,手机作为人们日常生活工作中不可或缺的通讯设备,智能手机的随身携带的特性解决了数据采集的难题,智能手机中传感器可产生并记录大量运动相关的数据和信息。许多应用本文提出一种基于智能手机传感器并采用朴素贝叶斯机器学习算法识别用户行为的方法。

技术实现思路

[0004]本专利技术针对现有基于手机传感器的用户行为识别方法提出了一种改进朴素贝叶斯算法的行为识别方法。本专利技术利用手机传感器采集的原始数据来训练改进的朴素贝叶斯机器学习模型,然后对数据进行分类识别,总体流程包括原始数据采集与处理、特征提取、分类识别三大部分。首先利用智能手机中含有的加速度传感器、陀螺仪、方向传感器、磁场传感器等,采集不同行为下的数据信息并且进行预处理;然后对数据提取标准差、均值、极差、波峰波谷、波峰间隔、相关系数等不同特征值,得到特征向量;其次利用改进的朴素贝叶斯算法,该算法将属性加权和实例加权相结合,核心是将属性权重纳入朴素贝叶斯分类公式,利用实例加权训练数据估计先验概率和条件概率。最后根据训练集得到各分类的先验概率,然后获得未知类别样本的后验概率,通过比较概率大小得到未知类别样本的分类实现对行为的分类。
[0005]一种改进朴素贝叶斯算法基于手机传感器的用户行为识别方法,
[0006]S1:通过用户手机内置的加速度传感器、陀螺仪、方向传感器、磁场传感器采集数据,并对数据进行噪声去除、数据分离、数据加窗处理;
[0007]S2:以均值、标准差、极差、波峰波谷、波峰间隔、相关系数作为提取单轴数据的特征对步骤S1的数据进行特征提取,采用均值比、绝对差均值作为提取三轴中两两数据之间
的相关性特征;
[0008]S3:基于步骤S2的特征对用户行为进行识别,具体包括
[0009]S31:对数据特征选择并对数据进行预分类,确定实验训练数据集和测试数据集;
[0010]S32:将步骤S31中的已知实验训练数据集通过公式(16)-(20)得到先验概率,构建AIWNB分类器:
[0011][0012][0013]式中是第i个训练实例c中特征a
j
的权重,n是训练实例的总数,n
j
是第j个属性A
j
值的数量,c
i
是第 i个训练实例的类标签,l是等式中的类别的总数
[0014]的计算公式具体如下:
[0015]首先,计算测试和训练实例之间的相似度,设x为测试实例,y
i
为第i个训练实例,它们之间的相似度定义为s(x,y
i
):
[0016][0017][0018][0019]S33:将步骤S31中测试集数据通过步骤S32训练好的分类器对测试集数据进行分类,通过公式(21)-(27) 计算未进行分类的数据后验概率,从而实现行为识别;
[0020]定义属性加权朴素贝叶斯公式为:
[0021][0022][0023]属性-类别相关性和属性-属性相互关系分别定义为:
[0024][0025][0026]式中C是所有可能的类标签c的集合,a
j
和a
k
分别为属性A
j
和A
j
的值。
[0027]为了保证结果的真实性,将I(A
j
;C)和I(A
j
;A
k
)归一化为NI(A
j
;C)和NI(A
j
;A
k
)
[0028][0029][0030]式中NI(A
j
;C)代表属性-类别相关性,NI(A
j
;A
k
)代表属性-属性间的冗余度。
[0031]属性权重定义为互相关性与平均互冗余的差值,是第j个属性的权重,应在[0,1]范围内,利用logistic函数转换具体公式如下:
[0032][0033][0034]进一步地,所述步骤S1,采集环境设为室内楼宇,采集的行为活动包括:跑步、行走、站立、坐、上下楼梯、乘直升电梯,同时采集过程中坐标系的定义是相对于设备屏幕的默认方向。
[0035]进一步地,所述步骤S1中,对采集的数据进行预处理,预处理包括以下步骤:
[0036]S1-1噪声去除:采用移动平均过滤器过滤原始数据,减少波形的抖动和毛刺;
[0037]将连续的采样数据看成一个长度固守为N的队列,在新的一次测量后,上述队列的首数据去掉,其余N-1 个数据依次前移,并将新的采样数据插入,作为新队列的尾;然后对这个队列进行算术运算,并将其结果作为本次测量的结果;选择窗口大小为4的移动平均过滤器对采集的数据进行去除噪声,移动平均过滤的公式如下所示:
[0038][0039]在式中,x[i+j]∈N,y[i]是经过移动平均滤波器过滤后的输出数据,M是移动平均过滤的窗口大小,即是移动平均滤波器中使用的固定大小M子集的样本个数。
[0040]S1-2数据分离:采集的各轴加速度有人体运动产生的线性加速度和重力加速度,通过一阶数字低通滤波器分离重力加速度和线性加速度,定义如下:
[0041]y[n]=α
·
x[n]+(1-α)
·
y[n-1]ꢀꢀꢀ
(2)
[0042]其中x是输入数据,y是过滤后的输出数据。α是一个与采样周期和时间常数相关的滤波器的系数,其值大于 0且小于1,用于确定新的样本在滤波中所占的权重;
[0043]分离重力加速度和线性加速度的截止频率为0.3Hz;截止频率公式如下:
[0044][0045]其中α为滤波系数,t为采样时间间隔,π为圆周率,f
c
为截止频率;
[0046]S1-本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种改进朴素贝叶斯算法基于手机传感器的用户行为识别方法,其特征在于,包括以下步骤:S1:通过用户手机内置的加速度传感器、陀螺仪、方向传感器、磁场传感器采集数据,并对数据进行噪声去除、数据分离、数据加窗处理;S2:以均值、标准差、极差、波峰波谷、波峰间隔、相关系数作为提取单轴数据的特征对步骤S1的数据进行特征提取,采用均值比、绝对差均值作为提取三轴中两两数据之间的相关性特征;S3:基于步骤S2的特征对用户行为进行识别,具体包括S31:对数据特征选择并对数据进行预分类,确定实验训练数据集和测试数据集;S32:将步骤S31中的已知实验训练数据集通过公式(16)-(20)得到先验概率,构建AIWNB分类器:AIWNB分类器:式中是第i个训练实例c中特征a
j
的权重,n是训练实例的总数,n
j
是第j个属性A
j
值的数量,c
i
是第i个训练实例的类标签,l是等式中的类别的总数是第i个训练实例的类标签,l是等式中的类别的总数的计算公式具体如下:首先,计算测试和训练实例之间的相似度,设x为测试实例,y
i
为第i个训练实例,它们之间的相似度定义为s(x,y
i
):):):S33:将步骤S31中测试集数据通过步骤S32训练好的分类器对测试集数据进行分类,通过公式(21)-(27)计算未进行分类的数据后验概率,从而实现行为识别;定义属性加权朴素贝叶斯公式为:
属性-类别相关性和属性-属性相互关系分别定义为:属性相互关系分别定义为:式中C是所有可能的类标签c的集合,a
j
和a
k
分别为属性A
j
和A
k
的值;为了保证结果的真实性,将I(A
j
;C)和I(A
j
;A
k
)归一化为NI(A
j
;C)和NI(A
j
;A
k
))式中NI(A
j
;C)代表属性-类别相关性,NI(A
j
;A
k
)代表属性-属性间的冗余度;属性权重定义为互相关性与平均互冗余的差值,是第j个属性的权重,应在[0,1]范围内,利用logistic函数转换具体公式如下:围内,利用logistic函数转换具体公式如下:2.根据权利要求1所述的改进朴素贝叶斯算法基于手机传感器的用户行为识别方法,其特征在于,所述步骤S1,采集环境设为室内楼宇,采集的行为活动包括:跑步、行走、站立、坐、上下楼梯、乘直升电梯,同时采集过程中坐标系的定义是相对于设备屏幕的默认方向。3.根据权利要求1所述的改进朴素贝叶斯算法基于手机传感器的用户行为识别方法,其特征在于,所述步骤S1中,对采集的数据进行预处理,预处理包括以下步骤:S1-1噪声去除:采用移动平均过滤器过滤原始数据,减少波形的抖动和毛刺;将连续的采样数据看成一个长度固守为N的队列,在...

【专利技术属性】
技术研发人员:王庆李静严超张波许九靖刘鹏飞
申请(专利权)人:江苏集萃未来城市应用技术研究所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1