基于频繁传感器事件序列的日常行为特征挖掘及计算方法技术

技术编号:20993347 阅读:28 留言:0更新日期:2019-04-29 23:06
本发明专利技术提供一种基于频繁传感器事件序列的日常行为特征挖掘及计算方法,包括:识别模型训练和行为识别测试两阶段;识别模型训练包括:通过设置的多个非入侵式传感器采集居民日常行为按照时间顺序连续地触发的传感器事件序列;对采集到的传感器事件序列进行预处理,预处理将传感器事件序列分割为多个以日常行为为单位的子序列;挖掘频繁出现的传感器事件序列,作为居民日常行为的特征;计算居民日常行为在特征上的取值。本发明专利技术克服了预定义特征和离散特征的缺点,使用频繁序列模式挖掘方法全面有效地挖掘到居民日常行为的连续特征,并且提出了特征值的计算算法,因此从理论上讲,使用本发明专利技术挖掘出的特征将显著地提升居民日常行为的精确率和召回率。

Mining and Computing Daily Behavior Features Based on Frequent Sensor Event Sequence

The invention provides a method for mining and calculating daily behavior characteristics based on frequent sensor event sequence, which includes two stages: recognition model training and behavior recognition testing; recognition model training includes: collecting sensor event sequence triggered by residents'daily behavior in time sequence by setting multiple non-invasive sensors; and collecting sensor event sequence. Pre-processing divides the sensor event sequence into several subsequences based on daily behavior; mining frequent sensor event sequence as the characteristics of residents'daily behavior; and calculating the value of residents' daily behavior on characteristics. The invention overcomes the shortcomings of predefined features and discrete features, uses frequent sequential pattern mining method to fully and effectively mine the continuous features of residents'daily behavior, and proposes an algorithm for calculating the eigenvalues. Therefore, in theory, using the features excavated by the invention will significantly improve the accuracy and recall rate of residents' daily behavior.

【技术实现步骤摘要】
基于频繁传感器事件序列的日常行为特征挖掘及计算方法
本专利技术涉及行为挖掘计算
,具体而言,尤其涉及一种基于频繁传感器事件序列的日常行为特征挖掘及计算方法。
技术介绍
目前居民日常行为识别所使用的特征或者是预定义特征或者是离散特征。预定义特征一般包括行为开始的时刻、行为持续的时间,行为的密度、触发的传感器等等,预定义特征的获取相对容易,但是完全割裂了传感器事件之间的联系。由于表征居民日常行为的传感器事件是时间序列,而预定义特征和离散特征丢失了传感器事件的时间序列属性,导致预定义特征和离散特征的取值是行为、传感器触发的时刻或者特征出现频率统计的结果,这种离散的特征值最终阻碍了居民日常行为识别的质量。
技术实现思路
根据上述提出的技术问题,而提供一种基于频繁传感器事件序列的日常行为特征挖掘及计算方法。本专利技术基于频繁传感器事件序列的日常行为特征挖掘及计算方法,包括:识别模型训练和行为识别测试两阶段;所述识别模型训练至少包括以下步骤:S1:通过设置的多个非入侵式传感器采集居民日常行为按照时间顺序连续地触发的传感器事件序列;S2:对所述采集到的传感器事件序列进行预处理,所述预处理将所述传感器事件序列分割为多个以日常行为为单位的子序列;S3:挖掘频繁出现的传感器事件序列,作为居民日常行为的特征;S4:计算所述居民日常行为在特征上的取值;每一个传感器事件满足模式:<触发传感器,触发的日期,触发的时间,触发值>;所述居民日常行为触发的所述传感器事件通过文本流的形式记录;所述行为识别测试:采用有监督的机器学习方式训练分类器,使用训练后的分类器对待测试的行为进行识别。进一步的,标注日常行为所触发的传感器事件序列的开始点和结束点为所述居民日常行为。更进一步的,所述挖掘频繁出现的传感器事件序列通过使用频繁序列模式挖掘算法PrefixSpan挖掘隐藏在日常行为中的频繁传感器序列模式。更进一步的,对于一个日常行为和一个特征,该日常行为触发的传感器事件序列在该特征下的取值形式定义为一个矩阵,根据矩阵的值计算该日常行为在该特征下的取值;所述取值矩阵的每一行对应一个满足特征的传感器事件子序列,每一行的取值为<子序列中第一个传感器事件时刻,子序列中第二个传感器事件时刻,…,子序列中最后一个传感器事件时刻>。进一步的,对于所述居民日常行为特征,所述取值矩阵中找出具有最大秩的取值矩阵,进而扩展除所述具有最大秩的取值矩阵的矩阵,使得所述矩阵的秩等于所述取值矩阵中的最大秩;逐一比对搜索所有取值矩阵同最大秩矩阵的最佳匹配,通过皮尔逊相关系数计算每一个所述取值矩阵与最大秩矩阵的相似性,得到两个由行相似性构成的向量,再通过皮尔逊相关系数计算所述向量的相似性,所述向量的相似性为当前矩阵在当前特征的取值;设最大秩矩阵和最大值矩阵模式是n*m的矩阵,取值矩阵是k*m的矩阵,且k≤m;在最大矩阵模式的n行中选择k行,这k行用于存储取值矩阵中k行的值,选择k行为匹配;所述最佳匹配所有的所述匹配中使公式(1)的值最小:其中ai1表示最大值矩阵的第i行的第一个元素,bi1表示取值矩阵的第i行的第一个元素。较现有技术相比,本专利技术具有以下优点:本专利技术克服了预定义特征和离散特征的缺点,使用频繁序列模式挖掘方法全面有效地挖掘到居民日常行为的连续特征,并且提出了特征值的计算算法,因此从理论上讲,使用本专利技术挖掘出的特征将显著地提升居民日常行为的精确率和召回率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术整体流程示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。如图1所示,基于频繁传感器事件序列的日常行为特征挖掘及计算方法,其特征在于,包括:识别模型训练和行为识别测试两阶段。作为优选的实施方式,识别模型训练至少包括以下步骤:S1:通过设置的多个非入侵式传感器采集居民日常行为按照时间顺序连续地触发的传感器事件序列。作为本申请的优选的实施方式,所述居民日常行为包括睡觉、做饭、吃饭、打扫卫生、洗浴、吃药、看电视、招待客人等等。可以理解为在其它实施方式中还包含其它的行为方式,只要能够包含居民的日常行为即可。S2:对所述采集到的传感器事件序列进行预处理,所述预处理将所述传感器事件序列分割为多个以日常行为为单位的子序列。作为本申请优选的方式所述直接从传感器采集到的数据是传感器事件序列,预处理的工作是把传感器事件序列分割为若干以日常行为为单位的子序列。预处理的目的是为了统计各个日常行为的特征。S3:挖掘频繁出现的传感器事件序列,作为居民日常行为的特征;S4:计算所述居民日常行为在特征上的取值;每一个传感器事件满足模式:<触发传感器,触发的日期,触发的时间,触发值>;所述居民日常行为触发的所述传感器事件通过文本流的形式记录;所述行为识别测试:采用有监督的机器学习方式训练分类器,使用训练后的分类器对待测试的行为进行识别。在本实施方式中,标注日常行为所触发的传感器事件序列的开始点和结束点为所述居民日常行为。以完整的居民日常行为为单位,标注日常行为所触发的传感器事件序列的开始点和结束点。作为优选的实施方式,所述挖掘频繁出现的传感器事件序列通过使用频繁序列模式挖掘算法PrefixSpan挖掘隐藏在日常行为中的频繁传感器序列模式。挖掘频繁出现的传感器事件序列通过使用频繁序列模式挖掘算法PrefixSpan挖掘隐藏在日常行为中的频繁传感器序列模式。在本实施方式中,对于一个日常行为和一个特征,该日常行为触发的传感器事件序列在该特征下的取值形式定义为一个矩阵,根据矩阵的值计算该日常行为在该特征下的取值。取值矩阵的每一行对应一个满足特征的传感器事件子序列,每一行的取值为<子序列中第一个传感器事件时刻,子序列中第二个传感器事件时刻,…,子序列中最后一个传感器事件时刻>。作为优选的实施方式中,对于一个日常行为和一个特征,该日常行为触发的传感器事件序列在该特征下的取值形式定义为一个矩阵,根据矩阵的值计算该日常行为在该特征下的取值;所述取值矩阵的每一行对应一个满足本文档来自技高网
...

【技术保护点】
1.基于频繁传感器事件序列的日常行为特征挖掘及计算方法,其特征在于,包括:识别模型训练和行为识别测试两阶段;所述识别模型训练至少包括以下步骤:S1:通过设置的多个非入侵式传感器采集居民日常行为按照时间顺序连续地触发的传感器事件序列;S2:对所述采集到的传感器事件序列进行预处理,所述预处理将所述传感器事件序列分割为多个以日常行为为单位的子序列;S3:挖掘频繁出现的传感器事件序列,作为居民日常行为的特征;S4:计算所述居民日常行为在特征上的取值;每一个传感器事件满足模式:<触发传感器,触发的日期,触发的时间,触发值>;所述居民日常行为触发的所述传感器事件通过文本流的形式记录;所述行为识别测试:采用有监督的机器学习方式训练分类器,使用训练后的分类器对待测试的行为进行识别。

【技术特征摘要】
1.基于频繁传感器事件序列的日常行为特征挖掘及计算方法,其特征在于,包括:识别模型训练和行为识别测试两阶段;所述识别模型训练至少包括以下步骤:S1:通过设置的多个非入侵式传感器采集居民日常行为按照时间顺序连续地触发的传感器事件序列;S2:对所述采集到的传感器事件序列进行预处理,所述预处理将所述传感器事件序列分割为多个以日常行为为单位的子序列;S3:挖掘频繁出现的传感器事件序列,作为居民日常行为的特征;S4:计算所述居民日常行为在特征上的取值;每一个传感器事件满足模式:<触发传感器,触发的日期,触发的时间,触发值>;所述居民日常行为触发的所述传感器事件通过文本流的形式记录;所述行为识别测试:采用有监督的机器学习方式训练分类器,使用训练后的分类器对待测试的行为进行识别。2.根据权利要求1所述的基于频繁传感器事件序列的日常行为特征挖掘及计算方法,其特征还在于:标注日常行为所触发的传感器事件序列的开始点和结束点为所述居民日常行为。3.根据权利要求1所述的基于频繁传感器事件序列的日常行为特征挖掘及计算方法,其特征还在于:所述挖掘频繁出现的传感器事件序列通过使用频繁序列模式挖掘算法PrefixSpan挖掘隐藏在日常行为中的频繁传感器序列模式。4.根据权利要求1所述的基于频繁传感器事件序列的日常行为特...

【专利技术属性】
技术研发人员:刘亚清翟正国王湘鑫王思文宋溢洋
申请(专利权)人:大连海事大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1