一种基于多层聚类模型的居民日常行为识别方法技术

技术编号:20844200 阅读:28 留言:0更新日期:2019-04-13 08:54
本发明专利技术提供一种基于多层聚类模型的居民日常行为识别方法,包括:对训练集中的传感器事件流根据日常行为实例进行分割;通过K近邻算法进行聚簇,统计样本在每个簇下的分布;判断任意两个日常行为是否存在耦合;计算耦合集中日常行为的耦合度,降序排列;去除训练集中耦合度最大的行为实例;判断训练集是否存在耦合;使用分类模型对测试集中的行为实例进行分类;判断训练子集与原始的训练集间关系。本发明专利技术提出的多层聚类模型的行为分类方法对行为实例进行聚类,根据日常行为的耦合度对行为实例进行分步识别,克服了单层的分类方法由于行为实例耦合度较高导致分类性能较差的问题。从理论上讲,使用本发明专利技术将显著地提升居民日常行为的准确率和召回率。

【技术实现步骤摘要】
一种基于多层聚类模型的居民日常行为识别方法
本专利技术涉及行为识别
,具体而言,尤其涉及一种基于多层聚类模型的居民日常行为识别方法。
技术介绍
目前居民日常行为识别的基本流程本质上是一个机器学习领域的多分类问题:首先定义日常行为的特征集,然后计算初始训练集中每个日常行为实例在特征集中每个特征下的特征值,接着使用训练集对分类器进行训练,最后使用训练后的分类器对测试的行为实例进行分类。居民日常行为实例是一组由日常行为触发的传感器事件流,随着日常行为类别的增加,不同行为触发的传感器事件流存在着较高的相似性,而同一行为触发的传感器事件流相似度则可能较低,这种情况导致了单层的分类模型往往难以取得令人满意的分类效果。
技术实现思路
根据上述提出的技术问题,而提供一种基于多层聚类模型的居民日常行为识别方法。本专利技术一种基于多层聚类模型的居民日常行为识别方法,其特征在于,至少包括以下步骤:S1:对训练集中的传感器事件流根据日常行为实例进行分割,以传感器类别作为分类属性,所述训练集中每个行为实例作为训练样本,行为实例在传感器出现的频率作为所述行为实例在传感器下的取值;S2:根据预设的日常行为类别数量,通过K近邻算法对所述训练集中的样本进行聚簇,统计所述样本在每个簇下的分布;S3:根据所述样本在每个簇下的分布,判断任意两个日常行为是否存在耦合;如果所述两个日常行为拥有大于等于一个共同簇,则所述两个日常行为存在耦合,所有耦合的日常行为对构成日常行为耦合集;如果所述两个日常行为拥有小于一个共同簇,则所述两个日常行为不耦合;S4:计算所述耦合集中日常行为的耦合度;根据所述日常行为的耦合度,对出现在所述耦合集中的日常行为,按照所述耦合度值从大到小,降序排列;S5:去除所述训练集中耦合度最大的行为实例;S6:判断所述训练集是否存在耦合;如果所述训练集中任意两个日常行为均不存在耦合,则所述训练集为无耦合行为的训练子集,则执行步骤S7;如果所述训练集中任意两个日常行为存在耦合,则重复步骤S2-步骤S5;S7:根据极大无耦合行为的训练子集训练分类模型,使用分类模型对测试集中的行为实例进行分类;S8:当极大无耦合行为的训练子集不等于原始的训练集时,则从初始的训练集中删除极大无耦合行为的训练子集,作为新的训练集并从测试集中删除已经分类后的行为样本,作为测试集,执行步骤S2;当极大无耦合行为的训练子集等于原始的训练集时,日常行为识别结束。进一步地,所述计算所述耦合集中日常行为的耦合度,设每个行为的耦合度初值为0,如果所述日常行为在所述耦合集中出现一次,则所述日常行为的耦合加1。更进一步地,所述传感器类别至少包括:压力传感器,温度传感器,光传感器。进一步地,所述K近邻算法至少包括以下步骤:S21:准备数据并对数据进行预处理;S22:选用合适的数据结构存储训练数据和测试元组;S23:设定参数,如k;S24:按照大小为k的按距离由大至小的降序优先级队列,存储最近邻训练元组;随机从所述训练元组中选取k个元组作为初始的最近邻元组;分别计算测试元组到这k个元组的距离,将训练元组标号和距离存入优先级队列;S25:遍历所述训练元组,计算当前训练元组与测试元组的距离,将所得距离L与优先级队列中的最大距离Lmax;S26:若L≥Lmax,则舍弃所述元组,遍历下一个元组;若L<Lmax,则删除优先级队列中最大距离的元组,将当前训练元组存入优先级队列;S27:遍历完毕,计算优先级队列中k个元组的多数类,并将其作为测试元组的类别;S28:测试元组集测试完毕后计算误差率,继续设定不同的k值重新进行训练,最后取误差率最小的k值。本专利技术的优点在于:本专利技术提出的多层聚类模型的行为分类方法对行为实例进行聚类,根据日常行为的耦合度对行为实例进行分步识别,克服了单层的分类方法由于行为实例耦合度较高导致分类性能较差的问题。从理论上讲,使用本专利技术将显著地提升居民日常行为的准确率和召回率。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术整体流程示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。如图1所示,本专利技术一种基于多层聚类模型的居民日常行为识别方法,其特征在于,至少包括以下步骤:S1:对训练集中的传感器事件流根据日常行为实例进行分割,以传感器类别作为分类属性,所述训练集中每个行为实例作为训练样本,行为实例在传感器出现的频率作为所述行为实例在传感器下的取值。作为优选的实施方式,本申请的训练集训练集为一组连续的行为实例,每一个行为实例会连续触发一系列的传感器。作为本申请一种优选的实施方式,日常行为实例是指一种行为在同一天会多次出现,一次出现称为一个实例,可以理解为在本申请中所说的实例可以包括诸如“睡觉”、“做饭”,“看电视”等行为。作为优选的实施方式,所述传感器类别至少包括:压力传感器,温度传感器,光传感器。可以理解为在其它的实施方式中,还可以包含其它的传感器只要能够采集日常行为信息即可。S2:根据预设的日常行为类别数量,通过K近邻算法对所述训练集中的样本进行聚簇,统计所述样本在每个簇下的分布。S3:根据所述样本在每个簇下的分布,判断任意两个日常行为是否存在耦合;如果所述两个日常行为拥有大于等于一个共同簇,则所述两个日常行为存在耦合,所有耦合的日常行为对构成日常行为耦合集;如果所述两个日常行为拥有小于一个共同簇,则所述两个日常行为不耦合。S4:计算所述耦合集中日常行为的耦合度;根据所述日常行为的耦合度,对出现在所述耦合集中的日常行为,按照所述耦合度值从大到小,降序排列。S5:去除所述训练集中耦合度最大的行为实例。S6:判断所述训练集是否存在耦合;如果所述训练集中任意两个日常行为均不存在耦合,则所述训练集为无耦合行为的训练子集,则执行步骤S7;如果所述训练集中任意两个日常行为存在耦合,则重复步骤S2-步骤S5。S7:根据极大无耦合行为的训练子集训练分类模型,使用分类模型对测试集中的行为实例进行分类。在本实施方式中,分类模型选择“随机森林”分类器,可以理解为在其它的实施方式中,所述分本文档来自技高网
...

【技术保护点】
1.一种基于多层聚类模型的居民日常行为识别方法,其特征在于,至少包括以下步骤:S1:对训练集中的传感器事件流根据日常行为实例进行分割,以传感器类别作为分类属性,所述训练集中每个行为实例作为训练样本,行为实例在传感器出现的频率作为所述行为实例在传感器下的取值;S2:根据预设的日常行为类别数量,通过K近邻算法对所述训练集中的样本进行聚簇,统计所述样本在每个簇下的分布;S3:根据所述样本在每个簇下的分布,判断任意两个日常行为是否存在耦合;如果所述两个日常行为拥有大于等于一个共同簇,则所述两个日常行为存在耦合,所有耦合的日常行为对构成日常行为耦合集;如果所述两个日常行为拥有小于一个共同簇,则所述两个日常行为不耦合;S4:计算所述耦合集中日常行为的耦合度;根据所述日常行为的耦合度,对出现在所述耦合集中的日常行为,按照所述耦合度值从大到小,降序排列;S5:去除所述训练集中耦合度最大的行为实例;S6:判断所述训练集是否存在耦合;如果所述训练集中任意两个日常行为均不存在耦合,则所述训练集为无耦合行为的训练子集,则执行步骤S7;如果所述训练集中任意两个日常行为存在耦合,则重复步骤S2‑步骤S5;S7:根据极大无耦合行为的训练子集训练分类模型,使用分类模型对测试集中的行为实例进行分类;S8:当极大无耦合行为的训练子集不等于原始的训练集时,则从初始的训练集中删除极大无耦合行为的训练子集,作为新的训练集并从测试集中删除已经分类后的行为样本,作为测试集,执行步骤S2;当极大无耦合行为的训练子集等于原始的训练集时,日常行为识别结束。...

【技术特征摘要】
1.一种基于多层聚类模型的居民日常行为识别方法,其特征在于,至少包括以下步骤:S1:对训练集中的传感器事件流根据日常行为实例进行分割,以传感器类别作为分类属性,所述训练集中每个行为实例作为训练样本,行为实例在传感器出现的频率作为所述行为实例在传感器下的取值;S2:根据预设的日常行为类别数量,通过K近邻算法对所述训练集中的样本进行聚簇,统计所述样本在每个簇下的分布;S3:根据所述样本在每个簇下的分布,判断任意两个日常行为是否存在耦合;如果所述两个日常行为拥有大于等于一个共同簇,则所述两个日常行为存在耦合,所有耦合的日常行为对构成日常行为耦合集;如果所述两个日常行为拥有小于一个共同簇,则所述两个日常行为不耦合;S4:计算所述耦合集中日常行为的耦合度;根据所述日常行为的耦合度,对出现在所述耦合集中的日常行为,按照所述耦合度值从大到小,降序排列;S5:去除所述训练集中耦合度最大的行为实例;S6:判断所述训练集是否存在耦合;如果所述训练集中任意两个日常行为均不存在耦合,则所述训练集为无耦合行为的训练子集,则执行步骤S7;如果所述训练集中任意两个日常行为存在耦合,则重复步骤S2-步骤S5;S7:根据极大无耦合行为的训练子集训练分类模型,使用分类模型对测试集中的行为实例进行分类;S8:当极大无耦合行为的训练子集不等于原始的训练集时,则从初始的训练集中删除极大无耦合行为的训练子集,作为新的训练集并从测试集中删除已经分类后的行为样本,作为测试集,执行步骤S2;...

【专利技术属性】
技术研发人员:刘亚清王思文王湘鑫古竞轩宋溢洋
申请(专利权)人:大连海事大学
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1