基于交互式多任务模型进行日常活动预测方法技术

技术编号:27420304 阅读:29 留言:0更新日期:2021-02-21 14:38
本发明专利技术提供一种基于交互式多任务模型进行日常活动预测方法。本发明专利技术方法将多头注意力机制,卷积神经网络及双向长短时记忆单元进行结合,生成并行多任务活动预测模型。本发明专利技术的技术方案解决了现有技术中的有技术共享全部参数,对于任务之间弱关联的情况预测效果较差;预测时间任务学习到的特征表征能力不够,导致误差较大。因此在训练过程中预测活动类别任务会先达到局部最优,继续训练最终导致该任务出现过拟合以及预测活动类别任务与预测活动时间任务之间存在一定的相关性,现有技术仅通过错误反向传播相互影响存在一定的不可控性的问题。性的问题。性的问题。

【技术实现步骤摘要】
基于交互式多任务模型进行日常活动预测方法


[0001]本专利技术涉及活动预测方法的
,具体而言,尤其涉及基于交互式多任务模型进行日常活动预测方法。

技术介绍

[0002]目前利用多任务解决智能家居中预测问题的主要方法是:首先将原始传感器序列划分为一系列固定长度的窗口,提取窗口中的相关信息作为特征,然后,构建带有卷积神经网络和双向长短时网络的模型作为预测多任务模型,同时预测活动类别及其发生时间。
[0003]就目前的现有技术,存在有以下几点问题:
[0004]1、多任务学习模型共享全部的参数,适用于具有强关联的多任务学习(活动大致在一个固定的时间段内发生)。对于弱关联的多任务(活动没有固定的发生时间)预测误差较大。
[0005]2、多任务联合损失函数的损失权重属于手动调节,但是所选择的权重值不一定是最合适的。
[0006]3、活动类别预测与活动时间预测两个任务训练难易程度不同,活动时间预测获得的表征能力不够,预测误差较大。因此在并行训练中可能会出现活动类别预测任务先于活动时间预测任务达到局部最优,但由于联合损失作用还需继续训练,导致活动类别预测产生过拟合。

技术实现思路

[0007]根据上述提出预测误差较大、所选择的权重值不一定是最合适的以及导致活动类别预测产生过拟合的技术问题,而提供一种基于交互式多任务模型进行日常活动预测方法。本专利技术主要利用基于交互式多任务模型进行日常活动预测方法,其特征在于,包括:活动类别预测步骤及活动发生时间预测步骤;
[0008]所述活动类别预测步骤还包括以下步骤:
[0009]步骤S11:提取传感器事件相关的样本特征组X={x1,x2,...,x
n
}与窗口中窗口中最后一个发生的活动活动标签信息;
[0010]步骤S12:将所述窗口中最近的活动标签信息输入到一维卷积层中,提取序列的短期模式;
[0011]步骤S13:将卷积后的所述短期模式输入到最大池化层中进行最大池化;
[0012]步骤S14:将池化后的结果输入到双向长短时记忆网络中;
[0013]步骤S15:双向长短时记忆网络输出预测类别的特征f
AC

[0014]步骤S16:将预测类别的特征输入到全连接层中进行分类判断;
[0015]步骤S17:全连接层的输出则为下一个活动类别的概率值。
[0016]进一步地,所述活动发生时间预测步骤还包括以下步骤:
[0017]步骤S21:提取传感器事件相关的样本特征组X={x1,x2,...,xn}与窗口中最近的
活动标签信息;
[0018]步骤S22:将所述样本特征组X与窗口中最近的活动标签信息输入到一维卷积层中,提取序列的短期模式;
[0019]步骤S23:将卷积后的结果输入到最大池化层中进行最大池化;
[0020]步骤S24:将池化后的结果输入到双向长短时记忆网络中;
[0021]步骤S25:双向长短时记忆网络输出预测时间特征f
AT

[0022]步骤S26:将预测时间的特征输入到多头自注意力机制模块中,并通过一个残差网络,直接与多头自注意力机制模块的输出进行融合;
[0023]步骤S27:将融合后的特征作为全连接层即激活ReLU的输入,进行回归判断;
[0024]步骤S28:全连接层的输出则为活动发生时间的预测值;
[0025]步骤S29:将活动发生时间的预测值与活动类别预测的最终输出进行信息回调,与f
AT
进行融合作为活动发生时间预测任务的特征,辅助该任务的学习;融合方式为公式(3),其中

表示拼接操作;其中f
AT
表示预测活动发生时间特征;
[0026][0027]较现有技术相比,本专利技术具有以下优点:
[0028]本专利技术将2个任务的输出估计作为较难任务的特征,进行信息回调,辅助较难任务的学习。对于弱关联的多任务学习,模型仍旧有很好的表现。通过不确定性(不同任务的参数分布方差不一样)来调整损失函数中的加权超参,优化极大似然分布同时动态规划任务的超参。使得每个任务的损失函数达到相似的尺度。同时将窗口中最近的活动信息作为特征的一部分。因为活动与活动之间是有关联的,加入了活动标签信息之后,两个任务的准确率都得到了提升。
[0029]相比较现有的多任务网络模型,本专利技术不仅对于活动类别的预测有了明显提升,而且对于较难任务
--
预测活动发生时间的准确率也有大幅度提高。
附图说明
[0030]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0031]图1为本专利技术活动类别预测流程图。
[0032]图2为本专利技术活动发生时间预测流程图。
具体实施方式
[0033]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0034]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0035]如图1-2所示,本专利技术提供了一种基于交互式多任务模型进行日常活动预测方法,包括:活动类别预测步骤及活动发生时间预测步骤。
[0036]作为一种优选的实施方式,在本申请中,所述活动类别预测步骤还包括以下步骤:
[0037]步骤S11:提取传感器事件相关的样本特征组X={x1,x2,...,x
n
}与窗口中窗口中最后一个发生的活动活动标签信息;例如:窗口中分别发生“做饭”,“吃早餐”,“刷碗”三个活动,最近的活动是“刷碗”。
[0038]步骤S12:将所述窗口中最近的活动标签信息输入到一维卷积层中,提取序列的短期模式;
[0039]步骤S13:将卷积后的所述短期模式输入到最大池化层中进行最大池化;
[0040]步骤S14:将池化后的结果输入到双向长短时记忆网络中;
[004本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于交互式多任务模型进行日常活动预测方法,其特征在于,包括:活动类别预测步骤及活动发生时间预测步骤;所述活动类别预测步骤还包括以下步骤:S11:提取传感器事件相关的样本特征组X={x1,x2,...,x
n
}与窗口中窗口中最后一个发生的活动活动标签信息;S12:将所述窗口中最近的活动标签信息输入到一维卷积层中,提取序列的短期模式;S13:将卷积后的所述短期模式输入到最大池化层中进行最大池化;S14:将池化后的结果输入到双向长短时记忆网络中;S15:双向长短时记忆网络输出预测类别的特征f
AC
;S16:将预测类别的特征输入到全连接层中进行分类判断;S17:全连接层的输出则为下一个活动类别的概率值。2.根据权利要求1所述的基于交互式多任务模型进行日常活动预测方法,其特征在于,所述活动发生时间预测步骤还包括以下步骤:S21:提取传感器事件相关的样本特征组X={x1,x2...

【专利技术属性】
技术研发人员:刘亚清谢若莹宫珊珊丰阳余芸倩
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1