一种融合时空因素的智能家居用户操控行为习惯建模方法技术

技术编号:20364614 阅读:32 留言:0更新日期:2019-02-16 17:18
本发明专利技术公开了一种融合时空因素的智能家居用户操控行为习惯建模方法,包括下述步骤:S1,结合无线网络或者有线网络,对用户所有智能家居设备的操控记录数据以及设备的地理位置信息进行采集;包括用户历史操控数据的读取和汇聚;本发明专利技术实现从用户历史操控数据中进行数据挖掘,得到用户的操控行为习惯并进行用户操控行为习惯的建模,有利于更高效率地根据用户当前的操作来预测用户下一步的操作,并形成一种更适合用户体验的智能家居操控行为推荐方案,同时增强了智能家居操控行为推荐方案的可扩展性,填补了传统算法的不足。

【技术实现步骤摘要】
一种融合时空因素的智能家居用户操控行为习惯建模方法
本专利技术涉及智能家居操控
,具体涉及一种融合时空因素的智能家居用户操控行为习惯建模方法。
技术介绍
智能家居用户操控行为习惯预测与推荐,即根据用户长期以来对所有智能家居设备的操控记录,并融合用户操控设备的时间以及所操控设备的空间信息,预测用户对该设备的操控行为习惯,并给予用户一套智能推荐方案。在传统的挖掘算法中主要有以下缺点:(1)传统的智能家居用户行为习惯挖掘算法缺乏对用户操控记录中时间以及空间信息的利用,从而造成所挖掘到的用户行为习惯脱离时间以及空间要素的限制而缺乏随时空特性;并未很好的将用户操控设备的时间信息以及所操控设备的空间信息进行有机融合来知道挖掘算法的进程,从而导致数据价值的丢失以及所挖掘到的用户行为习惯有一定的偏差;(2)在其他领域所提出的时空信息分析算法,如一些基于条件随机场CRF、贝叶斯网络以及模式识别算法的时空因果关系算法,虽能在一定程度上挖掘出用户操控设备在时间以及空间上的一些因果关系,但总体而言效率较低且不太适用于大规模的具有混杂特征的数据集。现有技术中,有YuZheng等人为了提高城市计算领域中控制污染物预测算法的预测能力以及解决控制质量监测站过于稀疏导致的预测效果不佳的问题,所提出的一种时空信息分析算法(ZhengY,LiuF,HsiehHP.U-Air:whenurbanairqualityinferencemeetsbigdata[C]//ACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDataMining.ACM,2013:1436-1444),该算法使用条件随机场CRF处理数据中的时间特征信息,而CRF算法不能很好地处理具有序列性的时间特征信息,即该算法无法高效处理具有先后顺序的时间数据。
技术实现思路
本专利技术的目的在于克服现有技术的缺点与不足,提供一种融合时空因素的智能家居用户操控行为习惯建模方法,该方法能够实现预处理用户行为习惯的操作数据,将用户操控记录中的时间特征(如设备操控时间)以及空间特征(如所操控设备的位置坐标信息)进行分离,然后分别将时间以及空间特征放进GRU神经网络以及GRU神经网络进行学习,接着将两部分学习模块的输出进行有机结合后形成用户对智能家居设备的操控行为习惯模型,以提高智能家居设备的智能化水平。本专利技术的目的通过下述技术方案实现:一种融合时空因素的智能家居用户操控行为习惯建模方法,包括下述步骤:S1,结合无线网络或者有线网络,对用户所有智能家居设备的操控记录数据以及设备的地理位置信息进行采集;包括用户历史操控数据的读取和汇聚;其中,数据加载模块包括在线入口和离线入口:在线入口支持直接从MySQL数据库根据用户ID读取相应的用户操控记录后,进行操控行为习惯的预测;离线入口则支持输入符合主流规范的csv文件路径并根据文件路径进行CSV本地记录文件的读取后,进行操控行为习惯的预测;S2,将用户数据进行数据预处理,实现各维度空间数据映射到相同的数据空间;数据预处理包括数据清洗、数据转换和数据标记;S2.1,数据清洗;数据清洗的主要任务为数据缺失值的处理,该处理方法为使用热卡填充法处理:对于一个包含缺失值的变量,热卡填充法在数据库中找到一个与它最相似的对象,然后用这个相似对象的值来进行填充;S2.2,数据转换;在用户操控记录中,每一列代表不同的数据空间,而数据空间之间往往由于取值范围,如日期和操控状态的取值范围不同,从而导致数据特征维度的不一致,为了实现数据维度的一致性,需要将不同空间的数据映射到相同的空间,因此使用公式(1)将其映射到取值范围为0-1之间的空间,公式(1)如下所示:其中date表示某一维度空间下的原始数据集,i为该数据集下的第i个数据点,min函数是取数据集中的最小值,max函数是取数据集中的最大值;而对于用户设备的位置坐标,则利用公式(2)将其进行0-1均值归一化处理,公式(2)如下所示:其中x′代表归一化转换后取值范围为0-1的坐标空间,x代表某一设备的位置坐标,即x=(X,Y),μ表示该设备位置坐标中X和Y的均值,即μ=(μX,μY),σ则代表位置坐标中X和Y的方差,即σ=(σX,σY);S2.3,数据标记;为实现推导式学习,挖掘出某一设备经过某一状态操控后将会触发哪些设备并进入什么状态的功能,则需要为用户的操控历史记录打上标记,打标记的具体规则为:某一记录的标记代表下一个被操控的设备及其操控状态;S3,将用户操控数据的时间特征和空间特征进行分离,并生成时间特征集和空间特征集;其中,时间特征主要是记录生成时间,即设备的操控时间,空间特征主要是记录设备的地理位置坐标;S4,特征学习;将用户操控数据的时间特征放进时间特征学习器中进行学习;同时将用户操控数据的空间特征放进空间特征学习器中进行学习;S5,学习结果的汇聚;将S4中学习的结果通过学习结果汇聚器进行相乘汇聚,得到最终的用户行为操控习惯模型;S6,预测阶段;如用户有新的操控记录被生成,则将该用户记录的特征输入到S5的用户行为操控习惯模型中,即可推导出用户接下来最有可能操控的设备及其操控状态,实现用户行为预测的功能。优选地,所述S4中的时间特征学习器为长短周期记忆神经网络GRU学习器;按记录产生时间的先后顺序将代表不同日期的N个用户历史操控行为的时间特征向量输入到GRU记忆神经网络中,并挖掘出潜在用户操控习惯时序特征;GRU神经网络的每一层有四个基本运算,其体系结构如下:1)更新门:更新信号通过公式(3)来决定本神经层得到的潜在用户操控习惯时序特征,将会以多大程度影响并更新上一神经层已得到的潜在用户操控习惯时序特征,并给出一个介乎0到1的权重Zt,公式(3)如下所示:Zt=σ(W(z)Xt+U(z)ht-1);(3)其中W(i)代表门控i的输入层的权重,U(i)代表门控i的隐含层的权重,其中i∈{z,r,h},z代表更新门,r代表重置门,h代表隐含状态更新门;Xt表示t时刻的输入,h表示不同GRU隐含层的隐含状态;记最后一层输出的隐含状态即用户时间特征的学习结果为hx;2)重置门:重置信号通过公式(4)判定新输入的新的用户操控记录的时间特征Xt的重要程度,并给出一个介乎0到1的权重rt,公式(4)如下所示:rt=σ(W(r)Xt+U(r)ht-1);(4)3)新记忆产生:GRU神经网络中的新记忆是指本神经层得到的代表潜在用户操控习惯时序特征的向量,即对新观察到的潜在用户操控习惯时序特征和上一神经层已得到的潜在用户操控习惯时序特征进行合并,并通过公式(5)将二者融合以得到本神经层的新的潜在用户操控习惯时序特征,公式(5)如下所示:其中表示该神经元最终输出的隐含状态,tanh表示双曲正切函数;4)隐层状态:GRU神经网络中的隐层状态是指经过本神经层处理后得到的新的潜在用户操控习惯时序特征;GRU神经网络根据1)得到的权重Zt,将本神经层得到的潜在用户操控习惯时序特征与上一神经层得到的潜在用户操控习惯时序特征进行结合,从而得到新的潜在用户操控习惯时序特征,并传递给下一个神经层进行处理,公式(6)如下所示:当隐层状态传递到最后一个神经层时,最后一个神经层的输出本文档来自技高网
...

【技术保护点】
1.一种融合时空因素的智能家居用户操控行为习惯建模方法,其特征在于,包括下述步骤:S1,结合无线网络或者有线网络,对用户所有智能家居设备的操控记录数据以及设备的地理位置信息进行采集;包括用户历史操控数据的读取和汇聚;其中,数据加载模块包括在线入口和离线入口:在线入口支持直接从MySQL数据库根据用户ID读取相应的用户操控记录后,进行操控行为习惯的预测;离线入口则支持输入符合主流规范的csv文件路径并根据文件路径进行CSV本地记录文件的读取后,进行操控行为习惯的预测;S2,将用户数据进行数据预处理,实现各维度空间数据映射到相同的数据空间;数据预处理包括数据清洗、数据转换和数据标记;S2.1,数据清洗;数据清洗的主要任务为数据缺失值的处理,该处理方法为使用热卡填充法处理:对于一个包含缺失值的变量,热卡填充法在数据库中找到一个与它最相似的对象,然后用这个相似对象的值来进行填充;S2.2,数据转换;在用户操控记录中,每一列代表不同的数据空间,而数据空间之间往往由于取值范围,如日期和操控状态的取值范围不同,从而导致数据特征维度的不一致,为了实现数据维度的一致性,需要将不同空间的数据映射到相同的空间,因此使用公式(1)将其映射到取值范围为0‑1之间的空间,公式(1)如下所示:...

【技术特征摘要】
1.一种融合时空因素的智能家居用户操控行为习惯建模方法,其特征在于,包括下述步骤:S1,结合无线网络或者有线网络,对用户所有智能家居设备的操控记录数据以及设备的地理位置信息进行采集;包括用户历史操控数据的读取和汇聚;其中,数据加载模块包括在线入口和离线入口:在线入口支持直接从MySQL数据库根据用户ID读取相应的用户操控记录后,进行操控行为习惯的预测;离线入口则支持输入符合主流规范的csv文件路径并根据文件路径进行CSV本地记录文件的读取后,进行操控行为习惯的预测;S2,将用户数据进行数据预处理,实现各维度空间数据映射到相同的数据空间;数据预处理包括数据清洗、数据转换和数据标记;S2.1,数据清洗;数据清洗的主要任务为数据缺失值的处理,该处理方法为使用热卡填充法处理:对于一个包含缺失值的变量,热卡填充法在数据库中找到一个与它最相似的对象,然后用这个相似对象的值来进行填充;S2.2,数据转换;在用户操控记录中,每一列代表不同的数据空间,而数据空间之间往往由于取值范围,如日期和操控状态的取值范围不同,从而导致数据特征维度的不一致,为了实现数据维度的一致性,需要将不同空间的数据映射到相同的空间,因此使用公式(1)将其映射到取值范围为0-1之间的空间,公式(1)如下所示:其中date表示某一维度空间下的原始数据集,i为该数据集下的第i个数据点,min函数是取数据集中的最小值,max函数是取数据集中的最大值;而对于用户设备的位置坐标,则利用公式(2)将其进行0-1均值归一化处理,公式(2)如下所示:其中x′代表归一化转换后取值范围为0-1的坐标空间,x代表某一设备的位置坐标,即x=(X,Y),μ表示该设备位置坐标中X和Y的均值,即μ=(μX,μY),σ则代表位置坐标中X和Y的方差,即σ=(σX,σY);S2.3,数据标记;为实现推导式学习,挖掘出某一设备经过某一状态操控后将会触发哪些设备并进入什么状态的功能,则需要为用户的操控历史记录打上标记,打标记的具体规则为:某一记录的标记代表下一个被操控的设备及其操控状态;S3,将用户操控数据的时间特征和空间特征进行分离,并生成时间特征集和空间特征集;其中,时间特征主要是记录生成时间,即设备的操控时间,空间特征主要是记录设备的地理位置坐标;S4,特征学习;将用户操控数据的时间特征放进时间特征学习器中进行学习;同时将用户操控数据的空间特征放进空间特征学习器中进行学习;S5,学习结果的汇聚;将S4中学习的结果通过学习结果汇聚器进行相乘汇聚,得到最终的用户行为操控习惯模型;S6,预测阶段;如用户有新的操控记录被生成,则将该用户记录的特征输入到S5的用户行为操控习惯模型中,即可推导出用户接下来最有可能操控的设备及其操控状态,实现用户行为预测的功能。2.根据权利要求1所述的融合时空因素的智能家居用户操控行为习惯建模方法,其特征在于,所述S4中的时间特征学习器为长短周期记忆神经网络GRU学习...

【专利技术属性】
技术研发人员:梁天恺曾碧刘建圻徐雅芸赵俊峰
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1