本发明专利技术公开了一种数据的处理方法和装置。其中,该方法包括:获取目标对象的行为信息,并基于行为信息的执行时间构成多个行为信息串;对行为信息串进行向量化处理,得到目标对象在多个不同时间段内的行为向量;通过对目标对象在多个不同时间段的行为向量进行聚类,确定目标对象在多个不同时间段内的习惯行为信息。本发明专利技术解决了现有技术中在数据量较小的情况难以准确的分析出用户的行为习惯的技术问题。
Data processing methods and devices
【技术实现步骤摘要】
数据的处理方法和装置
本专利技术涉及数据处理领域,具体而言,涉及一种数据的处理方法和装置。
技术介绍
随着时间的推移,人们越来越意识到数据的重要性。大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。例如,可以通过大数据分析对用户的行为习惯进行分析,目前通常是基于用户的各项行为的频次来进行,但针对单一的用户,或数据较少的群体用户,根据频次得到的行为习惯并不准确。针对现有技术中在数据量较小的情况难以准确的分析出用户的行为习惯的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据的处理方法和装置,以至少解决现有技术中在数据量较小的情况难以准确的分析出用户的行为习惯的技术问题。根据本专利技术实施例的一个方面,提供了一种数据的处理方法,包括:获取目标对象的行为信息,并基于行为信息的执行时间构成多个行为信息串;对行为信息串进行向量化处理,得到目标对象在多个不同时间段内的行为向量;通过对目标对象在多个不同时间段的行为向量进行聚类,确定目标对象在多个不同时间段内的习惯行为信息。进一步地,获取目标对象的行为信息,并基于行为信息的执行时间构成多个行为信息串,包括:获取目标对象在预设时间范围内的行为信息,其中,预设时间范围包括多个时间周期;将属于同一个时间周期的行为信息按照行为信息的执行时间连接,得到多个连接结果;对连接结果进行分割,得到每个时间周期内的行为信息串。进一步地,对连接结果进行分割,得到每个时间周期内的行为信息串,包括:获取两个相邻的行为信息之间的时间差;如果时间差大于预设时间长度,将两个相邻的行为信息进行分割。进一步地,在对行为信息串进行向量化处理,得到目标对象在多个不同时间段内的行为向量之前,确定行为信息串中起始行为信息的执行时间所属的时间段为行为信息串所属的时间段;对每个时间段内的行为信息串进行对齐补全处理,使同一个时间段内的行为信息串具有相同的维度。进一步地,对行为信息串进行向量化处理,得到目标对象在多个不同时间段内的行为向量,包括:获取每个时间段内的行为信息串中,每个行为信息对应的行为数据,其中,行为数据包括如下至少一项:行为信息的标识、交互数据以及与下一个行为信息的时间间隔;以行为数据代替行为信息,构成目标对象在多个不同时间段内的行为向量。进一步地,通过对目标对象在多个不同时间段的行为向量进行聚类,确定目标对象在多个不同时间段内的习惯行为信息,包括:对同一个时间段内的行为向量进行聚类,得到每个时间段对应的聚类中心;选择多个距离聚类中心的距离小于预设距离的候选向量;获取所选择的候选向量的均值,得到均值向量;将均值向量中每一项所表示的行为数据转换为行为信息,得到目标对象在多个不同时间段内的习惯行为信息。进一步地,在获取目标对象在预设时间范围内的行为信息之后,方法还包括:剔除出现频率低于预设频率的行为信息。进一步地,行为信息包括目标对象与家用电器之间的语音交互行为信息。根据本专利技术实施例的一个方面,提供了一种数据的处理装置,包括:获取模块,用于获取目标对象的行为信息,并基于所述行为信息的执行时间构成多个行为信息串;处理模块,用于对行为信息串进行向量化处理,得到目标对象在多个不同时间段内的行为向量;确定模块,用于通过对目标对象在多个不同时间段的行为向量进行聚类,确定目标对象在多个不同时间段内的习惯行为信息。根据本专利技术实施例的一个方面,提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述数据的处理方法。根据本专利技术实施例的一个方面,提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的数据的处理方法。在本专利技术实施例中,获取目标对象的行为信息,并基于行为信息的执行时间构成多个行为信息串;对行为信息串进行向量化处理,得到目标对象在多个不同时间段内的行为向量;通过对目标对象在多个不同时间段的行为向量进行聚类,确定目标对象在多个不同时间段内的习惯行为信息。上述方案在数据量有限的情况下,对不同时间段的行为信息进行向量化处理,并对向量化处理得到的不同时间段的行为向量进行聚类分析,从而得到不同时间段内用户的行为习惯,解决了现有技术中在数据量较小的情况难以准确的分析出用户的行为习惯的问题。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的数据的处理方法的流程图;图2是根据本专利技术实施例的一种对行为信息串进行对齐补全的示意图;图3是根据本专利技术实施例第一种对行为信息串进行向量化处理的示意图;图4是根据本专利技术实施例的一种确定行为信息串的示意图;图5是根据本专利技术实施例的一种获取用户习惯行为信息的示意图;以及图6是根据本专利技术实施例的一种数据的处理装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本专利技术实施例,提供了一种数据的处理方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是根据本专利技术实施例的数据的处理方法的流程图,如图1所示,该方法包括如下步骤:步骤S102,获取目标对象的行为信息,并基于行为信息的执行时间构成多个行为信息串。具体的,上述目标对象是需要对其行为进行分析的用户,可以是一个用户,也可以是允许共同操作同一家电设备的多个用户,例如家庭中的多个人。上述行为信息是用户与家电设备之间的交互行为,例如用户向家电设备发出的控制指令等,可以是语音交互行为、手势交互行为、远程控制行为、触发按键行为等。将行为信息按照执行的时间顺序进行连接,即可得到行为信息串。在一种可选的实施例中,以空调为例,采集用户对空调进行操作时的行为本文档来自技高网...
【技术保护点】
1.一种数据的处理方法,其特征在于,包括:/n获取目标对象的行为信息,并基于所述行为信息的执行时间构成多个行为信息串;/n对所述行为信息串进行向量化处理,得到所述目标对象在多个不同时间段内的行为向量;/n通过对所述目标对象在所述多个不同时间段的行为向量进行聚类,确定所述目标对象在所述多个不同时间段内的习惯行为信息。/n
【技术特征摘要】
1.一种数据的处理方法,其特征在于,包括:
获取目标对象的行为信息,并基于所述行为信息的执行时间构成多个行为信息串;
对所述行为信息串进行向量化处理,得到所述目标对象在多个不同时间段内的行为向量;
通过对所述目标对象在所述多个不同时间段的行为向量进行聚类,确定所述目标对象在所述多个不同时间段内的习惯行为信息。
2.根据权利要求1所述的方法,其特征在于,获取目标对象的行为信息,并基于所述行为信息的执行时间构成多个行为信息串,包括:
获取所述目标对象在预设时间范围内的行为信息,其中,所述预设时间范围包括多个时间周期;
将属于同一个时间周期的行为信息按照所述行为信息的执行时间连接,得到多个连接结果;
对所述连接结果进行分割,得到每个时间周期内的行为信息串。
3.根据权利要求2所述的方法,其特征在于,对所述连接结果进行分割,得到每个时间周期内的行为信息串,包括:
获取两个相邻的行为信息之间的时间差;
如果所述时间差大于预设时间长度,将所述两个相邻的行为信息进行分割。
4.根据权利要求1所述的方法,其特征在于,在对所述行为信息串进行向量化处理,得到所述目标对象在多个不同时间段内的行为向量之前,所述方法还包括:
确定所述行为信息串中起始行为信息的执行时间所属的时间段为所述行为信息串所属的时间段;
对每个时间段内的行为信息串进行对齐补全处理,使同一个时间段内的行为信息串具有相同的维度。
5.根据权利要求4所述的方法,其特征在于,对所述行为信息串进行向量化处理,得到所述目标对象在多个不同时间段内的行为向量,包括:
获取每个时间段内的行为信息串中,每个行为信息对应的行为数据,其中,所述行为数据包括如下至少一项:所述行为信息的标识、交互数据以及与下一...
【专利技术属性】
技术研发人员:宋德超,贾巨涛,李立辉,项伟伟,刘家平,
申请(专利权)人:珠海格力电器股份有限公司,珠海联云科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。