【技术实现步骤摘要】
数据的处理方法和装置
本专利技术涉及数据处理领域,具体而言,涉及一种数据的处理方法和装置。
技术介绍
随着时间的推移,人们越来越意识到数据的重要性。大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。例如,可以通过大数据分析对用户的行为习惯进行分析,目前通常是基于用户的各项行为的频次来进行,但针对单一的用户,或数据较少的群体用户,根据频次得到的行为习惯并不准确。针对现有技术中在数据量较小的情况难以准确的分析出用户的行为习惯的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种数据的处理方法和装置,以至少解决现有技术中在数据量较小的情况难以准确的分析出用户的行为习惯的技术问题。根据本专利技术实施例的一个方面,提供了一种数据的处理方法,包括:获取目标对象的行为信息,并基于行为信息的执行时间构成多个行为信息串;对行为信息串进行向量化处理,得到目标对象在多个不同时间段内的行为向量;通过对目标对象在多个不同时间段的行为 ...
【技术保护点】
1.一种数据的处理方法,其特征在于,包括:/n获取目标对象的行为信息,并基于所述行为信息的执行时间构成多个行为信息串;/n对所述行为信息串进行向量化处理,得到所述目标对象在多个不同时间段内的行为向量;/n通过对所述目标对象在所述多个不同时间段的行为向量进行聚类,确定所述目标对象在所述多个不同时间段内的习惯行为信息。/n
【技术特征摘要】
1.一种数据的处理方法,其特征在于,包括:
获取目标对象的行为信息,并基于所述行为信息的执行时间构成多个行为信息串;
对所述行为信息串进行向量化处理,得到所述目标对象在多个不同时间段内的行为向量;
通过对所述目标对象在所述多个不同时间段的行为向量进行聚类,确定所述目标对象在所述多个不同时间段内的习惯行为信息。
2.根据权利要求1所述的方法,其特征在于,获取目标对象的行为信息,并基于所述行为信息的执行时间构成多个行为信息串,包括:
获取所述目标对象在预设时间范围内的行为信息,其中,所述预设时间范围包括多个时间周期;
将属于同一个时间周期的行为信息按照所述行为信息的执行时间连接,得到多个连接结果;
对所述连接结果进行分割,得到每个时间周期内的行为信息串。
3.根据权利要求2所述的方法,其特征在于,对所述连接结果进行分割,得到每个时间周期内的行为信息串,包括:
获取两个相邻的行为信息之间的时间差;
如果所述时间差大于预设时间长度,将所述两个相邻的行为信息进行分割。
4.根据权利要求1所述的方法,其特征在于,在对所述行为信息串进行向量化处理,得到所述目标对象在多个不同时间段内的行为向量之前,所述方法还包括:
确定所述行为信息串中起始行为信息的执行时间所属的时间段为所述行为信息串所属的时间段;
对每个时间段内的行为信息串进行对齐补全处理,使同一个时间段内的行为信息串具有相同的维度。
5.根据权利要求4所述的方法,其特征在于,对所述行为信息串进行向量化处理,得到所述目标对象在多个不同时间段内的行为向量,包括:
获取每个时间段内的行为信息串中,每个行为信息对应的行为数据,其中,所述行为数据包括如下至少一项:所述行为信息的标识、交互数据以及与下一...
【专利技术属性】
技术研发人员:宋德超,贾巨涛,李立辉,项伟伟,刘家平,
申请(专利权)人:珠海格力电器股份有限公司,珠海联云科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。