大数据挖掘处理方法、装置及云平台制造方法及图纸

技术编号:25756182 阅读:24 留言:0更新日期:2020-09-25 21:05
本发明专利技术公开了一种大数据挖掘处理方法、装置及云平台,涉及数据处理技术领域;本发明专利技术首先在采集到应用程序行为数据后提取应用程序行为数据的行为特征向量并确定多个应用业务数据片段,其次将应用程序行为数据的每组应用业务数据片段与设定数据片段序列中各设定数据片段进行挖掘从而得到挖掘结果,然后根据挖掘结果符合预设条件的目标应用业务数据片段对应的数据片段分量确定应用程序行为数据的数据挖掘分布图,最后基于应用程序行为数据以及确定出的应用程序行为数据的数据挖掘分布图对用户终端的用户画像数据进行生成得到生成结果。如此,能够大数据挖掘处理的准确性和可靠性。

【技术实现步骤摘要】
大数据挖掘处理方法、装置及云平台
本专利技术涉及大数据
,特别涉及大数据挖掘处理方法、装置及云平台。
技术介绍
在用户终端的应用程序的使用过程中,会产生很多应用程序行为数据,例如用户操作行为数据、用户浏览行为数据、用户设置行为数据等等,如何对这些应用程序数据进行有效挖掘,从而确定相关的用户画像,以便于后续的信息推送,是本领域亟待解决的技术问题。然而在实际应用中,大数据挖掘处理的准确性和可靠性较差。
技术实现思路
为改善相关技术中存在的上述技术问题,本公开提供了大数据挖掘处理方法、装置及云平台。一种大数据挖掘处理方法,应用于与用户终端通信的云平台,所述方法包括:在采集到所述用户终端实时通过应用程序上传的应用程序行为数据后,提取所述应用程序行为数据的行为特征向量,并基于所述行为特征向量对所述应用程序行为数据进行索引分析得到多个应用业务数据片段;其中,所述行为特征向量为所述应用程序行为数据中与待挖掘业务相关的设定行为标识所形成的特征向量;将所述应用程序行为数据的每组应用业务数据片段与设定数据片段序列中各设定数据片段进行挖掘;其中,所述设定数据片段序列中保存有多个设定数据片段以及每组设定数据片段对应的业务分布信息,所述多个设定数据片段为所述待挖掘业务所在的用户业务范围的业务节点信息序列;其中,如果所提取出的应用程序行为数据的每组应用业务数据片段包括多个业务分布信息,则通过以下方式进行挖掘:按照预先为各个业务分布信息配置的挖掘策略,进行多级挖掘;其中,在每级挖掘中,仅基于每组应用业务数据片段中的其中一个业务分布信息进行挖掘,并将符合预设条件的应用业务数据片段输入到下一级挖掘模型中,以便基于下一个业务分布信息进行挖掘应用业务数据片段输入到下一级挖掘模型中,以便基于下一个业务分布信息进行挖掘;根据与所述应用程序行为数据的挖掘结果符合预设条件的目标应用业务数据片段对应的数据片段分量,确定所述应用程序行为数据的数据挖掘分布图;基于所述应用程序行为数据以及确定出的应用程序行为数据的数据挖掘分布图对所述用户终端的用户画像数据进行生成得到生成结果。一种示例中,提取所述应用程序行为数据的行为特征向量,并基于所述行为特征向量对所述应用程序行为数据进行索引分析得到多个应用业务数据片段,包括:将所述应用程序行为数据中的行为对象列出,确定每个行为对象的操作频率,按照所述操作频率由大到小的顺序将所述行为对象进行排序得到所述行为特征向量;获取所述行为特征向量的向量片段序列以及所述应用程序行为数据的多个应用程序业务对象序列;在根据所述向量片段序列确定出所述应用程序行为数据中包含有可挖掘数据对象的情况下,根据所述应用程序行为数据在所述可挖掘数据对象下的应用程序业务对象序列及其业务验证信息确定所述应用程序行为数据在目标挖掘数据对象下的各应用程序业务对象序列与所述应用程序行为数据在所述可挖掘数据对象下的各应用程序业务对象序列之间的挖掘相关参数;将所述应用程序行为数据在所述目标挖掘数据对象下的与在所述可挖掘数据对象下的应用程序业务对象序列的挖掘相关参数最小的应用程序业务对象序列调整到所述可挖掘数据对象下;在所述应用程序行为数据对应的所述目标挖掘数据对象下包含有多个应用程序业务对象序列的情况下,根据所述应用程序行为数据在所述可挖掘数据对象下的应用程序业务对象序列及其业务验证信息确定所述应用程序行为数据在所述目标挖掘数据对象下的各应用程序业务对象序列之间的挖掘相关参数,并基于所述各应用程序业务对象序列之间的挖掘相关参数对所述目标挖掘数据对象下的各应用程序业务对象序列进行融合;根据所述应用程序行为数据在所述可挖掘数据对象下的应用程序业务对象序列及其业务验证信息为上述融合获得的目标应用程序业务对象序列设置调整挖掘策略,并将所述目标应用程序业务对象序列调整到所述调整挖掘策略所对应的所述可挖掘数据对象的设定节点处;基于所述行为特征向量中的向量片段序列对应的存在分段标识的目标节点的节点属性对所述目标挖掘数据对象下的应用程序业务对象序列进行分段处理得到多个应用业务数据片段。一种示例中,根据与所述应用程序行为数据的挖掘结果符合预设条件的目标应用业务数据片段对应的数据片段分量,确定所述应用程序行为数据的数据挖掘分布图,包括:提取所述挖掘结果的挖掘特征向量参数,在所述挖掘特征向量参数满足所述用户终端的预设挖掘参数时,确定所述挖掘特征向量参数对应的目标应用业务数据片段;按照设定片段长度提取所述目标应用业务数据片段的片段分区特征;生成所述片段分区特征对应的分区位图以及目标应用业务数据片段对应的片段业务状态位图,所述分区位图和所述片段业务状态位图分别包括多个不同状态值的位图单位;提取所述片段分区特征在所述分区位图的其中一个位图单位的位图属性表达结果并将所述片段业务状态位图中具有最小状态值的位图单位确定为基准位图单位;将所述位图属性表达结果模拟至所述基准位图单位中以在所述基准位图单位中得到模拟对象信息,然后基于所述位图属性表达结果以及所述模拟对象信息生成所述片段分区特征和所述目标应用业务数据片段之间的数据关联信息;以所述模拟对象信息为信息模板在所述基准位图单位中获取对象挖掘分布信息,根据所述数据关联信息对应的关联行为节点将所述对象挖掘分布信息模拟到所述位图属性表达结果所在位图单位中并在所述位图属性表达结果所在的位图单位中得到所述对象挖掘分布信息对应的模拟挖掘分布信息;将所述模拟挖掘分布信息中的挖掘分布节点和分布关联信息列出并根据所述挖掘分布节点和所述分布关联信息生成所述应用程序行为数据的数据挖掘分布图。一种示例中,基于所述应用程序行为数据以及确定出的应用程序行为数据的数据挖掘分布图对所述用户终端的用户画像数据进行生成得到生成结果,包括:确定基于所述应用程序行为数据以及所述数据挖掘分布图所确定的与所述用户画像数据对应的画像特征信息,采用所述画像特征信息对所述用户画像数据进行深度提取得到目标画像特征信息;针对所述目标画像特征信息中的当前画像特征信息,基于当前画像特征信息在预设时段区间内的第一特征节点以及各所述目标画像特征信息在所述预设时段区间内的第二特征节点,确定当前画像特征信息在所述预设时段区间内的特征节点序列;根据当前画像特征信息在两个相邻的预设时段区间内的特征节点序列确定当前画像特征信息在两个相邻的设定时间段之间的目标画像标签信息,根据所述目标画像标签信息对所述用户终端的用户画像数据进行生成得到生成结果。一种大数据挖掘处理装置,应用于与用户终端通信的云平台,所述装置包括:索引分析模块,用于在采集到所述用户终端实时通过应用程序上传的应用程序行为数据后,提取所述应用程序行为数据的行为特征向量,并基于所述行为特征向量对所述应用程序行为数据进行索引分析得到多个应用业务数据片段;其中,所述行为特征向量为所述应用程序行为数据中与待挖掘业务相关的设定行为标识所形成的特征向量;挖掘模块,用于将所述应用程序行为数据的每组应本文档来自技高网...

【技术保护点】
1.一种大数据挖掘处理方法,其特征在于,应用于与用户终端通信的云平台,所述方法包括:/n在采集到所述用户终端实时通过应用程序上传的应用程序行为数据后,提取所述应用程序行为数据的行为特征向量,并基于所述行为特征向量对所述应用程序行为数据进行索引分析得到多个应用业务数据片段;其中,所述行为特征向量为所述应用程序行为数据中与待挖掘业务相关的设定行为标识所形成的特征向量;/n将所述应用程序行为数据的每组应用业务数据片段与设定数据片段序列中各设定数据片段进行挖掘;其中,所述设定数据片段序列中保存有多个设定数据片段以及每组设定数据片段对应的业务分布信息,所述多个设定数据片段为所述待挖掘业务所在的用户业务范围的业务节点信息序列;其中,如果所提取出的应用程序行为数据的每组应用业务数据片段包括多个业务分布信息,则通过以下方式进行挖掘:按照预先为各个业务分布信息配置的挖掘策略,进行多级挖掘;其中,在每级挖掘中,仅基于每组应用业务数据片段中的其中一个业务分布信息进行挖掘,并将符合预设条件的应用业务数据片段输入到下一级挖掘模型中,以便基于下一个业务分布信息进行挖掘应用业务数据片段输入到下一级挖掘模型中,以便基于下一个业务分布信息进行挖掘;/n根据与所述应用程序行为数据的挖掘结果符合预设条件的目标应用业务数据片段对应的数据片段分量,确定所述应用程序行为数据的数据挖掘分布图;/n基于所述应用程序行为数据以及确定出的应用程序行为数据的数据挖掘分布图对所述用户终端的用户画像数据进行生成得到生成结果。/n...

【技术特征摘要】
1.一种大数据挖掘处理方法,其特征在于,应用于与用户终端通信的云平台,所述方法包括:
在采集到所述用户终端实时通过应用程序上传的应用程序行为数据后,提取所述应用程序行为数据的行为特征向量,并基于所述行为特征向量对所述应用程序行为数据进行索引分析得到多个应用业务数据片段;其中,所述行为特征向量为所述应用程序行为数据中与待挖掘业务相关的设定行为标识所形成的特征向量;
将所述应用程序行为数据的每组应用业务数据片段与设定数据片段序列中各设定数据片段进行挖掘;其中,所述设定数据片段序列中保存有多个设定数据片段以及每组设定数据片段对应的业务分布信息,所述多个设定数据片段为所述待挖掘业务所在的用户业务范围的业务节点信息序列;其中,如果所提取出的应用程序行为数据的每组应用业务数据片段包括多个业务分布信息,则通过以下方式进行挖掘:按照预先为各个业务分布信息配置的挖掘策略,进行多级挖掘;其中,在每级挖掘中,仅基于每组应用业务数据片段中的其中一个业务分布信息进行挖掘,并将符合预设条件的应用业务数据片段输入到下一级挖掘模型中,以便基于下一个业务分布信息进行挖掘应用业务数据片段输入到下一级挖掘模型中,以便基于下一个业务分布信息进行挖掘;
根据与所述应用程序行为数据的挖掘结果符合预设条件的目标应用业务数据片段对应的数据片段分量,确定所述应用程序行为数据的数据挖掘分布图;
基于所述应用程序行为数据以及确定出的应用程序行为数据的数据挖掘分布图对所述用户终端的用户画像数据进行生成得到生成结果。


2.根据权利要求1所述的方法,其特征在于,提取所述应用程序行为数据的行为特征向量,并基于所述行为特征向量对所述应用程序行为数据进行索引分析得到多个应用业务数据片段,包括:
将所述应用程序行为数据中的行为对象列出,确定每个行为对象的操作频率,按照所述操作频率由大到小的顺序将所述行为对象进行排序得到所述行为特征向量;
获取所述行为特征向量的向量片段序列以及所述应用程序行为数据的多个应用程序业务对象序列;在根据所述向量片段序列确定出所述应用程序行为数据中包含有可挖掘数据对象的情况下,根据所述应用程序行为数据在所述可挖掘数据对象下的应用程序业务对象序列及其业务验证信息确定所述应用程序行为数据在目标挖掘数据对象下的各应用程序业务对象序列与所述应用程序行为数据在所述可挖掘数据对象下的各应用程序业务对象序列之间的挖掘相关参数;将所述应用程序行为数据在所述目标挖掘数据对象下的与在所述可挖掘数据对象下的应用程序业务对象序列的挖掘相关参数最小的应用程序业务对象序列调整到所述可挖掘数据对象下;
在所述应用程序行为数据对应的所述目标挖掘数据对象下包含有多个应用程序业务对象序列的情况下,根据所述应用程序行为数据在所述可挖掘数据对象下的应用程序业务对象序列及其业务验证信息确定所述应用程序行为数据在所述目标挖掘数据对象下的各应用程序业务对象序列之间的挖掘相关参数,并基于所述各应用程序业务对象序列之间的挖掘相关参数对所述目标挖掘数据对象下的各应用程序业务对象序列进行融合;根据所述应用程序行为数据在所述可挖掘数据对象下的应用程序业务对象序列及其业务验证信息为上述融合获得的目标应用程序业务对象序列设置调整挖掘策略,并将所述目标应用程序业务对象序列调整到所述调整挖掘策略所对应的所述可挖掘数据对象的设定节点处;
基于所述行为特征向量中的向量片段序列对应的存在分段标识的目标节点的节点属性对所述目标挖掘数据对象下的应用程序业务对象序列进行分段处理得到多个应用业务数据片段。


3.根据权利要求1所述的方法,其特征在于,根据与所述应用程序行为数据的挖掘结果符合预设条件的目标应用业务数据片段对应的数据片段分量,确定所述应用程序行为数据的数据挖掘分布图,包括:
提取所述挖掘结果的挖掘特征向量参数,在所述挖掘特征向量参数满足所述用户终端的预设挖掘参数时,确定所述挖掘特征向量参数对应的目标应用业务数据片段;
按照设定片段长度提取所述目标应用业务数据片段的片段分区特征;
生成所述片段分区特征对应的分区位图以及目标应用业务数据片段对应的片段业务状态位图,所述分区位图和所述片段业务状态位图分别包括多个不同状态值的位图单位;
提取所述片段分区特征在所述分区位图的其中一个位图单位的位图属性表达结果并将所述片段业务状态位图中具有最小状态值的位图单位确定为基准位图单位;
将所述位图属性表达结果模拟至所述基准位图单位中以在所述基准位图单位中得到模拟对象信息,然后基于所述位图属性表达结果以及所述模拟对象信息生成所述片段分区特征和所述目标应用业务数据片段之间的数据关联信息;
以所述模拟对象信息为信息模板在所述基准位图单位中获取对象挖掘分布信息,根据所述数据关联信息对应的关联行为节点将所述对象挖掘分布信息模拟到所述位图属性表达结果所在位图单位中并在所述位图属性表达结果所在的位图单位中得到所述对象挖掘分布信息对应的模拟挖掘分布信息;
将所述模拟挖掘分布信息中的挖掘分布节点和分布关联信息列出并根据所述挖掘分布节点和所述分布关联信息生成所述应用程序行为数据的数据挖掘分布图。


4.根据权利要求1所述的方法,其特征在于,基于所述应用程序行为数据以及确定出的应用程序行为数据的数据挖掘分布图对所述用户终端的用户画像数据进行生成得到生成结果,包括:
确定基于所述应用程序行为数据以及所述数据挖掘分布图所确定的与所述用户画像数据对应的画像特征信息,采用所述画像特征信息对所述用户画像数据进行深度提取得到目标画像特征信息;
针对所述目标画像特征信息中的当前画像特征信息,基于当前画像特征信息在预设时段区间内的第一特征节点以及各所述目标画像特征信息在所述预设时段区间内的第二特征节点,确定当前画像特征信息在所述预设时段区间内的特征节点序列;
根据当前画像特征信息在两个相邻的预设时段区间内的特征节点序列确定当前画像特征信息在两个相邻的设定时间段之间的目标画像标签信息,根据所述目标画像标签信息对所述用户终端的用户画像数据进行生成得到生成结果。


5.一种大数据挖掘处理装置...

【专利技术属性】
技术研发人员:莫怡极莫敏婷
申请(专利权)人:广州云莫凡信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1