基于大数据的用户个性分析处理方法、系统及云平台技术方案

技术编号:38578888 阅读:7 留言:0更新日期:2023-08-26 23:25
本发明专利技术实施例提供的基于大数据的用户个性分析处理方法、系统及云平台,在得到待分析聊天房间互动文本的个性化评论观点向量后,通过不同的任务线程来提炼不同文本关键词的目标在线聊天话题的评论观点向量,并对不同任务线程的评论观点向量进行评论观点碰撞操作,从而发掘不同文本关键词的目标在线聊天话题之间的隐含细节,便于挖掘出待分析聊天房间互动文本中全部具有推送分析价值的在线聊天话题。这样一来,提高了对在线聊天话题的挖掘精度和完整性。完整性。完整性。

【技术实现步骤摘要】
基于大数据的用户个性分析处理方法、系统及云平台


[0001]本专利技术涉及大数据分析
,特别涉及一种基于大数据的用户个性分析处理方法、系统及云平台。

技术介绍

[0002]社交聊天网站是一种基于互联网的服务,它允许用户在一个互联网中建立一个虚拟性质的聊天房间。从而与其他用户建立连接,以实现多人聊天处理。当前,针对用户进行个性化分析以便实时推送兴趣话题是社交聊天网站更新升级的主要方向。但是传统技术在挖掘聊天房间中的话题时,难以保障其精度和完整性,这样难以实现准确的兴趣话题推送。

技术实现思路

[0003]为改善相关技术中存在的技术问题,本专利技术提供了一种基于大数据的用户个性分析处理方法、系统及云平台。
[0004]第一方面,本专利技术实施例提供了一种基于大数据的用户个性分析处理方法,应用于大数据分析云平台,所述方法包括:获取待分析聊天房间互动文本,所述待分析聊天房间互动文本中包括至少一个目标在线聊天话题;对所述待分析聊天房间互动文本进行评论观点向量挖掘,得到多个不同维度的个性化评论观点向量;对所述个性化评论观点向量进行局部评论观点向量挖掘,得到多个任务线程对应的局部评论观点向量,所述局部评论观点向量为所述待分析聊天房间互动文本中不同文本关键词的目标在线聊天话题对应的评论观点向量;对多个任务线程对应的局部评论观点向量进行评论观点碰撞操作,得到所述任务线程对应的局部评论观点碰撞向量;结合所述任务线程对应的局部评论观点碰撞向量挖掘出所述待分析聊天房间互动文本中的所述目标在线聊天话题。
[0005]可选的,所述对多个任务线程对应的局部评论观点向量进行评论观点碰撞操作,得到所述任务线程对应的局部评论观点碰撞向量,包括:获取文本特征碰撞模型;利用所述文本特征碰撞模型对多个任务线程对应的局部评论观点向量进行评论观点碰撞操作,得到所述任务线程对应的局部评论观点碰撞向量;所述文本特征碰撞模型包括文本特征碰撞子模型和评论观点向量挖掘子模型,所述利用所述文本特征碰撞模型对多个任务线程对应的局部评论观点向量进行评论观点碰撞操作,得到所述任务线程对应的局部评论观点碰撞向量,包括:对多个任务线程对应的局部评论观点向量进行评论观点向量聚合操作,得到局部评论观点聚合向量;利用所述评论观点向量挖掘子模型对所述局部评论观点聚合向量进行评论观点向量挖掘,得到多个局部评论观点衍生向量;
利用所述文本特征碰撞子模型对所述局部评论观点衍生向量进行偏置系数修改,得到修改后的局部评论观点衍生向量;对所述修改后的局部评论观点衍生向量和对应的所述局部评论观点向量进行处理,得到所述任务线程对应的局部评论观点碰撞向量。
[0006]可选的,所述局部评论观点向量包括第一评论观点词向量和第二评论观点词向量,所述局部评论观点聚合向量包括第一局部评论观点聚合词向量和第二局部评论观点聚合词向量,所述对多个任务线程对应的局部评论观点向量进行评论观点向量聚合操作,得到局部评论观点聚合向量,包括:对所述多个任务线程对应的第一评论观点词向量进行评论观点向量聚合操作,得到所述第一局部评论观点聚合词向量;对所述多个任务线程对应的第二评论观点词向量进行评论观点向量聚合操作,得到所述第二局部评论观点聚合词向量。
[0007]可选的,还包括:获取所述任务线程对应的第一局部词向量生成模型和第二局部词向量生成模型;所述任务线程对应的局部评论观点碰撞向量包括所述第一评论观点词向量对应的局部评论观点碰撞向量和所述第二评论观点词向量对应的局部评论观点碰撞向量,所述结合所述任务线程对应的局部评论观点碰撞向量挖掘出所述待分析聊天房间互动文本中的所述目标在线聊天话题,包括:利用所述第一局部词向量生成模型对所述第一评论观点词向量对应的局部评论观点碰撞向量进行向量卷积操作,得到所述待分析聊天房间互动文本中文本单元的文本关键词和分布量化特征;利用所述第二局部词向量生成模型对所述第二评论观点词向量对应的局部评论观点碰撞向量进行向量卷积操作,得到所述待分析聊天房间互动文本中文本单元的范围量化特征;结合所述待分析聊天房间互动文本中文本单元的文本关键词、分布量化特征和范围量化特征,挖掘出所述待分析聊天房间互动文本中的所述目标在线聊天话题。
[0008]可选的,所述获取待分析聊天房间互动文本之前,还包括:获取多个聊天房间互动文本样例集,以及通用在线聊天话题挖掘网络,所述多个聊天房间互动文本样例集与所述通用在线聊天话题挖掘网络中的多个任务线程一一对应,所述多个聊天房间互动文本样例集中聊天房间互动文本样例的认证注释各不相同,所述认证注释用于对所述聊天房间互动文本样例中不同文本关键词的目标在线聊天话题进行区别;利用所述聊天房间互动文本样例对所述通用在线聊天话题挖掘网络进行调试,得到在线聊天话题挖掘网络。
[0009]可选的,所述通用在线聊天话题挖掘网络中每个任务线程皆包含设定的第一局部词向量生成模型和第二局部词向量生成模型,所述利用所述聊天房间互动文本样例对所述通用在线聊天话题挖掘网络进行调试,得到在线聊天话题挖掘网络,包括:利用所述通用在线聊天话题挖掘网络对所述聊天房间互动文本样例进行目标在线聊天话题挖掘,得到所述任务线程对应的所述设定的第一局部词向量生成模型的第一生
成数据和所述设定的第二局部词向量生成模型的第二生成数据;基于所述任务线程对应的所述第一生成数据、所述第二生成数据以及所述聊天房间互动文本样例的认证注释,确定所述任务线程对应的第一调试代价指标和第二调试代价指标;结合所述任务线程对应的第一调试代价指标和第二调试代价指标,确定所述任务线程对应的调试代价指标;结合所述任务线程对应的调试代价指标,确定所述通用在线聊天话题挖掘网络的调试代价指标;基于所述通用在线聊天话题挖掘网络的调试代价指标,对所述通用在线聊天话题挖掘网络的网络变量进行优化,跳转至利用所述通用在线聊天话题挖掘网络对所述聊天房间互动文本样例进行目标在线聊天话题挖掘的步骤,循环至所述通用在线聊天话题挖掘网络的调试代价指标符合设定要求,得到在线聊天话题挖掘网络。
[0010]可选的,所述结合所述任务线程对应的调试代价指标,确定所述通用在线聊天话题挖掘网络的调试代价指标,包括:确定当前动态循环算子所述任务线程对应的在先调试代价指标均值,所述当前动态循环算子表征从第x次循环到第y次循环;确定前一动态循环算子所述任务线程对应的在先调试代价指标均值,所述前一动态循环算子表征从第x

z次循环到第y

z次循环,z、x和y皆是正整数;结合所述前一动态循环算子所述任务线程对应的在先调试代价指标均值、所述当前动态循环算子所述任务线程对应的在先调试代价指标均值,确定所述任务线程对应的调试代价梯度;基于所述任务线程对应的调试代价梯度,确定所述任务线程对应的调试代价置信度;结合所述任务线程对应的调试代价置信度和所述任务线程对应的调试代价指标,确定所述通用在线聊天话题挖掘网络的调试代价指标。
[0011]可选的,所述方法还包括:根据所述目标在线聊天话题,确定目标用户终端的话题偏好标签;利用所述话题偏本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的用户个性分析处理方法,其特征在于,应用于大数据分析云平台,所述方法包括:获取待分析聊天房间互动文本,所述待分析聊天房间互动文本中包括至少一个目标在线聊天话题;对所述待分析聊天房间互动文本进行评论观点向量挖掘,得到多个不同维度的个性化评论观点向量;对所述个性化评论观点向量进行局部评论观点向量挖掘,得到多个任务线程对应的局部评论观点向量,所述局部评论观点向量为所述待分析聊天房间互动文本中不同文本关键词的目标在线聊天话题对应的评论观点向量;对多个任务线程对应的局部评论观点向量进行评论观点碰撞操作,得到所述任务线程对应的局部评论观点碰撞向量;结合所述任务线程对应的局部评论观点碰撞向量挖掘出所述待分析聊天房间互动文本中的所述目标在线聊天话题。2.如权利要求1所述的方法,其特征在于,所述方法还包括:根据所述目标在线聊天话题,确定目标用户终端的话题偏好标签;利用所述话题偏好标签对所述目标用户终端进行话题推送处理。3.如权利要求2所述的方法,其特征在于,所述利用所述话题偏好标签对所述目标用户终端进行话题推送处理,包括:利用所述话题偏好标签从预设话题池中挑选待推送在线聊天话题;收集所述待推送在线聊天话题对应的话题文本信息;在所述话题文本信息携带数据脱敏指示的前提下,对所述话题文本信息进行数据脱敏处理,得到脱敏文本信息;将所述待推送在线聊天话题以及所述脱敏文本信息关联推送给所述目标用户终端。4.如权利要求1所述的方法,其特征在于,所述对多个任务线程对应的局部评论观点向量进行评论观点碰撞操作,得到所述任务线程对应的局部评论观点碰撞向量,包括:获取文本特征碰撞模型;利用所述文本特征碰撞模型对多个任务线程对应的局部评论观点向量进行评论观点碰撞操作,得到所述任务线程对应的局部评论观点碰撞向量;所述文本特征碰撞模型包括文本特征碰撞子模型和评论观点向量挖掘子模型,所述利用所述文本特征碰撞模型对多个任务线程对应的局部评论观点向量进行评论观点碰撞操作,得到所述任务线程对应的局部评论观点碰撞向量,包括:对多个任务线程对应的局部评论观点向量进行评论观点向量聚合操作,得到局部评论观点聚合向量;利用所述评论观点向量挖掘子模型对所述局部评论观点聚合向量进行评论观点向量挖掘,得到多个局部评论观点衍生向量;利用所述文本特征碰撞子模型对所述局部评论观点衍生向量进行偏置系数修改,得到修改后的局部评论观点衍生向量;对所述修改后的局部评论观点衍生向量和对应的所述局部评论观点向量进行处理,得到所述任务线程对应的局部评论观点碰撞向量;其中,所述局部评论观点向量包括第一评论观点词向量和第二评论观点词向量,所述局部评论观点聚合向量包括第一局部评论观点聚合词向量和第二局部评论观点聚合词向量,所述对多个任务线程对应的局部评论观点向量进行评论观点向量聚合操作,得到局部评论观点聚合向量,包括:对所述多个任务线程对应的第一评论观点词向量进行评论观点
向量聚合操作,得到所述第一局部评论观点聚合词向量;对所述多个任务线程对应的第二评论观点词向量进行评论观点向量聚合操作,得到所述第二局部评论观点聚合词向量;其中,所述方法还包括:获取所述任务线程对应的第一局部词向量生成模型和第二局部词向量生成模型;所述任务线程对应的局部评论观点碰撞向量包括所述第一评论观点词向量对应的局部评论观点碰撞向量和所述第二评论观点词向量对应的局部评论观点碰撞向量,所述结合所述任务线程对应的局部评论观点碰撞向量挖掘出所述待分析聊天房间互动文本中的所述目标在线聊天话题,包括:利用所述第一局部词向量生成模型对所述第一评论观点词向量对应的局部评论观点碰撞向量进行向量卷积操作,得到所述待分析聊天房间互动文本中文本单元的文本关键词和分布量化特征;利用所述第二局部词向量生成模型对所述第二评论观点词向量对应的局部评论观点碰撞向量进行向量卷积操作,得到所述待分析聊天房间互动文本中文本单元的范围量化特征;结合所述待分析聊天房间互动文本中文本单元的文本关键词、分布量化特征和范围量化特征,挖掘出所述待分析聊天房间互动文本中的所述目标在线聊天话题。5.如权利要求1所述的方法,其特征在于,所述获取待分析聊天房间互动文本之前,还包括:获取多个聊天房间互动文本样例集,以及通用在线聊天话题挖掘网络,所述多个聊天房间互动文本样例集与所述通用在线聊天话题挖掘网络中的多个任务线程一一对应,所述多个聊天房间互动文本样例集中聊天房间互动文本样例的认证注释各不相同,所述认证注释用于对所述聊天房间互动文本样例中不同文本关键词的目标在线聊天话题进行区别;利用所述聊天房间互动文本样例对所述通用在线聊天话题挖掘网络进行调试,得到在线聊天话题挖掘网络;其中,所述通用在线聊天话题挖掘网络中每个任务线程皆包含设定的第一局部词向量生成模型和第二局部词向量生成模型,所述利用所述聊天房间互动文本样例对所述通用在线聊天话题挖掘网络进行调试,得到在线聊天话题挖掘网络,包括:利用所述通用在线聊天话题挖掘网络对所述聊天房间互动文本样例进行目标在线聊天话题挖掘,得到所述任务线程对应的所述设定的第一局部词向量生成模型的第一生成数据和所述设定的第二局部词向量生成模型的第二生成数据;基于所述任务线程对应的所述第一生成数据、所述第二生成数据以及所述聊天房间互动文本样例的认证注释,确定所述任务线程对应的第一调试代价指标和第二调试代价指标;结合所述任务线程对应的第一调试代价指标和第二调试代价指标,确定所述任务线程对应的调试代价指标;结合所述任务线程对应的调试代价指标,确定所述通用在线聊天话题挖掘网络的调试代价指标;基于所述通用在线聊天话题挖掘网络的调试代价指标,对所述通用在线聊天话题挖掘网络的网络变量进行优化,跳转至利用所述通用在线聊天话题挖掘网络对所述聊天房间互动文本样例进行目标在线聊天话题挖掘的步骤,循环至所述通用在线聊天话题挖掘网络的调试代价指标符合设定要求,得到在线聊天话题挖掘网络;其中,所述结合所述任务线程对应的调试代价指标,确定所述通用在线聊天话题挖掘网络的调试代价指标,包括:确定当前动态循环算子所述任务线程对应的在先调试代价指标均值,所述当前动态循环算子表征从第x次循环到第y次循环;确定前一动态循环算子所述任务线程对应的在先调试代价指标均值,所述前一动态循环算子表征从第x

z次循环到第y

z次循环,z、x和y皆是正整数;结合所述前一动态循环算子所述任务线程对应的在先调
试代价指标均值、所述当前动态循环算子所述任务线程对应的在先调试代价指标均值,确定所述任务线程对应的调试代价梯度;基于所述任务线程对应的调试代价梯度,确定所述任务线程对应的调试代价置信度;结合所述任务线程对应的调试代价置信度和所述任务线程对应的调试代价指标,确定所述通用在线聊天话题挖掘网络的调试代价指标。6.一种基于大数据的用户个性分析处理系统,其特征在于,包括互相之间通信的大数据分析云平台和用户终端;所述大数据分析云平台用于:获取待...

【专利技术属性】
技术研发人员:杨德兵邹傲臣龚丹球
申请(专利权)人:深圳市逗娱科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1