当前位置: 首页 > 专利查询>李雪峰专利>正文

基于人工智能的线上推送主题分析方法及大数据系统技术方案

技术编号:37492686 阅读:15 留言:0更新日期:2023-05-07 09:31
本申请实施例提供一种基于人工智能的线上推送主题分析方法及大数据系统,基于线上会话主题分析模型对用户终端的线上会话文本中的目标主题特征信息进行会话主题分析,生成对应的会话主题分布,并从会话主题分布中获取关注热度大于预设热度的目标会话主题,对目标会话主题下的行为互动数据进行挖掘,获得多个行为互动兴趣点对应的兴趣关键词信息,基于多个行为互动兴趣点对应的兴趣关键词信息,对用户终端进行线上内容推送,相较于现有技术而言进一步考虑了会话主题的关注热度对于兴趣挖掘的影响,以便于提高后续线上内容推送的精准性,降低大数据系统的运行负载压力。降低大数据系统的运行负载压力。降低大数据系统的运行负载压力。

【技术实现步骤摘要】
基于人工智能的线上推送主题分析方法及大数据系统


[0001]本申请涉及人工智能
,具体而言,涉及一种基于人工智能的线上推送主题分析方法及大数据系统。

技术介绍

[0002]线上云平台可以理解为存在于互联网中,能够扩展、向其他用户提供基础服务、数据、中间件、数据服务、软件的提供商。对于线上云平台而言,可以基于用户需求提供各种各样的线上服务,用户在使用这些线上服务的过程中会产生诸多会话文本数据,通过挖掘这些会话文本数据可能存在的兴趣内容进而对用户进行推送内容的优化,可以提高线上服务的运转效率。然而相关技术中,没有考虑到会话主题的关注热度对于兴趣挖掘的影响,从而会影响后续线上内容推送的精准性,并且导致推送的线上内容过于冗余进而增加大数据系统的运行负载压力。

技术实现思路

[0003]为了至少克服现有技术中的上述不足,本申请的目的在于提供一种基于人工智能的线上推送主题分析方法及大数据系统。
[0004]第一方面,本申请提供一种基于人工智能的线上推送主题分析方法,应用于大数据系统,所述方法包括:基于线上会话主题分析模型对用户终端的线上会话文本中的目标主题特征信息进行会话主题分析,生成对应的会话主题分布,并从所述会话主题分布中获取关注热度大于预设热度的目标会话主题;获取所述目标会话主题下的行为互动数据对应的第一互动知识图谱,所述行为互动数据包含有互动业务层跨度不同的多个行为互动兴趣点;将所述第一互动知识图谱分别输入所述目标会话主题对应的多个互动知识挖掘模型进行互动知识挖掘,获得多个目标业务层跨度的第二互动知识图谱,每个互动知识挖掘模型对应的模型架构参数是依据设定模型运算量和所述每个互动知识挖掘模型对应的目标业务层跨度确定的,所述每个互动知识挖掘模型对应的目标业务层跨度与所述每个互动知识挖掘模型对应的模型架构参数呈负向关联,所述每个互动知识挖掘模型各自对应的目标业务层跨度是依据所述目标会话主题下多个主题覆盖标签对应的互动业务层覆盖数据确定的;依据所述多个互动知识挖掘模型各自对应的第二互动知识图谱,对所述多个行为互动兴趣点进行兴趣关键词提取,获得所述多个行为互动兴趣点对应的兴趣关键词信息。
[0005]譬如,在第一方面的一种可能的实施方式中,所述方法还包括:确定所述目标会话主题下的多个主题覆盖标签和所述目标会话主题对应的主题调用数据;依据所述多个主题覆盖标签进行互动业务层覆盖数据分析,确定所述多个主题覆
盖标签对应的互动业务层覆盖数据;依据所述互动业务层覆盖数据,确定所述多个互动知识挖掘模型对应的业务层渗透参数;依据所述业务层渗透参数和所述主题调用数据,确定所述多个互动知识挖掘模型对应的目标业务层跨度;所述依据所述互动业务层覆盖数据,确定所述多个互动知识挖掘模型对应的业务层渗透参数包括:依据所述互动业务层覆盖数据,确定所述多个互动知识挖掘模型各自对应的目标业务层调用事件数据;依据所述多个互动知识挖掘模型各自对应的目标业务层调用事件数据,确定所述多个互动知识挖掘模型对应的业务层渗透参数;其中,所述每个互动知识挖掘模型对应的目标业务层调用事件数据与所述每个互动知识挖掘模型对应的业务层渗透参数正向关联。
[0006]譬如,在第一方面的一种可能的实施方式中,所述每个互动知识挖掘模型包括:知识编码单元和知识图谱更新单元,所述每个互动知识挖掘模型的知识编码单元对应的业务层渗透参数与所述每个互动知识挖掘模型对应的目标业务层跨度对应,所述将所述第一互动知识图谱分别输入所述目标会话主题对应的多个互动知识挖掘模型进行互动知识挖掘,获得多个目标业务层跨度的第二互动知识图谱包括:将所述第一互动知识图谱分别输入所述每个互动知识挖掘模型的知识编码单元进行知识编码,获得所述每个互动知识挖掘模型对应的业务层渗透参数的互动知识编码特征;将所述互动知识编码特征输入所述每个互动知识挖掘模型的知识图谱更新单元进行知识图谱更新,获得所述每个互动知识挖掘模型对应的目标业务层跨度的第二互动知识图谱。
[0007]譬如,在第一方面的一种可能的实施方式中,所述获取目标会话主题下的行为互动数据对应的第一互动知识图谱包括:获取所述行为互动数据;将所述行为互动数据输入互动知识图谱构建模型进行互动知识图谱生成,获得所述第一互动知识图谱;所述互动知识图谱构建模型包括:知识图谱实体编辑单元、知识图谱实体拼接单元和知识图谱构建单元,所述将所述行为互动数据输入互动知识图谱构建模型进行互动知识图谱生成,获得所述第一互动知识图谱包括:依据所述知识图谱实体编辑单元,对所述行为互动数据进行特征提取,获得多个行为互动流程的初始知识图谱实体;依据所述知识图谱实体拼接单元,分别对所述多个行为互动流程的初始知识图谱实体进行实体关系构建,获得多个拼接知识图谱实体;依据所述知识图谱构建单元,对所述多个拼接知识图谱实体进行知识图谱构建,获得所述第一互动知识图谱。
[0008]譬如,在第一方面的一种可能的实施方式中,所述多个互动知识挖掘模型是通过
如下方式进行训练的:获取目标会话主题下的训练行为互动数据对应的第一训练互动知识图谱,所述训练行为互动数据包含有互动业务层跨度不同的多个参考行为互动兴趣点;获取所述多个参考行为互动兴趣点对应的兴趣关键词标注信息;将所述第一训练互动知识图谱分别输入所述目标会话主题对应的多个预设互动知识挖掘模型进行互动知识挖掘,获得多个目标业务层跨度的第二训练互动知识图谱,每个预设互动知识挖掘模型对应的模型架构参数是依据所述设定模型运算量和所述每个预设互动知识挖掘模型对应的目标业务层跨度确定的,所述每个预设互动知识挖掘模型对应的目标业务层跨度与所述每个预设互动知识挖掘模型对应的模型架构参数呈负向关联,所述每个预设互动知识挖掘模型各自对应的目标业务层跨度是依据所述目标会话主题下多个主题覆盖标签对应的互动业务层覆盖数据确定的;依据所述多个预设互动知识挖掘模型各自对应的第二训练互动知识图谱,对所述多个参考行为互动兴趣点进行兴趣关键词提取,获得所述多个参考行为互动兴趣点对应的兴趣关键词预测信息;依据所述兴趣关键词标注信息和所述兴趣关键词预测信息,训练所述多个预设互动知识挖掘模型,获得所述多个互动知识挖掘模型。
[0009]在第一方面的一种可能的实施方式中,所述基于线上会话主题分析模型对线上会话文本中的目标主题特征信息进行会话主题分析,生成对应的会话主题分布的步骤,包括:获取参考线上会话文本序列,所述参考线上会话文本序列中包括携带参考线上主题的参考线上会话文本,所述参考线上主题表征所述参考线上会话文本中目标主题特征信息的文本概括变量;对所述参考线上会话文本序列中的参考线上会话文本进行文本段落拆分,生成第一参考文本段落簇和第二参考文本段落簇,其中,所述第一参考文本段落簇中的参考文本段落从不同参考线上会话文本获得,所述第二参考文本段落簇中的参考文本段落从同一参考线上会话文本获得,所述第一参考文本段落簇中的参考文本段落携带所述参考线上主题对应的文本段落单元主题;基于线上会话主题分析模型对所述第一参考文本段落簇中的参考文本段落进行主题分析,依据所述文本段落单元主题本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的线上推送主题分析方法,其特征在于,应用于大数据系统,所述方法包括:基于线上会话主题分析模型对用户终端的线上会话文本中的目标主题特征信息进行会话主题分析,生成对应的会话主题分布,并从所述会话主题分布中获取关注热度大于预设热度的目标会话主题;对所述目标会话主题下的行为互动数据进行挖掘,获得多个行为互动兴趣点对应的兴趣关键词信息;基于所述多个行为互动兴趣点对应的兴趣关键词信息,对所述用户终端进行线上内容推送。2.根据权利要求1所述的基于人工智能的线上推送主题分析方法,其特征在于,所述对所述目标会话主题下的行为互动数据进行挖掘,获得多个行为互动兴趣点对应的兴趣关键词信息的步骤,包括:获取所述目标会话主题下的行为互动数据对应的第一互动知识图谱,所述行为互动数据包含有互动业务层跨度不同的多个行为互动兴趣点;将所述第一互动知识图谱分别输入所述目标会话主题对应的多个互动知识挖掘模型进行互动知识挖掘,获得多个目标业务层跨度的第二互动知识图谱,每个互动知识挖掘模型对应的模型架构参数是依据设定模型运算量和所述每个互动知识挖掘模型对应的目标业务层跨度确定的,所述每个互动知识挖掘模型对应的目标业务层跨度与所述每个互动知识挖掘模型对应的模型架构参数呈负向关联,所述每个互动知识挖掘模型各自对应的目标业务层跨度是依据所述目标会话主题下多个主题覆盖标签对应的互动业务层覆盖数据确定的;依据所述多个互动知识挖掘模型各自对应的第二互动知识图谱,对所述多个行为互动兴趣点进行兴趣关键词提取,获得所述多个行为互动兴趣点对应的兴趣关键词信息。3.根据权利要求1所述的基于人工智能的线上推送主题分析方法,其特征在于,所述基于线上会话主题分析模型对线上会话文本中的目标主题特征信息进行会话主题分析,生成对应的会话主题分布的步骤,包括:获取参考线上会话文本序列,所述参考线上会话文本序列中包括携带参考线上主题的参考线上会话文本,所述参考线上主题表征所述参考线上会话文本中目标主题特征信息的文本概括变量;对所述参考线上会话文本序列中的参考线上会话文本进行文本段落拆分,生成第一参考文本段落簇和第二参考文本段落簇,其中,所述第一参考文本段落簇中的参考文本段落从不同参考线上会话文本获得,所述第二参考文本段落簇中的参考文本段落从同一参考线上会话文本获得,所述第一参考文本段落簇中的参考文本段落携带所述参考线上主题对应的文本段落单元主题;基于线上会话主题分析模型对所述第一参考文本段落簇中的参考文本段落进行主题分析,依据所述文本段落单元主题和段落主题分析数据之间的数据区别特征确定第一训练代价值;基于所述线上会话主题分析模型对所述第二参考文本段落簇进行主题分析,依据所述参考线上主题和段落簇主题分析数据之间的数据区别特征,确定所述参考线上会话文本对
应的第二训练代价值和所述第二参考文本段落簇对应的第三训练代价值;依据所述第一训练代价值、所述第二训练代价值和所述第三训练代价值对所述线上会话主题分析模型进行模型权重参数更新,更新获得的线上会话主题分析模型用于对线上会话文本中的目标主题特征信息进行会话主题分析;所述基于线上会话主题分析模型对所述第一参考文本段落簇中的参考文本段落进行主题分析,依据所述文本段落单元主题和段落主题分析数据之间的数据区别特征确定第一训练代价值,包括:基于语义编码网络对所述第一参考文本段落簇中的参考文本段落进行语义编码特征输出,获得所述参考文本段落的第一语义编码特征,其中,所述语义编码网络是通过与所述参考线上会话文本同应用场景的线上会话文本进行语义编码学习输出的深度学习网络模型;对所述第一语义编码特征进行主题分析,获得所述第一参考文本段落簇中所述参考文本段落的第一段落主题分析数据;依据所述文本段落单元主题和所述第一段落主题分析数据之间的数据区别特征,确定所述第一训练代价;所述对所述第一语义编码特征进行主题分析,获得所述第一参考文本段落簇中所述参考文本段落的第一段落主题分析数据,包括:对所述第一语义编码特征进行显著性特征解析,获得第一文本段落显著性特征和第一文本段落语义编码特征;对所述第一文本段落显著性特征和所述第一文本段落语义编码特征进行特征计算,获得第二语义编码特征;对所述第二语义编码特征进行主题分析,获得所述第一参考文本段落簇中所述参考文本段落的第一段落主题分析数据。4.根据权利要求3所述的基于人工智能的线上推送主题分析方法,其特征在于,所述基于所述线上会话主题分析模型对所述第二参考文本段落簇进行主题分析,依据所述参考线上主题和段落簇主题分析数据之间的数据区别特征,确定所述参考线上会话文本对应的第二训练代价值和所述第二参考文本段落簇对应的第三训练代价值,包括:基于语义编码网络对所述第二参考文本段落簇中的参考文本段落进行语义编码特征输出,获得所述参考文本段落的第三语义编码特征,其中,所述语义编码网络是通过与所述参考线上会话文本同应用场景的线上会话文本进行语义编码学习输出的深度学习网络模型;对所述第三语义编码特征进行主题分析,获得所述第二参考文...

【专利技术属性】
技术研发人员:李雪峰韩瑶瑶
申请(专利权)人:李雪峰
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1