基于用户聊天内容分析的信息推送方法及其相关设备技术

技术编号:29310938 阅读:18 留言:0更新日期:2021-07-17 02:16
本发明专利技术公开了基于用户聊天内容分析的信息推送及其相关设备,涉及语义解析技术,是基于用户进入预设场景所上传的聊天数据进行内容分析后快速得到聊天数据聚类结果,并基于聊天数据聚类结果获取符合条件的聚类簇及其对应的文本主题组成目标聊天数据聚类簇集,最终根据各目标聊天数据聚类簇的文本主题分别获取对应的推广文本数据以进行信息推送,实现了基于用户聊天数据的自动语义分析快速获取对应的推广文本数据集,无需人工干预,提高了数据处理效率。据处理效率。据处理效率。

【技术实现步骤摘要】
基于用户聊天内容分析的信息推送方法及其相关设备


[0001]本专利技术涉及语义解析
,尤其涉及一种基于用户聊天内容分析的信息推送方法及其相关设备。

技术介绍

[0002]网络游戏成为了越来越普及的娱乐活动,例如手机上运行的网络游戏和电脑上运行的网络游戏。在网络游戏中,经常不断推出新的游戏活动,这些新的游戏活动一般是由策划人员基于一定的用户市场调研后基于策划人员的经验总结得到,也即上述过程一般需要设计用户问卷调查、问卷收集、问卷统计分析等过程,这就导致上述获取用户所期待活动信息的过程极其耗时,而且人工成本高,数据处理效率低下。

技术实现思路

[0003]本专利技术实施例提供了一种基于用户聊天内容分析的信息推送方法及其相关设备,旨在解决现有技术中针对特定用户群体获取其所期待开展活动信息一般需经过用户问卷调查、问卷收集、问卷统计分析等过程,导致数据获取过程耗时且效率低下,而且耗费人工成本高的问题。
[0004]第一方面,本专利技术实施例提供了一种基于用户聊天内容分析的信息推送方法,其包括:
[0005]若检测到用户端在进入预设场景上传的聊天数据,获取所述聊天数据的数据类型;
[0006]判断所述数据类型是语音类型或是文本类型;
[0007]若所述数据类型是文本类型,将所述聊天数据进行敏感词检测和敏感词转换处理,得到第一脱敏处理后聊天数据以作为当前聊天数据;
[0008]若所述数据类型是语音类型,将所述聊天数据进行语音文本提取、敏感词检测和敏感词转换处理,得到第二脱敏处理后聊天数据以作为当前聊天数据,并将所述第二脱敏处理后聊天数据根据对应用户声音特征进行文本转语音以得到处理后聊天数据;
[0009]将所述当前聊天数据与对应用户端的用户ID绑定后存储在本地的第一存储区域;
[0010]获取当前系统时间,判断当前系统时间与上一聊天数据分析时间之间的时间间隔是否等于预设的聊天数据分析时间周期;
[0011]若当前系统时间与上一聊天数据分析时间之间的时间间隔等于所述聊天数据分析时间周期,获取所述第一存储区域中当前已存储的聊天数据集,将所述聊天数据集进行文本聚类,得到对应的聊天数据聚类结果;其中,所述聊天数据聚类结果中包括若干个聊天数据聚类簇;
[0012]获取所述聊天数据聚类结果中各聊天数据聚类簇分别对应的文本主题;
[0013]若有聊天数据聚类簇对应的文本主题与预设的目标主题清单中的目标主题之间的文本相似度超出预设的相似度阈值,获取对应的文本主题所相应聊天数据聚类簇作为目
标聊天数据聚类簇,组成目标聊天数据聚类簇集;以及
[0014]获取与各目标聊天数据聚类簇的文本主题分别对应的推广文本数据,组成待推送文本数据集。
[0015]第二方面,本专利技术实施例提供了一种基于用户聊天内容分析的信息推送装置,其包括:
[0016]聊天数据类型获取单元,用于若检测到用户端在进入预设场景上传的聊天数据,获取所述聊天数据的数据类型;
[0017]类型判断单元,用于判断所述数据类型是语音类型或是文本类型;
[0018]第一脱敏处理单元,用于若所述数据类型是文本类型,将所述聊天数据进行敏感词检测和敏感词转换处理,得到第一脱敏处理后聊天数据以作为当前聊天数据;
[0019]第二脱敏处理单元,用于若所述数据类型是语音类型,将所述聊天数据进行语音文本提取、敏感词检测和敏感词转换处理,得到第二脱敏处理后聊天数据以作为当前聊天数据,并将所述第二脱敏处理后聊天数据根据对应用户声音特征进行文本转语音以得到处理后聊天数据;
[0020]数据存储单元,用于将所述当前聊天数据与对应用户端的用户ID绑定后存储在本地的第一存储区域;
[0021]时间判断单元,用于获取当前系统时间,判断当前系统时间与上一聊天数据分析时间之间的时间间隔是否等于预设的聊天数据分析时间周期;
[0022]文本聚类单元,用于若当前系统时间与上一聊天数据分析时间之间的时间间隔等于所述聊天数据分析时间周期,获取所述第一存储区域中当前已存储的聊天数据集,将所述聊天数据集进行文本聚类,得到对应的聊天数据聚类结果;其中,所述聊天数据聚类结果中包括若干个聊天数据聚类簇;
[0023]文本主题抽取单元,用于获取所述聊天数据聚类结果中各聊天数据聚类簇分别对应的文本主题;
[0024]目标聚类簇获取单元,用于若有聊天数据聚类簇对应的文本主题与预设的目标主题清单中的目标主题之间的文本相似度超出预设的相似度阈值,获取对应的文本主题所相应聊天数据聚类簇作为目标聊天数据聚类簇,组成目标聊天数据聚类簇集;以及
[0025]待推送文本获取单元,用于获取与各目标聊天数据聚类簇的文本主题分别对应的推广文本数据,组成待推送文本数据集。
[0026]第三方面,本专利技术实施例又提供了一种计算机设备,其包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的基于用户聊天内容分析的信息推送方法。
[0027]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其中所述计算机可读存储介质存储有计算机程序,所述计算机程序当被处理器执行时使所述处理器执行上述第一方面所述的基于用户聊天内容分析的信息推送方法。
[0028]本专利技术实施例提供了一种基于用户聊天内容分析的信息推送方法及其相关设备,是基于用户进入预设场景所上传的聊天数据进行内容分析后快速得到聊天数据聚类结果,并基于聊天数据聚类结果获取符合条件的聚类簇及其对应的文本主题组成目标聊天数据聚类簇集,最终根据各目标聊天数据聚类簇的文本主题分别获取对应的推广文本数据以进
行信息推送,实现了基于用户聊天数据的自动语义分析快速获取对应的推广文本数据集,无需人工干预,提高了数据处理效率。
附图说明
[0029]为了更清楚地说明本专利技术实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0030]图1为本专利技术实施例提供的基于用户聊天内容分析的信息推送方法的应用场景示意图;
[0031]图2为本专利技术实施例提供的基于用户聊天内容分析的信息推送方法的流程示意图;
[0032]图3为本专利技术实施例提供的基于用户聊天内容分析的信息推送装置的示意性框图;
[0033]图4为本专利技术实施例提供的计算机设备的示意性框图。
具体实施方式
[0034]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0035]应当理解,当在本说明书和所附权利要求书本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用户聊天内容分析的信息推送方法,其特征在于,包括:若检测到用户端在进入预设场景上传的聊天数据,获取所述聊天数据的数据类型;判断所述数据类型是语音类型或是文本类型;若所述数据类型是文本类型,将所述聊天数据进行敏感词检测和敏感词转换处理,得到第一脱敏处理后聊天数据以作为当前聊天数据;若所述数据类型是语音类型,将所述聊天数据进行语音文本提取、敏感词检测和敏感词转换处理,得到第二脱敏处理后聊天数据以作为当前聊天数据,并将所述第二脱敏处理后聊天数据根据对应用户声音特征进行文本转语音以得到处理后聊天数据;将所述当前聊天数据与对应用户端的用户ID绑定后存储在本地的第一存储区域;获取当前系统时间,判断当前系统时间与上一聊天数据分析时间之间的时间间隔是否等于预设的聊天数据分析时间周期;若当前系统时间与上一聊天数据分析时间之间的时间间隔等于所述聊天数据分析时间周期,获取所述第一存储区域中当前已存储的聊天数据集,将所述聊天数据集进行文本聚类,得到对应的聊天数据聚类结果;其中,所述聊天数据聚类结果中包括若干个聊天数据聚类簇;获取所述聊天数据聚类结果中各聊天数据聚类簇分别对应的文本主题;若有聊天数据聚类簇对应的文本主题与预设的目标主题清单中的目标主题之间的文本相似度超出预设的相似度阈值,获取对应的文本主题所相应聊天数据聚类簇作为目标聊天数据聚类簇,组成目标聊天数据聚类簇集;以及获取与各目标聊天数据聚类簇的文本主题分别对应的推广文本数据,组成待推送文本数据集。2.根据权利要求1所述的基于用户聊天内容分析的信息推送方法,其特征在于,所述将所述聊天数据进行敏感词检测和敏感词转换处理,得到第一脱敏处理后聊天数据以作为当前聊天数据,包括:将所述聊天数据进行分词,得到第一分词结果;其中,所述第一分词结果中包括若干个分词;将所述第一分词结果中的每一分词均进行敏感词检测,以判断所述第一分词结果中是否存在有敏感词;若所述第一分词结果中存在有敏感词,获取对应的敏感词组成第一目标敏感词集;调用预先训练的敏感词分类模型,将所述第一目标敏感词集中每一敏感词均输入至所述敏感词分类模型中,获取所述第一目标敏感词集中每一敏感词分别对应的敏感词等级;若所述第一目标敏感词集中无敏感词对应的敏感词等级高于预设的敏感词等级阈值,将所述第一目标敏感词集中每一目标敏感词均通过拼音首字母替换,得到与每一目标敏感词对应的第一敏感词转换结果;将所述聊天数据中与所述第一目标敏感词集中相同的各词语通过对应的第一敏感词转换结果进行替换,得到第一脱敏处理后聊天数据以作为当前聊天数据。3.根据权利要求1所述的基于用户聊天内容分析的信息推送方法,其特征在于,所述将所述聊天数据进行语音文本提取、敏感词检测和敏感词转换处理,得到第二脱敏处理后聊天数据以作为当前聊天数据,并将所述第二脱敏处理后聊天数据根据对应用户声音特征进
行文本转语音以得到处理后聊天数据,包括:将所述聊天数据通过语音识别模型进行文本识别,得到文本识别结果;所述文本识别结果进行分词,得到第二分词结果;其中,所述第二分词结果中包括若干个分词;将所述第二分词结果中的每一分词均进行敏感词检测,以判断所述第二分词结果中是否存在有敏感词;若所述第二分词结果中存在有敏感词,获取对应的敏感词组成第二目标敏感词集;将所述第二目标敏感词集中每一目标敏感词均通过拼音首字母替换,得到与每一目标敏感词对应的第二敏感词转换结果;将所述文本识别结果中与所述第二目标敏感词集中相同的各词语通过对应的第二敏感词转换结果进行替换,得到第二脱敏处理后聊天数据以作为当前聊天数据;获取所述用户端对应的用户身份信息,及与所述用户身份信息对应用户声音特征;通过所述用户声音特征对所述第二脱敏处理后聊天数据进行语音合成,得到处理后聊天数据。4.根据权利要求1所述的基于用户聊天内容分析的信息推送方法,其特征在于,所述获取所述第一存储区域中当前已存储的聊天数据集,将所述聊天数据集进行文本聚类,得到对应的聊天数据聚类结果,包括:获取所述聊天数据集中每一聊天数据对应的语义向量;获取所述聊天数据集所对应各语义向量之间的欧式距离以进行K

means聚类,得到聊天数据聚类结果。5.根据权利要求1...

【专利技术属性】
技术研发人员:陈家荣蓝志毅丰阳露解效玄易页
申请(专利权)人:心动网络股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1