一种聊天数据的检测方法和装置制造方法及图纸

技术编号:26173630 阅读:31 留言:0更新日期:2020-10-31 13:57
本发明专利技术实施例提供了一种聊天数据的检测方法及装置,在获取相应的权限之后,可以获取目标用户的目标聊天数据,然后根据目标聊天数据,生成针对目标用户的用户特征向量,并将该用户特征向量输入预设的目标聊天数据检测模型中,生成针对目标聊天数据的预测值,若该预测值大于或等于预设阈值时,则可以确定目标用户的目标聊天数据为异常聊天数据,通过对用户的聊天数据进行特征提取,并将提取的特征向量输入数据检测模型中进行异常概率预测,可以有效、快速地对用户聊天数据进行检测,并且通过模型预测的方式,大大降低了人工检测的成本。

【技术实现步骤摘要】
一种聊天数据的检测方法和装置
本专利技术涉及数据处理
,特别是涉及一种聊天数据的检测方法和一种聊天数据的检测装置。
技术介绍
随着互联网技术快速发展,网络通信技术也得到飞速的发展,具有即时通信功能的应用程序能够给用户带来较好的用户体验。然而,出于对用户隐私的保护,在通常情况下无法对用户的聊天记录进行审核,则容易出现一些不良言论,且只有当有用户进行举报之后,应用程序管理方的工作人员才能对所涉及的聊天数据进行人工审核。在对用户聊天记录进行人工审核的过程中,审核效率低下,无法快速高效地对不良言论进行处理。因此,在网络通信技术发展的环境下,需要一种能够更好识别异常聊天数据,优化网络通信环境方式。
技术实现思路
本专利技术实施例是提供一种聊天数据的检测方法,以解决现有技术中在对聊天数据进行异常识别时,识别效率低下以及成本高的问题。相应的,本专利技术实施例还提供了一种聊天数据的检测装置,用以保证上述方法的实现及应用。为了解决上述问题,本专利技术实施例公开了一种聊天数据的检测方法,包括:获取目标用户的目标聊天数据;根据所述目标聊天数据,生成针对所述目标用户的用户特征向量;将所述用户特征向量输入预设的目标聊天数据检测模型中,生成针对所述目标聊天数据的预测值;当所述预测值大于或等于预设阈值时,则确定所述目标聊天数据为异常聊天数据。可选地,所述根据所述目标聊天数据,生成针对所述目标用户的用户特征向量,包括:采用所述目标聊天数据,生成第一图网络结构,所述第一图网络结构中包括多个节点;按照预设序列长度,对所述多个节点进行随机游走,获得第一节点序列;将所述第一节点序列输入预设的目标关系表示预测模型中,生成针对所述目标用户的用户特征向量。可选地,所述目标聊天数据包括所述目标用户的若干条聊天记录,所述采用所述目标聊天数据,生成第一图网络结构,包括:对所述聊天记录进行分词,生成若干个单词;将各个所述单词作为节点,建立针对所述目标用户的第一图网络结构。可选地,所述目标关系表示预测模型通过如下方式生成:获取历史聊天数据;采用所述历史聊天数据,生成第二图网络结构;根据所述第二图网络结构,生成所述目标关系表示预测模型。可选地,所述第二图网络结构包括多个节点,所述根据所述第二图网络结构,生成所述目标关系表示预测模型,包括:按照预设序列长度,对所述多个节点进行随机游走,获得第二节点序列;将所述第二节点序列输入所述初始关系表示预测模型中,生成第一预测值;将所述第一预测值与第一预设参考值进行比对,并根据比对结构对所述初始关系表示预测模型进行迭代,生成所述目标关系表示预测模型。可选地,所述目标聊天数据检测模型通过如下方式生成:根据所述历史聊天数据,生成训练特征向量;将预设的标签样本与所述训练特征向量输入预设的初始聊天数据检测模型,生成第二预测值;将所述第二预测值与第二参考值进行比对,并根据比对结果对所述初始聊天数据检测模型进行迭代,生成所述目标聊天数据检测模型。本专利技术实施例还公开了一种聊天数据的检测装置,包括:目标聊天数据获取模块,用于获取目标用户的目标聊天数据;用户特征向量生成模块,用于根据所述目标聊天数据,生成针对所述目标用户的用户特征向量;预测值生成模块,用于将所述用户特征向量输入预设的目标聊天数据检测模型中,生成针对所述目标聊天数据的预测值;聊天数据检测模块,用于当所述预测值大于或等于预设阈值时,则确定所述目标聊天数据为异常聊天数据。可选地,所述用户特征向量生成模块包括:第一网络结构生成子模块,用于采用所述目标聊天数据,生成第一图网络结构,所述第一图网络结构中包括多个节点;第一节点序列获得模块,用于按照预设序列长度,对所述多个节点进行随机游走,获得第一节点序列;用户特征向量生成子模块,用于将所述第一节点序列输入预设的目标关系表示预测模型中,生成针对所述目标用户的用户特征向量。可选地,所述目标聊天数据包括所述目标用户的若干条聊天记录,所述第一网络结构生成子模块具体用于:对所述聊天记录进行分词,生成若干个单词;将各个所述单词作为节点,建立针对所述目标用户的第一图网络结构。可选地,所述目标关系表示预测模型通过如下模块生成:历史聊天数据获取模块,用于获取历史聊天数据;第二网络结构生成模块,用于采用所述历史聊天数据,生成第二图网络结构;关系表示预测模型生成模块,用于根据所述第二图网络结构,生成所述目标关系表示预测模型。可选地,所述第二图网络结构包括多个节点,所述第二网络结构生成模块具体用于:按照预设序列长度,对所述多个节点进行随机游走,获得第二节点序列;将所述第二节点序列输入所述初始关系表示预测模型中,生成第一预测值;将所述第一预测值与第一预设参考值进行比对,并根据比对结构对所述初始关系表示预测模型进行迭代,生成所述目标关系表示预测模型。可选地,所述目标聊天数据检测模型通过如下模块生成:训练特征向量生成模块,用于根据所述历史聊天数据,生成训练特征向量;预测值生成模块,用于将预设的标签样本与所述训练特征向量输入预设的初始聊天数据检测模型,生成第二预测值;聊天数据检测模型训练模块,用于将所述第二预测值与第二参考值进行比对,并根据比对结果对所述初始聊天数据检测模型进行迭代,生成所述目标聊天数据检测模型。本专利技术实施例还公开了一种电子设备,包括:一个或多个处理器;和其上存储有指令的一个或多个机器可读介质,当由所述一个或多个处理器执行时,使得所述电子设备执行如上任一项所述的方法。本专利技术实施例还公开了一个或多个机器可读介质,其上存储有指令,当由一个或多个处理器执行时,使得所述处理器执行如上项所述的方法。本专利技术实施例包括以下优点:在本专利技术实施例中,在获取相应的权限之后,可以获取目标用户的目标聊天数据,然后根据目标聊天数据,生成针对目标用户的用户特征向量,并将该用户特征向量输入预设的目标聊天数据检测模型中,生成针对目标聊天数据的预测值,若该预测值大于或等于预设阈值时,则可以确定目标用户的目标聊天数据为异常聊天数据,通过对用户的聊天数据进行特征提取,并将提取的特征向量输入数据检测模型中进行异常概率预测,可以有效、快速地对用户聊天数据进行检测,并且通过模型预测的方式,大大降低了人工检测的成本。附图说明图1是本专利技术的一种聊天数据的检测方法实施例的步骤流程图;图2是本专利技术实施例中聊天数据检测的示意图;图3是本专利技术的一种聊天数据的检测装置实施例的结构框图。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本专利技术作进一步详细的说明。图是一种基础且常用的结构,在现实中许多场景可以本文档来自技高网...

【技术保护点】
1.一种聊天数据的检测方法,其特征在于,包括:/n获取目标用户的目标聊天数据;/n根据所述目标聊天数据,生成针对所述目标用户的用户特征向量;/n将所述用户特征向量输入预设的目标聊天数据检测模型中,生成针对所述目标聊天数据的预测值;/n当所述预测值大于或等于预设阈值时,则确定所述目标聊天数据为异常聊天数据。/n

【技术特征摘要】
1.一种聊天数据的检测方法,其特征在于,包括:
获取目标用户的目标聊天数据;
根据所述目标聊天数据,生成针对所述目标用户的用户特征向量;
将所述用户特征向量输入预设的目标聊天数据检测模型中,生成针对所述目标聊天数据的预测值;
当所述预测值大于或等于预设阈值时,则确定所述目标聊天数据为异常聊天数据。


2.根据权利要求1所述的方法,其特征在于,所述根据所述目标聊天数据,生成针对所述目标用户的用户特征向量,包括:
采用所述目标聊天数据,生成第一图网络结构,所述第一图网络结构中包括多个节点;
按照预设序列长度,对所述多个节点进行随机游走,获得第一节点序列;
将所述第一节点序列输入预设的目标关系表示预测模型中,生成针对所述目标用户的用户特征向量。


3.根据权利要求2所述的方法,其特征在于,所述目标聊天数据包括所述目标用户的若干条聊天记录,所述采用所述目标聊天数据,生成第一图网络结构,包括:
对所述聊天记录进行分词,生成若干个单词;
将各个所述单词作为节点,建立针对所述目标用户的第一图网络结构。


4.根据权利要求2所述的方法,其特征在于,所述目标关系表示预测模型通过如下方式生成:
获取历史聊天数据;
采用所述历史聊天数据,生成第二图网络结构;
根据所述第二图网络结构,生成所述目标关系表示预测模型。


5.根据权利要求4所述的方法,其特征在于,所述第二图网络结构包括多个节点,所述根据所述第二图网络结构,生成所述目标关系表示预测模型,包括:
按照预设序列长度,对所述多个节点进行随机游走,获得第二节点序列;
将所述第二节点序列输入所述初始关系表示预测模型中,生成第一预测值;
将所述第一预测值与第一预设参考值进行比对,并根据比对结构对所述初始关系表示预测模型进行迭代...

【专利技术属性】
技术研发人员:王锋陈宇史忠伟
申请(专利权)人:五八有限公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1