一种基于NER和NLU的骚扰信息判断方法及系统技术方案

技术编号:28054301 阅读:22 留言:0更新日期:2021-04-14 13:21
本发明专利技术公开了一种基于NER和NLU的骚扰信息判断方法及系统,其中,所述方法包括:获得第一文本信息;对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息;对所述第一文本信息进行命名实体识别,获得词槽内容信息;根据所述自然语言理解意图列表信息和\或所述词槽内容信息,获得第一结果信息;判断所述第一结果信息是否包含骚扰信息;如果所述第一结果信息包含骚扰信息,获得第一标记信息;根据所述第一标记信息,将所述第一文本信息标记为骚扰信息。解决了现有技术极大的耗费时间与精力,无法做到迅速响应,针对性不强,无法做到低成本更新的技术问题。法做到低成本更新的技术问题。法做到低成本更新的技术问题。

【技术实现步骤摘要】
一种基于NER和NLU的骚扰信息判断方法及系统


[0001]本专利技术涉及信息识别领域,尤其涉及一种基于NER和NLU的骚扰信息判断方法及系统。

技术介绍

[0002]随着信息行业的快速发展,骚扰信息的生产者不完全仅是人类,还包括机器人,这意味着对骚扰信息识别方案提出了更高的要求,包括更快的响应速度、更精准的识别率、更小的误差、更强大的兼容特性、更低成本的词库更新能力等。
[0003]但本申请专利技术人在实现本申请实施例中专利技术技术方案的过程中,发现上述技术至少存在如下技术问题:
[0004]现有技术极大的耗费时间与精力,无法做到迅速响应,针对性不强,无法做到低成本更新的技术问题。

技术实现思路

[0005]本申请实施例通过提供一种基于NER和NLU的骚扰信息判断方法及系统,解决了现有技术极大的耗费时间与精力,无法做到迅速响应,针对性不强,无法做到低成本更新的技术问题,达到对信息识别更快的响应速度,更精准的识别率与更小的误差,更低成本的兼容特性的技术效果。
[0006]鉴于上述问题,提出了本申请实施例提供一种基于NER和NLU的骚扰信息判断方法及系统。
[0007]第一方面,本申请实施例提供了一种基于NER和NLU的骚扰信息判断方法,所述方法包括:获得第一文本信息;对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息;对所述第一文本信息进行命名实体识别,获得词槽内容信息;根据所述自然语言理解意图列表信息和\或所述词槽内容信息,获得第一结果信息;判断所述第一结果信息是否包含骚扰信息;如果所述第一结果信息包含骚扰信息,获得第一标记信息;根据所述第一标记信息,将所述第一文本信息标记为骚扰信息。
[0008]另一方面,本申请还提供了一种基于NER和NLU的骚扰信息判断系统,所述系统包括:第一获得单元,所述第一获得单元用于获得第一文本信息;第二获得单元,所述第二获得单元用于对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息;第三获得单元,所述第三获得单元用于对所述第一文本信息进行命名实体识别,获得词槽内容信息;第四获得单元,所述第四获得单元用于根据所述自然语言理解意图列表信息和\或所述词槽内容信息,获得第一结果信息;第一判断单元,所述第一判断单元用于判断所述第一结果信息是否包含骚扰信息;第五获得单元,所述第五获得单元用于如果所述第一结果信息包含骚扰信息,获得第一标记信息;第一标记单元,所述第一标记单元用于根据所述第一标记信息,将所述第一文本信息标记为骚扰信息。
[0009]第三方面,本专利技术提供了一种基于NER和NLU的骚扰信息判断系统,包括存储器、处
理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述程序时实现第一方面所述方法的步骤。
[0010]本申请实施例中提供的一个或多个技术方案,至少具有如下技术效果或优点:
[0011]由于采用了对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息,对所述第一文本信息进行命名实体识别,获得词槽内容信息。根据所述自然语言理解意图列表信息和\或所述词槽内容信息,获得第一结果信息,如果所述第一结果信息包含骚扰信息,获得第一标记信息,根据所述第一标记信息,将所述第一文本信息标记为骚扰信息,进而达到对信息识别更快的响应速度,更精准的识别率与更小的误差,更低成本的兼容特性的技术效果。
[0012]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0013]图1为本申请实施例一种基于NER和NLU的骚扰信息判断方法的流程示意图;
[0014]图2为本申请实施例一种基于NER和NLU的骚扰信息判断系统的结构示意图;
[0015]图3为本申请实施例示例性电子设备的结构示意图。
[0016]附图标记说明:第一获得单元11,第二获得单元12,第三获得单元13,第四获得单元14,第一判断单元15,第五获得单元16,第一标记单元17,总线300,接收器301,处理器302,发送器303,存储器304,总线接口306。
具体实施方式
[0017]本申请实施例通过提供一种基于NER和NLU的骚扰信息判断方法及系统,解决了现有技术极大的耗费时间与精力,无法做到迅速响应,针对性不强,无法做到低成本更新的技术问题,达到对信息识别更快的响应速度,更精准的识别率与更小的误差,更低成本的兼容特性的技术效果。下面,将参考附图详细的描述根据本申请的示例实施例。显然,所描述的实施例仅是本申请的一部分实施例,而不是本申请的全部实施例,应理解,本申请不受这里描述的示例实施例的限制。
[0018]申请概述
[0019]随着信息行业的快速发展,骚扰信息的生产者不完全仅是人类,还包括机器人,这意味着对骚扰信息识别方案提出了更高的要求,包括更快的响应速度、更精准的识别率、更小的误差、更强大的兼容特性、更低成本的词库更新能力等。但现有技术极大的耗费时间与精力,无法做到迅速响应,针对性不强,无法做到低成本更新的技术问题。
[0020]针对上述技术问题,本申请提供的技术方案总体思路如下:
[0021]本申请实施例提供了一种基于NER和NLU的骚扰信息判断方法,所述方法包括:获得第一文本信息;对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息;对所述第一文本信息进行命名实体识别,获得词槽内容信息;根据所述自然语言理解意图列表信息和\或所述词槽内容信息,获得第一结果信息;判断所述第一结果信息是否包含骚扰信息;如果所述第一结果信息包含骚扰信息,获得第一标记信息;根据所述第一标
记信息,将所述第一文本信息标记为骚扰信息。
[0022]在介绍了本申请基本原理后,下面将结合说明书附图来具体介绍本申请的各种非限制性的实施方式。
[0023]实施例一
[0024]如图1所示,本申请实施例提供了一种基于NER和NLU的骚扰信息判断方法,其中,所述方法包括:
[0025]步骤S100:获得第一文本信息;
[0026]具体而言,所述第一文本信息为需要进行判断的来源文本信息,包括信息、邮件、即时聊天软件(IM)等,如果获得来源信息是语音类,则通过音频识别转文字技术转成文本信息。
[0027]步骤S200:对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息;
[0028]具体而言,所述自然语言理解(NLU,Natural Language Understanding)是指从自然语言到机器内部的一个映射,是指机器能够执行人类所期望的某些语言功能,所述自然语言理解处理为通过自然语言理解获取对所述第一文本信息的理解。所述自然语言理解意图列表信息为经过自然语言理解处理后,通过分类的方式将所述第一文本信息划分到相应的意图种本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于NER和NLU的骚扰信息判断方法,其中,所述方法包括:获得第一文本信息;对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息;对所述第一文本信息进行命名实体识别,获得词槽内容信息;根据所述自然语言理解意图列表信息和\或所述词槽内容信息,获得第一结果信息;判断所述第一结果信息是否包含骚扰信息;如果所述第一结果信息包含骚扰信息,获得第一标记信息;根据所述第一标记信息,将所述第一文本信息标记为骚扰信息。2.如权利要求1所述的方法,其中,所述获得第一文本信息,包括:获得第一信息;判断所述第一信息的格式信息;如果所述第一信息为第一文本信息,对所述第一文本信息进行自然语言理解处理;如果所述第一信息为音频信息,获得第一转换信息;根据所述第一转换信息,将所述音频信息转换为第一文本信息。3.如权利要求1所述的方法,其中,所述对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息,包括:获得骚扰语料训练集;获得日志数据;将所述骚扰语料训练集中的数据和所述日志数据作为输入数据输入骚扰模型进行训练,获得输出信息;根据所述输出信息,获得所述自然语言理解意图列表信息。4.如权利要求1所述的方法,其中,所述对所述第一文本信息进行命名实体识别,获得词槽内容信息,包括:根据骚扰词规则,获得正则实体;根据骚扰词典库,获得词典实体;将所述骚扰词典库和训练数据集作为训练数据,获得模型实体;将所述正则实体和所述词典实体通过匹配逻辑进行词槽填充,获得第一词槽内容信息;将所述模型实体通过模型预测进行词槽填充,获得第二词槽内容信息;根据所述第一词槽内容信息和所述第二词槽内容信息,获得所述词槽内容信息。5.如权利要求1所述的方法,其中,所述根据所述自然语言理解意图列表信息和\或所述词槽内容信息,获得第一结果信息,包括:判断所述自然语言理解意图列表信息和所述词槽内容信息是否均具有计算结果;如果所述自然语言理解意图列表信...

【专利技术属性】
技术研发人员:张超
申请(专利权)人:浙江百应科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1