【技术实现步骤摘要】
一种基于NER和NLU的骚扰信息判断方法及系统
[0001]本专利技术涉及信息识别领域,尤其涉及一种基于NER和NLU的骚扰信息判断方法及系统。
技术介绍
[0002]随着信息行业的快速发展,骚扰信息的生产者不完全仅是人类,还包括机器人,这意味着对骚扰信息识别方案提出了更高的要求,包括更快的响应速度、更精准的识别率、更小的误差、更强大的兼容特性、更低成本的词库更新能力等。
[0003]但本申请专利技术人在实现本申请实施例中专利技术技术方案的过程中,发现上述技术至少存在如下技术问题:
[0004]现有技术极大的耗费时间与精力,无法做到迅速响应,针对性不强,无法做到低成本更新的技术问题。
技术实现思路
[0005]本申请实施例通过提供一种基于NER和NLU的骚扰信息判断方法及系统,解决了现有技术极大的耗费时间与精力,无法做到迅速响应,针对性不强,无法做到低成本更新的技术问题,达到对信息识别更快的响应速度,更精准的识别率与更小的误差,更低成本的兼容特性的技术效果。
[0006]鉴于上述问题, ...
【技术保护点】
【技术特征摘要】
1.一种基于NER和NLU的骚扰信息判断方法,其中,所述方法包括:获得第一文本信息;对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息;对所述第一文本信息进行命名实体识别,获得词槽内容信息;根据所述自然语言理解意图列表信息和\或所述词槽内容信息,获得第一结果信息;判断所述第一结果信息是否包含骚扰信息;如果所述第一结果信息包含骚扰信息,获得第一标记信息;根据所述第一标记信息,将所述第一文本信息标记为骚扰信息。2.如权利要求1所述的方法,其中,所述获得第一文本信息,包括:获得第一信息;判断所述第一信息的格式信息;如果所述第一信息为第一文本信息,对所述第一文本信息进行自然语言理解处理;如果所述第一信息为音频信息,获得第一转换信息;根据所述第一转换信息,将所述音频信息转换为第一文本信息。3.如权利要求1所述的方法,其中,所述对所述第一文本信息进行自然语言理解处理,获得自然语言理解意图列表信息,包括:获得骚扰语料训练集;获得日志数据;将所述骚扰语料训练集中的数据和所述日志数据作为输入数据输入骚扰模型进行训练,获得输出信息;根据所述输出信息,获得所述自然语言理解意图列表信息。4.如权利要求1所述的方法,其中,所述对所述第一文本信息进行命名实体识别,获得词槽内容信息,包括:根据骚扰词规则,获得正则实体;根据骚扰词典库,获得词典实体;将所述骚扰词典库和训练数据集作为训练数据,获得模型实体;将所述正则实体和所述词典实体通过匹配逻辑进行词槽填充,获得第一词槽内容信息;将所述模型实体通过模型预测进行词槽填充,获得第二词槽内容信息;根据所述第一词槽内容信息和所述第二词槽内容信息,获得所述词槽内容信息。5.如权利要求1所述的方法,其中,所述根据所述自然语言理解意图列表信息和\或所述词槽内容信息,获得第一结果信息,包括:判断所述自然语言理解意图列表信息和所述词槽内容信息是否均具有计算结果;如果所述自然语言理解意图列表信...
【专利技术属性】
技术研发人员:张超,
申请(专利权)人:浙江百应科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。