System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于决策树的语音回复异常词汇检测与修正处理方法技术_技高网

一种基于决策树的语音回复异常词汇检测与修正处理方法技术

技术编号:41146131 阅读:2 留言:0更新日期:2024-04-30 18:14
本发明专利技术公开了一种基于决策树的语音回复异常词汇检测与修正处理方案,属于智能硬件技术领域,所述方法包括:对获取的语音输入进行语义解析,提取出目标场景关键词;基于所述目标场景关键词,生成初始回复语句;基于预先创建的决策树对所述初始回复语句进行异常词检测;按照第一预设规则对检测到的异常词进行修正处理,得到目标回复语句;输出所述目标回复语句。通过本申请提供的基于决策树的语音回复异常词汇检测与修正处理方案,能够精准地对初始回复语句中的异常词进行规避,提升网络安全性。

【技术实现步骤摘要】

本专利技术涉及智能硬件,尤其涉及一种基于决策树的语音回复异常词汇检测与修正处理方法和装置、电子设备。


技术介绍

1、由于语音的便捷性,智能语音交互已经成为连接人与智能设备的主要方式。人机对话技术旨在让机器通过与人类的对话交互,以更自然友好的方式帮助用户高效地完成任务,以及与用户进行情感沟通。智能设备能够“听懂”用户的语言,执行相应的指令或者进行合理的回复。

2、自然语言生成(natural language generation,nlg)是自然语言处理领域一个重要的组成部分,实现高质量的自然语言生成也是人工智能迈向认知智能的重要标志。在人机对话中,生成回复语句之余,还需要注意识别异常词语音信息,避免网络安全问题。因此,目前迫切需要本领域技术人员提供一种可以对回复语句中的异常词进行规避处理的方案。


技术实现思路

1、本专利技术实施例的目的是提供一种基于决策树的语音回复异常词汇检测与修正处理方法和装置、电子设备,能够解决目前无法在人机交互过程中对回复语句中的异常词进行规避处理的问题。

2、为解决上述技术问题,本专利技术提供如下技术方案:

3、本专利技术实施例提供了一种基于决策树的语音回复异常词汇检测与修正处理方法,其中,所述方法包括:

4、对获取的语音输入进行语义解析,提取出目标场景关键词;

5、基于所述目标场景关键词,生成初始回复语句;

6、基于预先创建的决策树对所述初始回复语句进行异常词检测;

7、按照第一预设规则对检测到的异常词进行修正处理,得到目标回复语句;

8、输出所述目标回复语句。

9、可选地,所述基于所述目标场景关键词,生成初始回复语句的步骤,包括:

10、从所述目标场景关键词对应的语料库中搜索回复语句;

11、若未搜索到回复语句,则将所述语音输入转换成文字信息输入预训练的自然语言生成模型中,生成初始回复语句;

12、若搜索到回复语句,则将搜索到的回复语句确定为初始回复语句。

13、可选地,所述决策树通过如下方式生成:

14、建立根节点;

15、建立根节点关联的各分支节点,其中,每个分支节点对应一个字符;

16、将异常词库中的异常词按照首字、首字母划分至各所述分支节点下;

17、针对每个所述分支节点,按照第二预设规则将所述分支节点下的异常词划分至至少一个子分支层级下,生成决策树。

18、可选地,所述决策树下各子分支层级包含的各子分支节点下包含所述分支节点对应的汉字的关联信息,其中,关联信息包括:拼音、繁体字以及谐音字中的至少一种。

19、可选地,所述基于预先创建的决策树对所述初始回复语句进行异常词检测的步骤,包括:

20、对所述初始回复语句进行分词,得到多个分词;

21、针对每个所述分词,判断预先创建的决策树中管理的异常词中是否存在与所述分词匹配的异常词;

22、若存在与所述分词匹配的异常词,判断所述初始回复语句中是否存在所述分词的语义修正词;

23、若不存在所述分词的语义修正词,则将所述分词确定为异常词。

24、可选地,所述决策树包含的每个异常词均对应有异常类别和敏感度。

25、可选地,基于预先创建的决策树对所述初始回复语句进行异常词检测的步骤,包括:

26、对所述初始回复语句进行分词,得到多个分词;

27、从预先创建的决策树中查找与所述分词匹配的目标异常词;

28、基于预设的各业务场景与待修正异常词的异常类别、敏感度关联关系,当前业务场景以及各所述目标异常词对应的异常类别和敏感度,从各所述目标异常词中筛选出待修正的异常词。

29、本专利技术实施例还提供了一种基于决策树的语音回复异常词汇检测与修正处理装置,其中,所述装置包括:

30、提取模块,用于对获取的语音输入进行语义解析,提取出目标场景关键词;

31、生成模块,用于基于所述目标场景关键词,生成初始回复语句;

32、检测模块,用于基于预先创建的决策树对所述初始回复语句进行异常词检测;

33、修正模块,用于按照第一预设规则对检测到的异常词进行修正处理,得到目标回复语句;

34、输出模块,用于输出所述目标回复语句。

35、可选地,所述生成模块包括:

36、第一子模块,用于从所述目标场景关键词对应的语料库中搜索回复语句;

37、第二子模块,用于若未搜索到回复语句,则将所述语音输入转换成文字信息输入预训练的自然语言生成模型中,生成初始回复语句;

38、第三子模块,用于若搜索到回复语句,则将搜索到的回复语句确定为初始回复语句。

39、可选地,所述决策树通过如下方式生成:

40、建立根节点;

41、建立根节点关联的各分支节点,其中,每个分支节点对应一个字符;

42、将异常词库中的异常词按照首字、首字母划分至各所述分支节点下;

43、针对每个所述分支节点,按照第二预设规则将所述分支节点下的异常词划分至至少一个子分支层级下,生成决策树。

44、可选地,所述决策树下各子分支层级包含的各子分支节点下包含所述分支节点对应的汉字的关联信息,其中,关联信息包括:拼音、繁体字以及谐音字中的至少一种。

45、可选地,所述检测模块包括:

46、第四子模块,用于对所述初始回复语句进行分词,得到多个分词;

47、第五子模块,用于针对每个所述分词,判断预先创建的决策树中管理的异常词中是否存在与所述分词匹配的异常词;

48、第六子模块,用于若存在与所述分词匹配的异常词,判断所述初始回复语句中是否存在所述分词的语义修正词;若不存在所述分词的语义修正词,则将所述分词确定为异常词。

49、可选地,所述决策树包含的每个异常词均对应有异常类别和敏感度。

50、可选地,所述检测模块具体用于:

51、对所述初始回复语句进行分词,得到多个分词;

52、从预先创建的决策树中查找与所述分词匹配的目标异常词;

53、基于预设的各业务场景与待修正异常词的异常类别、敏感度关联关系,当前业务场景以及各所述目标异常词对应的异常类别和敏感度,从各所述目标异常词中筛选出待修正的异常词。

54、本专利技术实施例提供了一种电子设备,该电子设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现上述任意一种基于决策树的语音回复异常词汇检测与修正处理方法的步骤。

55、本专利技术实施例提供了一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现上述任意一种基于决策树的语音回复异常词汇检测与修正处理方法的步骤。

<本文档来自技高网...

【技术保护点】

1.一种基于决策树的语音回复异常词汇检测与修正处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述目标场景关键词,生成初始回复语句的步骤,包括:

3.根据权利要求1所述的方法,其特征在于,所述决策树通过如下方式生成:

4.根据权利要求3所述的方法,其特征在于,所述决策树下各子分支层级包含的各子分支节点下包含所述分支节点对应的汉字的关联信息,其中,关联信息包括:拼音、繁体字以及谐音字中的至少一种。

5.根据权利要求1所述的方法,其特征在于,所述基于预先创建的决策树对所述初始回复语句进行异常词检测的步骤,包括:

6.根据权利要求1所述的方法,其特征在于,所述决策树包含的每个异常词均对应有异常类别和敏感度。

7.根据权利要求6所述的方法,其特征在于,基于预先创建的决策树对所述初始回复语句进行异常词检测的步骤,包括:

8.一种基于决策树的语音回复异常词汇检测与修正处理装置,其特征在于,所述装置包括:

9.根据权利要求8所述的装置,其特征在于,所述生成模块包括:

10.一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1-7任一项所述的基于决策树的语音回复异常词汇检测与修正处理方法的步骤。

...

【技术特征摘要】

1.一种基于决策树的语音回复异常词汇检测与修正处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于所述目标场景关键词,生成初始回复语句的步骤,包括:

3.根据权利要求1所述的方法,其特征在于,所述决策树通过如下方式生成:

4.根据权利要求3所述的方法,其特征在于,所述决策树下各子分支层级包含的各子分支节点下包含所述分支节点对应的汉字的关联信息,其中,关联信息包括:拼音、繁体字以及谐音字中的至少一种。

5.根据权利要求1所述的方法,其特征在于,所述基于预先创建的决策树对所述初始回复语句进行异常词检测的步骤,包括:

...

【专利技术属性】
技术研发人员:吴新开李永伟范雨琦刘云浩霍向
申请(专利权)人:北京洛必德科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1