System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种语音处理方法、装置及电子设备制造方法及图纸_技高网

一种语音处理方法、装置及电子设备制造方法及图纸

技术编号:41148139 阅读:6 留言:0更新日期:2024-04-30 18:15
本说明书提供一种语音处理方法、装置及电子设备,采用实体匹配模型对用户当前语音信息的当前语音文本进行处理,采用实体名称匹配结果更新实体变量的取值,根据当前语音文本、实体变量的取值进一步确定当前语音文本的问题类型,并更新问题类型变量的取值;根据实体变量的当前取值、问题类型变量的当前取值选择答复策略。本方案通过设置实体变量、问题类型变量使得用户在提问时能够采用简略的提问方式、简洁的自然语言,使问答过程更符合人类问答沟通过程中的表达习惯,提高语音处理方法的适用范围;根据匹配到的实体名称、当前语音文本一同确定问题类型,对于用户提问时省略信息的情况也能够较为准确地确定问题类型,进而提高答复的准确性。

【技术实现步骤摘要】

本申请涉及计算机,可用于金融领域,特别涉及一种语音处理方法、装置及电子设备


技术介绍

1、语音问答系统是指利用语音的交互方式实现人机对话的系统,随着人工智能技术的发展,语音问答系统在通用领域的准确率不断提高,被广泛应用在数字客服、智能助手等多个领域。现有的语音问答系统可以分为两类,一类是采用生成式预训练(generativepre-training,gpt)模型的通用问答系统,其回答内容具有丰富性、灵活性,多被用于日常闲聊场景中;另一种是采用知识图谱的特定
的问答模型。

2、通用问答系统受识别精度和问答知识库的限制,对于特定
的专业性问题的回复准确性较低;采用知识图谱的特定
的问答模型虽然能够较为准确地回复特定
的专业性问题,但是对于非专业性问题的回复则较为死板,在无法根据知识图谱确定回复文本的情况下通常采用固定句式进行回复,例如“这个问题我无法理解,请输入新的问题”,这就要求所提问题必须是专业性问题。


技术实现思路

1、本说明书提供一种语音处理方法、装置及电子设备,以解决现有的语音问答系统的回复准确性较低或者不够丰富、灵活的问题。

2、为解决上述技术问题,本说明书第一方面提供一种语音处理方法,包括:获取用户的当前语音信息对应的当前语音文本;采用实体匹配模型对所述当前语音文本进行处理;在匹配到实体名称的情况下,将实体变量的取值设置为匹配到的实体名称;在未匹配到实体名称的情况下,保持实体变量的取值不变;将所述当前语音文本输入分类器;所述分类器用于确定所述当前语音文本的问题类型,所述问题类型包括专业问题的分类标识、无法识别出问题分类;将所述分类器输出的问题类型作为问题类型变量的取值;根据实体变量的当前取值、问题类型变量的当前取值,选择当前语音信息的答复策略;所述答复策略包括根据目标领域的知识图谱生成答复文本、调用通用模型生成答复文本;采用选择的答复策略生成答复文本,并根据答复文本播放答复语音。

3、在一些实施例中,根据实体变量的当前取值、问题类型变量的当前取值,选择当前语音信息的答复策略,包括:在实体变量的当前取值是目标领域的实体名称、问题类型变量为专业问题分类标识的情况下,选择答复策略为根据目标领域的知识图谱生成答复文本;在实体变量的当前取值不是目标领域的实体名称,或者问题类型变量不是专业问题分类标识的情况下,选择调用通用模型生成答复文本。

4、在一些实施例中,所述知识图谱包括节点和节点之间的关系,所述节点对应于匹配到的实体名称,所述节点之间的关系对应于所述分类器输出的专业问题分类标识。

5、在一些实施例中,获取用户的当前语音信息对应的当前语音文本,包括:获取用户的当前语音信息;对所述当前语音信息进行识别,得到当前识别文本;采用预先建立的专业名词库对所述当前识别文本进行纠错处理,将纠错处理后的识别文本作为当前语音信息对应的当前语音文本。

6、在一些实施例中,采用预先建立的专业名词库对所述当前识别文本进行纠错处理,包括:利用标点符号将当前识别文本切分成多个短句;将各个短句进一步切分成多个短语;计算每个短语分别与专业名词库中各个专业名词之间的相似度;在最大相似度大于预定相似度的情况下,采用最大相似度对应的专业名词替换当前语音文本中所述最大相似度对应的短语。

7、在一些实施例中,计算每个短语分别与专业名词库中各个专业名词之间的相似度,包括采用如下方法计算当前短语分别与专业名词库中各个专业名词之间的相似度:将当前短语和专业名词库中各个专业名词中的中文大写数字串替换为阿拉伯数字串;将替换后的当前短语和替换后的各个专业名词转换为读音标识数组,计算当前短语对应的读音标识数组分别与各个专业名词对应的读音标识数组之间的第一相似度;将替换后的当前短语和替换后的各个专业名称转换为字形数组,计算当前短语对应的字形数组分别与各个专业名词对应的字形数组之间的第二相似度;对于当前短语与同一专业名词对应的第一相似度、第二相似度,保留所述第一相似度和所述第二相似度中的最大值。

8、在一些实施例中,所述目标领域为金融领域,所述知识图谱和专业名词库是根据金融产品信息构建的。

9、本说明书第二方面提供一种语音处理装置,包括获取单元,用于获取用户的当前语音信息对应的当前语音文本;匹配单元,用于采用实体匹配模型对所述当前语音文本进行处理;第一设置单元,用于在匹配到实体名称的情况下,将实体变量的取值设置为匹配到的实体名称;在未匹配到实体名称的情况下,保持实体变量的取值不变;处理单元,用于将所述当前语音文本输入分类器;所述分类器用于确定所述当前语音文本的问题类型,所述问题类型包括专业问题的分类标识、无法识别出问题分类;第二设置单元,用于将所述分类器输出的问题类型作为问题类型变量的取值;选择单元,用于根据实体变量的当前取值、问题类型变量的当前取值,选择当前语音信息的答复策略;所述答复策略包括根据目标领域的知识图谱生成答复文本、调用通用模型生成答复文本;答复单元,用于采用选择的答复策略生成答复文本,并根据答复文本播放答复语音。

10、在一些实施例中,所述选择单元包括:第一选择子单元,用于在实体变量的当前取值是目标领域的实体名称、问题类型变量为专业问题分类标识的情况下,选择答复策略为根据目标领域的知识图谱生成答复文本;第二选择子单元,用于在实体变量的当前取值不是目标领域的实体名称,或者问题类型变量不是专业问题分类标识的情况下,选择调用通用模型生成答复文本。

11、在一些实施例中,所述知识图谱包括节点和节点之间的关系,所述节点对应于匹配到的实体名称,所述节点之间的关系对应于所述分类器输出的专业问题分类标识。

12、在一些实施例中,所述获取单元包括:第一获取子单元,用于获取用户的当前语音信息;识别子单元,用于对所述当前语音信息进行识别,得到当前识别文本;纠错子单元,用于采用预先建立的专业名词库对所述当前识别文本进行纠错处理,将纠错处理后的识别文本作为当前语音信息对应的当前语音文本。

13、在一些实施例中,所述纠错子单元包括:第一切分子单元,用于利用标点符号将当前识别文本切分成多个短句;第二切分子单元,用于将各个短句进一步切分成多个短语;计算子单元,用于计算每个短语分别与专业名词库中各个专业名词之间的相似度;替换子单元,用于在最大相似度大于预定相似度的情况下,采用最大相似度对应的专业名词替换当前语音文本中所述最大相似度对应的短语。

14、在一些实施例中,所述计算子单元包括:第一替换子单元,用于将当前短语和专业名词库中各个专业名词中的中文大写数字串替换为阿拉伯数字串;第一转换子单元,用于将替换后的当前短语和替换后的各个专业名词转换为读音标识数组,计算当前短语对应的读音标识数组分别与各个专业名词对应的读音标识数组之间的第一相似度;第二转换子单元,用于将替换后的当前短语和替换后的各个专业名称转换为字形数组,计算当前短语对应的字形数组分别与各个专业名词对应的字形数组之间的第二相似度;选取本文档来自技高网...

【技术保护点】

1.一种语音处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据实体变量的当前取值、问题类型变量的当前取值,选择当前语音信息的答复策略,包括:

3.根据权利要求1所述的方法,其特征在于,所述知识图谱包括节点和节点之间的关系,所述节点对应于匹配到的实体名称,所述节点之间的关系对应于所述分类器输出的专业问题分类标识。

4.根据权利要求1所述的方法,其特征在于,获取用户的当前语音信息对应的当前语音文本,包括:

5.根据权利要求4所述的方法,其特征在于,采用预先建立的专业名词库对所述当前识别文本进行纠错处理,包括:

6.根据权利要求5所述的方法,其特征在于,计算每个短语分别与专业名词库中各个专业名词之间的相似度,包括采用如下方法计算当前短语分别与专业名词库中各个专业名词之间的相似度:

7.根据权利要求1所述的方法,其特征在于,所述目标领域为金融领域,所述知识图谱和专业名词库是根据金融产品信息构建的。

8.一种语音处理装置,其特征在于,包括

9.一种电子设备,其特征在于,包括:

10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机程序指令,所述计算机程序指令被执行时实现权利要求1至7任一项所述的语音处理方法。

11.一种计算机程序产品,其特征在于,包含有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一项所述方法的语音处理方法。

...

【技术特征摘要】

1.一种语音处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,根据实体变量的当前取值、问题类型变量的当前取值,选择当前语音信息的答复策略,包括:

3.根据权利要求1所述的方法,其特征在于,所述知识图谱包括节点和节点之间的关系,所述节点对应于匹配到的实体名称,所述节点之间的关系对应于所述分类器输出的专业问题分类标识。

4.根据权利要求1所述的方法,其特征在于,获取用户的当前语音信息对应的当前语音文本,包括:

5.根据权利要求4所述的方法,其特征在于,采用预先建立的专业名词库对所述当前识别文本进行纠错处理,包括:

6.根据权利要求5所述的方法,其特征在于,计算每个短语分...

【专利技术属性】
技术研发人员:陈玲玲陈梦雨耿浩杰刘冬
申请(专利权)人:中国建设银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1