一种语音交互方法及装置制造方法及图纸

技术编号:20428553 阅读:23 留言:0更新日期:2019-02-23 09:42
本申请公开了一种语音交互方法及装置,该方法包括:在本轮语音交互过程中,根据当前的句间停顿阈值,确定出当前用户在本轮交互中的用户语音,然后根据该用户语音确定出一个新的句间停顿阈值,利用这个新的句间停顿阈值更新当前的句间停顿阈值,并对本轮用户语音进行响应,这样,可以对每轮交互使用的句间停顿阈值进行动态调整,动态地适应当前用户的停顿习惯,从而能够提高语音响应结果的准确性,降低用户重复同一问题的次数,进而提高了用户体验。

【技术实现步骤摘要】
一种语音交互方法及装置
本申请涉及语音识别
,尤其涉及一种语音交互方法及装置。
技术介绍
随着智能语音交互技术的发展成熟,机器人对语义的理解和响应越来越人性化,然而,对不同用户的表达节奏的自适应能力,仍存在不足。现有的语音交互方法,虽然在一定程度上能够模拟真人交替对话,但每个用户都有自己不同的表达习惯,故而,若采用统一的规则来判断一段语音是否结束,会出现判断结果不准确的现象,从而影响后续语义理解和语音响应的准确性,且降低了用户体验效果。
技术实现思路
本申请实施例的主要目的在于提供一种语音交互方法及装置,能够提高语音响应结果的准确性,且提高了用户体验效果。本申请实施例提供了一种语音交互方法,包括:在本轮语音交互过程中,根据当前的句间停顿阈值,确定当前用户在本轮交互中的用户语音;根据所述用户语音确定一个新的句间停顿阈值,利用所述新的句间停顿阈值更新所述当前的句间停顿阈值,并对所述用户语音进行响应。可选的,所述根据所述用户语音确定一个新的句间停顿阈值,包括:确定所述用户语音中实际的各个句间停顿和各个句尾停顿;根据确定的各个句间停顿和各个句尾停顿,确定一个新的句间停顿阈值。可选的,所述确定所述用户语音中实际的各个句间停顿和各个句尾停顿,包括:对所述用户语音的识别文本进行句法分析,确定所述用户语音中实际的各个句间停顿和各个句尾停顿。可选的,所述对所述用户语音的识别文本进行句法分析,确定所述用户语音中实际的各个句间停顿和各个句尾停顿,包括:从所述用户语音的识别文本中提取语义角色信息,所述语义角色信息包括一组谓语和宾语;根据所述语义角色信息的提取数量,确定所述用户语音中实际的各个句间停顿和各个句尾停顿。可选的,所述根据确定的各个句间停顿和各个句尾停顿,确定一个新的句间停顿阈值,包括:根据确定的各个句间停顿和各个句尾停顿对应的持续时长,确定一个新的句间停顿阈值。可选的,所述根据确定的各个句间停顿和各个句尾停顿对应的持续时长,确定一个新的句间停顿阈值,包括:将确定的各个句间停顿的持续时长进行加权,得到本轮的句间停顿时长;将确定的各个句尾停顿的持续时长进行加权,得到本轮的句尾停顿时长;从所述本轮的句间停顿时长与所述本轮的句尾停顿时长之间选取一个数值,作为新的句间停顿阈值。可选的,若所述本轮语音交互过程是所述当前用户的第一轮语音交互过程以外的任一轮语音交互过程,则所述根据确定的各个句间停顿和各个句尾停顿对应的持续时长,确定一个新的句间停顿阈值,包括:将确定的各个句间停顿的持续时长进行加权,并将该加权结果与上一轮得到的句间停顿时长进行加权,得到本轮的句间停顿时长;将确定的各个句尾停顿的持续时长进行加权,并将该加权结果与上一轮得到的句尾停顿时长进行加权,得到本轮的句尾停顿时长;从所述本轮的句间停顿时长与所述本轮的句尾停顿时长之间选取一个数值,作为新的句间停顿阈值。可选的,所述对所述用户语音进行响应,包括:将所述用户语音的识别文本,作为待响应文本;提取所述待响应文本中的各个高频词汇;将提取的各个高频词汇与预先构建的无效词库中的各个无效词汇进行匹配,将匹配到的高频词汇以及所述待响应文本中的低频词汇从所述待响应文本中去除,所述无效词库中存储了所述当前用户使用过的无效词汇;根据去除操作后的文本进行语音响应。可选的,所述将匹配到的高频词汇以及所述待响应文本中的低频词汇从所述待响应文本中去除之后,还包括:检测匹配操作后剩下的高频词汇中是否存在无效词汇;若是,则将检测到的无效词汇存储在所述无效词库中,并将检测到的无效词汇从所述待响应文本中去除。本申请实施例还提供了一种语音交互装置,包括:用户语音确定单元,用于在本轮语音交互过程中,根据当前的句间停顿阈值,确定当前用户在本轮交互中的用户语音;停顿阈值确定单元,用于根据所述用户语音确定一个新的句间停顿阈值,利用所述新的句间停顿阈值更新所述当前的句间停顿阈值;用户语音响应单元,用于对所述用户语音进行响应。可选的,所述停顿阈值确定单元包括:实际停顿确定子单元,用于确定所述用户语音中实际的各个句间停顿和各个句尾停顿;停顿阈值确定子单元,用于根据确定的各个句间停顿和各个句尾停顿,确定一个新的句间停顿阈值。可选的,所述实际停顿确定子单元具体用于:对所述用户语音的识别文本进行句法分析,确定所述用户语音中实际的各个句间停顿和各个句尾停顿。可选的,所述实际停顿确定子单元包括:角色信息提取子单元,用于从所述用户语音的识别文本中提取语义角色信息,所述语义角色信息包括一组谓语和宾语;停顿确定子单元,用于根据所述语义角色信息的提取数量,确定所述用户语音中实际的各个句间停顿和各个句尾停顿。可选的,所述停顿阈值确定子单元具体用于:根据确定的各个句间停顿和各个句尾停顿对应的持续时长,确定一个新的句间停顿阈值。可选的,所述停顿阈值确定子单元包括:第一停顿时长确定子单元,用于将确定的各个句间停顿的持续时长进行加权,得到本轮的句间停顿时长;第二停顿时长确定子单元,用于将确定的各个句尾停顿的持续时长进行加权,得到本轮的句尾停顿时长;第一停顿阈值确定子单元,用于从所述本轮的句间停顿时长与所述本轮的句尾停顿时长之间选取一个数值,作为新的句间停顿阈值。可选的,若所述本轮语音交互过程是所述当前用户的第一轮语音交互过程以外的任一轮语音交互过程,则所述停顿阈值确定子单元包括:第三停顿时长确定子单元,用于将确定的各个句间停顿的持续时长进行加权,并将该加权结果与上一轮得到的句间停顿时长进行加权,得到本轮的句间停顿时长;第四停顿时长确定子单元,用于将确定的各个句尾停顿的持续时长进行加权,并将该加权结果与上一轮得到的句尾停顿时长进行加权,得到本轮的句尾停顿时长;第二停顿阈值确定子单元,用于从所述本轮的句间停顿时长与所述本轮的句尾停顿时长之间选取一个数值,作为新的句间停顿阈值。可选的,所述用户语音响应单元包括:文本确定子单元,用于将所述用户语音的识别文本,作为待响应文本;词汇提取子单元,用于提取所述待响应文本中的各个高频词汇;词汇匹配子单元,用于将提取的各个高频词汇与预先构建的无效词库中的各个无效词汇进行匹配,将匹配到的高频词汇以及所述待响应文本中的低频词汇从所述待响应文本中去除,所述无效词库中存储了所述当前用户使用过的无效词汇;语音响应子单元,用于根据去除操作后的文本进行语音响应。可选的,所述装置还包括:词汇检测单元,用于将匹配到的高频词汇以及所述待响应文本中的低频词汇从所述待响应文本中去除之后,检测匹配操作后剩下的高频词汇中是否存在无效词汇;词汇去除单元,用于若检测出匹配操作后剩下的高频词汇中存在无效词汇,则将检测到的无效词汇存储在所述无效词库中,并将检测到的无效词汇从所述待响应文本中去除。本申请实施例还提供了一种语音交互设备,包括:处理器、存储器、系统总线;所述处理器以及所述存储器通过所述系统总线相连;所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述语音交互方法中的任意一种实现方式。本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述语音交互方法中的任意一种实现方式。本申请实施例还提供了一本文档来自技高网...

【技术保护点】
1.一种语音交互方法,其特征在于,包括:在本轮语音交互过程中,根据当前的句间停顿阈值,确定当前用户在本轮交互中的用户语音;根据所述用户语音确定一个新的句间停顿阈值,利用所述新的句间停顿阈值更新所述当前的句间停顿阈值,并对所述用户语音进行响应。

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:在本轮语音交互过程中,根据当前的句间停顿阈值,确定当前用户在本轮交互中的用户语音;根据所述用户语音确定一个新的句间停顿阈值,利用所述新的句间停顿阈值更新所述当前的句间停顿阈值,并对所述用户语音进行响应。2.根据权利要求1所述的方法,其特征在于,所述根据所述用户语音确定一个新的句间停顿阈值,包括:确定所述用户语音中实际的各个句间停顿和各个句尾停顿;根据确定的各个句间停顿和各个句尾停顿,确定一个新的句间停顿阈值。3.根据权利要求2所述的方法,其特征在于,所述确定所述用户语音中实际的各个句间停顿和各个句尾停顿,包括:对所述用户语音的识别文本进行句法分析,确定所述用户语音中实际的各个句间停顿和各个句尾停顿。4.根据权利要求3所述的方法,其特征在于,所述对所述用户语音的识别文本进行句法分析,确定所述用户语音中实际的各个句间停顿和各个句尾停顿,包括:从所述用户语音的识别文本中提取语义角色信息,所述语义角色信息包括一组谓语和宾语;根据所述语义角色信息的提取数量,确定所述用户语音中实际的各个句间停顿和各个句尾停顿。5.根据权利要求2所述的方法,其特征在于,所述根据确定的各个句间停顿和各个句尾停顿,确定一个新的句间停顿阈值,包括:根据确定的各个句间停顿和各个句尾停顿对应的持续时长,确定一个新的句间停顿阈值。6.根据权利要求5所述的方法,其特征在于,所述根据确定的各个句间停顿和各个句尾停顿对应的持续时长,确定一个新的句间停顿阈值,包括:将确定的各个句间停顿的持续时长进行加权,得到本轮的句间停顿时长;将确定的各个句尾停顿的持续时长进行加权,得到本轮的句尾停顿时长;从所述本轮的句间停顿时长与所述本轮的句尾停顿时长之间选取一个数值,作为新的句间停顿阈值。7.根据权利要求5所述的方法,其特征在于,若所述本轮语音交互过程是所述当前用户的第一轮语音交互过程以外的任一轮语音交互过程,则所述根据确定的各个句间停顿和各个句尾停顿对应的持续时长,确定一个新的句间停顿阈值,包括:将确定的各个句间停顿的持续时长进行加权,并将该加权结果与上一轮得到的句间停顿时长进行加权,得到本轮的句间停顿时长;将确定的各个句尾停顿的持续时长进行加权,并将该加权结果与上一轮得到的句尾停顿时长进行加权,得到本轮的句尾停顿时长;从所述本轮的句间停顿时长与所述本轮的句尾停顿时长之间选取一个数值,作为新的句间停顿阈值。8.根据权利要求1至7任一项所述的方法,其特征在于,所述对所述用户语音进行响应,包括:将所述用户语音的识别文本,作为待响应文本;提取所述待响应文本中的各个高频词汇;将提取的各个高频词汇与预先构建的无效词库中的各个无效词汇进行匹配,将匹配到的高频词汇以及所述待响应文本中的低频词汇从所述待响应文本中去除,所述无效词库中存储了所述当前用户使用过的无效词汇;根据去除操作后的文本进行语音响应。9.根据权利要求8所述的方法,其特征在于,所述将匹配到的高频词汇以及所述待响应文本中的低频词汇从所述待响应文本中去除之后,还包括:检测匹配操作后剩下的高频词汇中是否存在无效词汇;若是,则将检测到的无效词汇存储在所述无效词库中,并将检测到的无效词汇从所述待响应文本中去除。10.一种语音交互装置,其特征在于,包括:用户语音确定单元,用于在本轮语音交互过程中,根据当前的句间停顿阈值,确定当前用户在本轮交互中的用户语音;停顿阈值确定单元,用于根据所述用户语音确定一个新的句间停顿...

【专利技术属性】
技术研发人员:马雪涛薛臣臣熊勇军
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1