人机语音交互方法、装置、电子设备及存储介质制造方法及图纸

技术编号:27102101 阅读:15 留言:0更新日期:2021-01-25 18:47
本申请公开了人机语音交互方法、装置、电子设备及存储介质,本申请通过获取用于语音交互的基础信息,基础信息包括语音识别结果和最近一次的机器响应内容;判断基础信息是否符合机器响应条件;在基础信息符合机器响应条件的情况下,根据语音识别结果确定待作出机器响应的用户语句,以使应答模块根据待作出机器响应的用户语句确定下一次的机器响应内容。本申请将现有技术中的控制模块与应答模块独立开来,显著降低了模块之间的耦合,且通过机器响应条件的设定,对下发至应答模块的语句信息进行下发时机的控制以及内容的过滤、筛选或融合,将人机语音交互的双工模式转化为单工模式,极大的提升了用户的体验感受,且极大程度上减轻了应答模块的负担。应答模块的负担。应答模块的负担。

【技术实现步骤摘要】
人机语音交互方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能领域,具体涉及人机语音交互方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能的日臻成熟,在很多场景下,外呼机器人能够代替人工与用户进行语音交流,降低了人工成本。
[0003]但是,现有技术中,人机语音交流还存在着很多不足之处,如现有外呼机器人的对话模式是双工的,即用户可以和机器人同时说话,双工模式通话不符合人类的对话习惯,大大降低了人类的对话体验;又如人机对话中机器的语言通常以数据流的形式组织,即每秒请求几个数据包,但其中大量的上游数据包为重复、繁冗、或者不需要下游服务做出回复的,现有技术中通常将所有上游数据下发至下游服务,极大的增加下游各服务模块的负担,限制下游服务模块的能力发展。

技术实现思路

[0004]鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的人机语音交互方法、装置、电子设备及存储介质。
[0005]依据本专利技术的一方面,提供了一种人机语音交互方法,包括:
[0006]获取用于语音交互的基础信息,基础信息包括语音识别结果和最近一次的机器响应内容;
[0007]判断基础信息是否符合机器响应条件;
[0008]根据语音识别结果确定待作出机器响应的用户语句,以使应答模块根据待作出机器响应的用户语句确定下一次的机器响应内容。
[0009]优选的,在上述方法中,判断基础信息是否符合机器响应条件包括:
[0010]根据基础信息确定如下的至少一类响应特征:语义完整性特征,匹配特征,离散特征;
[0011]根据确定的响应特征判断基础信息是否符合机器响应条件。
[0012]优选的,在上述方法中,根据确定的响应特征判断所述基础信息是否符合机器响应条件包括:
[0013]在确定的响应特征有多类的情况下,将确定的各类响应特征进行融合,得到融合响应特征;
[0014]基于二分类模型和融合响应特征确定基础信息是否符合机器响应条件。
[0015]优选的,在上述方法中,语音识别结果包括最近一次未作出机器响应的用户语句,判断基础信息是否符合机器响应条件包括:
[0016]根据语言模型确定最近一次未作出机器响应的用户语句的语义完整度;
[0017]在语义完整度大于第一预设阈值的情况下,确定基础信息符合机器响应条件。
[0018]优选的,在上述方法中,语音识别结果包括未作出机器响应的用户语句,判断基础信息是否符合机器响应条件包括:
[0019]根据匹配模型确定最近一次的机器响应内容与语音识别结果的关联度;
[0020]在关联度大于第二预设阈值的情况下,确定基础信息符合机器响应条件。
[0021]优选的,在上述方法中,语音识别结果包括未作出机器响应的用户语句和断句信息,判断基础信息是否符合机器响应条件包括:
[0022]根据断句信息对未作出机器响应的用户语句进行离散化处理,得到未作出机器响应的用户语句的离散特征;
[0023]基于语言模型,提取未作出机器响应的用户语句的文本特征,根据离散特征对文本特征进行特征融合和/或特征过滤处理,得到增强特征,并根据增强特征确定所述基础信息是否符合机器响应条件。
[0024]优选的,在上述方法中,语音识别结果包括未作出机器响应的用户语句,根据语音识别结果确定待作出机器响应的用户语句包括:
[0025]确定最近一次未作出机器响应的用户语句与其他未作出机器响应的用户语句的相似度;
[0026]在相似度小于第三预设阈值的情况下,将最近一次未作出机器响应的用户语句与其他未作出机器响应的用户语句进行融合,将得到的融合语句作为待响应基础语句,根据待响应基础语句确定待作出机器响应的用户语句。
[0027]优选的,在上述方法中,根据语音识别结果确定待作出机器响应的用户语句还包括:
[0028]在相似度不小于第三预设阈值的情况下,将最近一次未作出机器响应的语句作为待响应基础语句,根据待响应基础语句确定待作出机器响应的用户语句。
[0029]优选的,在上述方法中,语音识别结果还包括断句信息,根据语音识别结果确定待作出机器响应的用户语句还包括:
[0030]根据断句信息对待响应基础语句进行离散化处理。
[0031]依据本申请的另一方面,提供了一种人机语音交互装置,该装置包括:
[0032]获取单元,用于获取用于语音交互的基础信息,基础信息包括语音识别结果和最近一次的机器响应内容;
[0033]时机判断单元,用于判断基础信息是否符合机器响应条件;
[0034]语句确定单元,用于根据语音识别结果确定待作出机器响应的用户语句,以使应答模块根据待作出机器响应的用户语句确定下一次的机器响应内容。
[0035]优选的,在上述装置中,时机判断单元,用于根据基础信息确定如下的至少一类响应特征:语义完整性特征,匹配特征,离散特征;并用于根据确定的响应特征判断基础信息是否符合机器响应条件。
[0036]优选的,在上述装置中,时机判断单元,用于在确定的响应特征有多类的情况下,将确定的各类响应特征进行融合,得到融合响应特征;并用于基于二分类模型和融合响应特征确定基础信息是否符合机器响应条件。
[0037]优选的,在上述装置中,语音识别结果包括最近一次未作出机器响应的用户语句,时机判断单元,用于根据语言模型确定最近一次未作出机器响应的用户语句的语义完整
度;以及用于在语义完整度大于第一预设阈值的情况下,确定基础信息符合机器响应条件。
[0038]优选的,在上述装置中,语音识别结果包括未作出机器响应的用户语句,时机判断单元,用于根据匹配模型确定最近一次的机器响应内容与语音识别结果的关联度;以及用于在关联度大于第二预设阈值的情况下,确定基础信息符合机器响应条件。
[0039]优选的,在上述装置中,语音识别结果包括未作出机器响应的用户语句和断句信息,时机判断单元,用于根据断句信息对未作出机器响应的用户语句进行离散化处理,得到未作出机器响应的用户语句的离散特征;并基于语言模型,提取未作出机器响应的用户语句的文本特征,根据离散特征对文本特征进行特征融合和/或特征过滤处理,得到增强特征,并根据增强特征确定所述基础信息是否符合机器响应条件。
[0040]优选的,在上述装置中,语音识别结果包括未作出机器响应的用户语句,语句确定单元,用于确定最近一次未作出机器响应的用户语句与其他未作出机器响应的用户语句的相似度;以及用于在相似度小于第三预设阈值的情况下,将最近一次未作出机器响应的用户语句与其他未作出机器响应的用户语句进行融合,将得到的融合语句作为待响应基础语句,根据待响应基础语句确定待作出机器响应的用户语句。
[0041]优选的,在上述装置中,语句确定单元,还用于在相似度不小于第三预设阈值的情况下,将最近一次未作出机器响应的语句作为待响应基础语句,根据待响应基础语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人机语音交互方法,其特征在于,包括:获取用于语音交互的基础信息,所述基础信息包括语音识别结果和最近一次的机器响应内容;判断所述基础信息是否符合机器响应条件;根据语音识别结果确定待作出机器响应的用户语句,以使应答模块根据待作出机器响应的用户语句确定下一次的机器响应内容。2.根据权利要求1所述的方法,其特征在于,所述判断所述基础信息是否符合机器响应条件包括:根据所述基础信息确定如下的至少一类响应特征:语义完整性特征,匹配特征,离散特征;根据确定的响应特征判断所述基础信息是否符合机器响应条件。3.根据权利要求2所述的方法,其特征在于,所述根据确定的响应特征判断所述基础信息是否符合机器响应条件包括:在确定的响应特征有多类的情况下,将确定的各类响应特征进行融合,得到融合响应特征;基于二分类模型和所述融合响应特征确定所述基础信息是否符合机器响应条件。4.根据权利要求1所述的方法,其特征在于,所述语音识别结果包括最近一次未作出机器响应的用户语句,所述判断所述基础信息是否符合机器响应条件包括:根据语言模型确定最近一次未作出机器响应的用户语句的语义完整度;在所述语义完整度大于第一预设阈值的情况下,确定所述基础信息符合机器响应条件。5.根据权利要求1所述的方法,其特征在于,所述语音识别结果包括未作出机器响应的用户语句,所述判断所述基础信息是否符合机器响应条件包括:根据匹配模型确定最近一次的机器响应内容与语音识别结果的关联度;在所述关联度大于第二预设阈值的情况下,确定所述基础信息符合机器响应条件。6.根据权利要求1所述的方法,其特征在于,所述语音识别结果包括未作出机器响应的用户语句和断句信息,所述判断所述基础信息是否符合机器响应条件包括:根据所述断句信息对所述未作出机器响应的用户语句进行离散化处理,得到未作出机器响应的用户语句的离散特征;基于语言模型,提取未作出机器响应的用户语句的文本特征,根据所述离散特征对所述文本特征进行特征融合和/或特...

【专利技术属性】
技术研发人员:汪建袁春阳
申请(专利权)人:北京三快在线科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1