一种语音交互方法及装置制造方法及图纸

技术编号:18944682 阅读:36 留言:0更新日期:2018-09-15 11:57
本申请公开了一种语音交互方法,先判断本次接收语音数据是否具有弱说法属性,若本次接收语音数据具有弱说法属性,则进一步判断本次接收语音数据是指令语音还是噪声语音。由于连续两次识别到同一个噪声语音的可能性极低,以及在上一次语音指令不被响应的情况下,用户很可能再次给出相同或相似的语音指令,基于此,如果本次接收语音数据与上一次接收语音数据在语义上完全相同或近似相同,则可以认为本次接收语音数据是指令语音并对其进行指令响应。可见,对于具有弱说法属性的用户语音,能够判断其是否为指令语音,从而对这类指令语音进行响应,进而提升了用户体验。

Speech interaction method and device

This application discloses a voice interaction method, which first determines whether the received voice data has weak attributes. If the received voice data has weak attributes, then further determines whether the received voice data is command voice or noise voice. Because the possibility of identifying the same noisy speech twice in a row is extremely low, and if the last speech instruction is not responded to, the user is likely to give the same or similar speech instruction again, based on this, if the received speech data is semantically identical or similar to the last received speech data It can be considered that the received speech data is the command speech and its command response. It can be seen that the weak speech attributes of the user voice, can determine whether it is an instruction voice, so as to respond to this kind of instruction voice, thereby improving the user experience.

【技术实现步骤摘要】
一种语音交互方法及装置
本申请涉及人工智能
,尤其涉及一种语音交互方法及装置。
技术介绍
随着语音技术的发展,智能语音技术已经被广泛的应用于生产生活的各个领域,当前的人机语音交互,已经由原先类似指令的语音交互,逐步的发展为自然语言的交互。用户语音可以分为两类,一类是具有强说法属性的语音,另一类是具有弱说法属性的语音。但是,对于用户的某些指令语音,现有的人机交互设备可能会因为该用户语音是具有弱说法属性的语音,而选择拒识该用户语音,也即不对该用户语音进行指令响应,从而降低了用户体验。
技术实现思路
有鉴于此,本申请实施例的主要目的在于提供一种语音交互方法及装置,对于具有弱说法属性的用户语音,能够判断其是否为指令语音,从而对这类指令语音进行响应,进而提升了用户体验。本申请实施例提供了一种语音交互方法,包括:接收用户的语音数据;判断本次接收语音数据是否具有弱说法属性;若所述本次接收语音数据具有弱说法属性,则判断所述本次接收语音数据是否满足预设判定条件,其中,所述预设判定条件包括所述本次接收语音数据与上一次接收语音数据在语义上是否完全相同或近似相同;若所述本次接收语音数据满足所述预设判定条件,则对所述本次接收语音数据进行指令响应。可选的,所述预设判定条件还包括:所述本次接收语音数据与所述上一次接收语音数据之间的时间间隔是否小于预设时长。可选的,所述判断本次接收语音数据是否具有弱说法属性,包括:获取所述本次接收语音数据的识别文本,作为本次识别文本;生成所述本次识别文本对应的说法判定特征;根据所述本次识别文本对应的说法判定特征,判断所述本次接收语音数据是否具有弱说法属性。可选的,所述根据所述本次识别文本对应的说法判定特征,判断本次接收语音数据是否具有弱说法属性,包括:利用预先构建的强弱说法判定模型,来根据所述本次识别文本对应的说法判定特征,判断本次接收语音数据是否具有弱说法属性。可选的,所述强弱说法判定模型按照以下方式构建:将当前获取的一条样本文本作为训练文本,并生成所述训练文本对应的说法判定特征;将所述训练文本对应的说法判定特征输入至当前强弱说法判定模型中,以便当前强弱说法判定模型预测所述训练文本的说法类型,所述说法类型为强说法或弱说法;获取预先为所述训练文本标注的说法类型;若所述训练文本的说法类型预测结果和说法类型标注结果不同,则更新当前强弱说法判定模型的模型参数,完成本轮模型训练;判断是否满足训练结束条件;若是,则结束训练;若否,则获取下一条样本文本并将所述下一条样本文本作为所述训练文本,继续下一轮模型训练。可选的,所述利用预先构建的强弱说法判定模型,来根据所述本次识别文本对应的说法判定特征,判断本次接收语音数据是否具有弱说法属性,包括:将所述本次识别文本对应的说法判定特征输入至预先构建的强弱说法判定模型,以获取所述强弱说法判定模型的判定结果,其中,所述判定结果包括第一概率和第二概率,所述第一概率为所述本次接收语音数据具有弱说法属性的概率,所述第二概率为所述本次接收语音数据具有强说法属性的概率;若所述第一概率大于或等于所述第二概率,则认为所述本次接收语音数据具有弱说法属性;若所述第一概率小于所述第二概率,则认为所述本次接收语音数据具有强说法属性。可选的,所述说法判定特征的对应文本作为待判定文本时,所述说法判定特征包括以下至少一种特征值:根据所述待判定文本的文本长度生成的第一特征值;根据所述待判定文本的分词个数生成的第二特征值;根据所述待判定文本的文本成分之间的句法关系生成的第三特征值;根据所述待判定文本中的业务关键词生成的第四特征值;根据所述待判定文本与上一待判定文本的相关度生成的第五特征值;根据所述待判定文本与人机交互设备所提问题的相关度生成的第六特征值,所述待判定文本是对所述人机交互设备所提问题的回答文本。可选的,所述第五特征值按照下述方式生成:确定所述待判定文本所属的业务说法模板,作为本次说法模板;确定所述上一待判定文本所属的业务说法模板,作为上一次说法模板;确定第一条件概率并将所述第一条件概率作为第五特征值,所述第一条件概率是出现所述上一次说法模板的情况下出现所述本次说法模板的概率。可选的,所述第六特征值按照下述方式生成:确定所述待判定文本所属的业务说法模板,作为本次说法模板;确定所述人机交互设备对所述待判定文本所提问题所属的业务说法模板,作为提问说法模板;确定第二条件概率并将所述第二条件概率作为第六特征值,所述第二条件概率是出现所述提问说法模板的情况下出现所述本次说法模板的概率。本申请实施例还提供了一种语音交互装置,包括:语音接收单元,用于接收用户的语音数据;说法判定单元,用于判断本次接收语音数据是否具有弱说法属性;指令判定单元,用于若所述本次接收语音数据具有弱说法属性,则判断所述本次接收语音数据是否满足预设判定条件,其中,所述预设判定条件包括所述本次接收语音数据与上一次接收语音数据在语义上是否完全相同或近似相同;指令响应单元,用于若所述本次接收语音数据满足所述预设判定条件,则对所述本次接收语音数据进行指令响应。可选的,所述预设判定条件还包括:所述本次接收语音数据与所述上一次接收语音数据之间的时间间隔是否小于预设时长。可选的,所述说法判定单元包括:文本获取子单元,用于获取所述本次接收语音数据的识别文本,作为本次识别文本;特征生成子单元,用于生成所述本次识别文本对应的说法判定特征;说法判定子单元,用于根据所述本次识别文本对应的说法判定特征,判断所述本次接收语音数据是否具有弱说法属性。可选的,所述说法判定特征的对应文本作为待判定文本时,所述说法判定特征包括以下至少一种特征值:根据所述待判定文本的文本长度生成的第一特征值;根据所述待判定文本的分词个数生成的第二特征值;根据所述待判定文本的文本成分之间的句法关系生成的第三特征值;根据所述待判定文本中的业务关键词生成的第四特征值;根据所述待判定文本与上一待判定文本的相关度生成的第五特征值;根据所述待判定文本与人机交互设备所提问题的相关度生成的第六特征值,所述待判定文本是对人机交互设备所述所提问题的回答文本。本申请实施例还提供了一种语音交互装置,包括:处理器、存储器、系统总线;所述处理器以及所述存储器通过所述系统总线相连;所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述语音交互方法中的任意一种实现方式。。本申请实施例还提供了一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行上述语音交互方法中的任意一种实现方式。本实施例提供的一种语音交互方法及装置,先判断本次接收语音数据是否具有弱说法属性,若本次接收语音数据具有弱说法属性,则进一步判断本次接收语音数据是指令语音还是噪声语音。由于连续两次识别到同一个噪声语音的可能性极低,以及在上一次语音指令不被响应的情况下,用户很可能再次给出相同或相似的语音指令,基于此,如果本次接收语音数据与上一次接收语音数据在语义上完全相同或近似相同,则可以认为本次接收语音数据是指令语音并对其进行指令响应。可见,对于具有弱说法属性的用户语音,能够判断其是否为指令语音,从而对这类指令语音进行响应,进而提升了用户体验。附图说明为了更清楚地说明本申请实施本文档来自技高网...

【技术保护点】
1.一种语音交互方法,其特征在于,包括:接收用户的语音数据;判断本次接收语音数据是否具有弱说法属性;若所述本次接收语音数据具有弱说法属性,则判断所述本次接收语音数据是否满足预设判定条件,其中,所述预设判定条件包括所述本次接收语音数据与上一次接收语音数据在语义上是否完全相同或近似相同;若所述本次接收语音数据满足所述预设判定条件,则对所述本次接收语音数据进行指令响应。

【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:接收用户的语音数据;判断本次接收语音数据是否具有弱说法属性;若所述本次接收语音数据具有弱说法属性,则判断所述本次接收语音数据是否满足预设判定条件,其中,所述预设判定条件包括所述本次接收语音数据与上一次接收语音数据在语义上是否完全相同或近似相同;若所述本次接收语音数据满足所述预设判定条件,则对所述本次接收语音数据进行指令响应。2.根据权利要求1所述的方法,其特征在于,所述预设判定条件还包括:所述本次接收语音数据与所述上一次接收语音数据之间的时间间隔是否小于预设时长。3.根据权利要求1所述的方法,其特征在于,所述判断本次接收语音数据是否具有弱说法属性,包括:获取所述本次接收语音数据的识别文本,作为本次识别文本;生成所述本次识别文本对应的说法判定特征;根据所述本次识别文本对应的说法判定特征,判断所述本次接收语音数据是否具有弱说法属性。4.根据权利要求3所述的方法,其特征在于,所述根据所述本次识别文本对应的说法判定特征,判断本次接收语音数据是否具有弱说法属性,包括:利用预先构建的强弱说法判定模型,来根据所述本次识别文本对应的说法判定特征,判断本次接收语音数据是否具有弱说法属性。5.根据权利要求4所述的方法,其特征在于,所述强弱说法判定模型按照以下方式构建:将当前获取的一条样本文本作为训练文本,并生成所述训练文本对应的说法判定特征;将所述训练文本对应的说法判定特征输入至当前强弱说法判定模型中,以便当前强弱说法判定模型预测所述训练文本的说法类型,所述说法类型为强说法或弱说法;获取预先为所述训练文本标注的说法类型;若所述训练文本的说法类型预测结果和说法类型标注结果不同,则更新当前强弱说法判定模型的模型参数,完成本轮模型训练;判断是否满足训练结束条件;若是,则结束训练;若否,则获取下一条样本文本并将所述下一条样本文本作为所述训练文本,继续下一轮模型训练。6.根据权利要求5所述的方法,其特征在于,所述利用预先构建的强弱说法判定模型,来根据所述本次识别文本对应的说法判定特征,判断本次接收语音数据是否具有弱说法属性,包括:将所述本次识别文本对应的说法判定特征输入至预先构建的强弱说法判定模型,以获取所述强弱说法判定模型的判定结果,其中,所述判定结果包括第一概率和第二概率,所述第一概率为所述本次接收语音数据具有弱说法属性的概率,所述第二概率为所述本次接收语音数据具有强说法属性的概率;若所述第一概率大于或等于所述第二概率,则认为所述本次接收语音数据具有弱说法属性;若所述第一概率小于所述第二概率,则认为所述本次接收语音数据具有强说法属性。7.根据权利要求3至6任一项所述的方法,其特征在于,所述说法判定特征的对应文本作为待判定文本时,所述说法判定特征包括以下至少一种特征值:根据所述待判定文本的文本长度生成的第一特征值;根据所述待判定文本的分词个数生成的第二特征值;根据所述待判定文本的文本成分之间的句法关系生成的第三特征值;根据所述待判定文本中的业务关键词生成的第四特征值;根据所述待判定文本与上一待判定文本的相关度生成的...

【专利技术属性】
技术研发人员:杨强夏涛黄鑫陈志刚章继东
申请(专利权)人:科大讯飞股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1