智能语音交互处理方法以及移动终端技术

技术编号：37136960 阅读：18 留言：0更新日期：2023-04-06 21:37

本申请提供一种智能语音交互处理方法以及移动终端，涉及终端领域，可以实现低功耗的免唤醒语音交互，该方法包括：移动终端接收车载终端发送的n个录音数据，n个录音数据是车载终端录制一条语音指令生成的，n为大于1的任意正整数；移动终端对n个录音数据中的前m个录音数据进行自动语音识别，得到前m个录音数据对应的文本，m为小于n的任意正整数；移动终端根据前m个录音数据对应的文本，确定语音指令是否为无效语音指令；移动终端响应于语音指令是无效语音指令，控制n个录音数据中的剩余n

全部详细技术资料下载

【技术实现步骤摘要】
智能语音交互处理方法以及移动终端

[0001]本申请涉及终端
，尤其涉及一种智能语音交互处理方法以及移动终端。

技术介绍

[0002]人机交互(human computer interaction，HCI)是指人与计算机系统之间通过某种语言，以一定的交互方式，完成确定任务的人与计算机之间的信息交换过程。语音助手，最初作为一款手机应用程序(application，APP)出现，通过智能对话与即时问答的智能交互，实现帮助用户解决问题。随着人工智能相关领域的发展，语音助手的功能出现了灵活多样的变化，并广泛应用于智能手机、智能家电、智能汽车、智能玩具等领域，实现用户对各种生活信息的实时查询和操作、对智能手机等设备的操控、以及互动聊天等。
[0003]语音助手可以将用户输入的语音数据转换成文字，之后理解内容，基于内容执行响应策略，并把响应策略对应的文本转换成语音数据，输出给用户。由此，语音助手可以包括以下三个处理过程，自动语音识别(automatic speech recognition，ASR)、自然语言处理(natural langua本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种智能语音交互处理方法，其特征在于，所述方法应用于移动终端，所述移动终端与车载终端建立通信连接，所述车载终端具有录音功能，所述方法包括：所述移动终端接收所述车载终端发送的n个录音数据，所述n个录音数据是所述车载终端录制接收到的一条语音指令生成的，n为大于1的任意正整数；所述移动终端对所述n个录音数据中的前m个录音数据进行自动语音识别，得到所述m个录音数据对应的文本，m为小于n的任意正整数；所述移动终端根据所述m个录音数据对应的文本，确定所述语音指令是否为无效语音指令；所述移动终端响应于所述语音指令是无效语音指令，控制所述n个录音数据中的剩余n
‑
m个录音数据不进行自动语音识别。2.根据权利要求1所述的方法，其特征在于，所述控制所述n个录音数据中的剩余n
‑
m个录音数据不进行自动语音识别，包括：控制自动语音识别状态为第一状态，所述第一状态表示所述移动终端关闭自动语音识别功能，终止对所述n个录音数据中的剩余n
‑
m个录音数据进行自动语音识别。3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：所述移动终端不响应所述语音指令。4.根据权利要求1至3任一项所述的方法，其特征在于，所述无效语音指令不存在用户意图。5.根据权利要求1至4任一项所述的方法，其特征在于，所述m个录音数据对应的文本满足以下至少一项：所述移动终端预先设置的多条正则表达式未匹配到所述m个录音数据对应的文本；或者，所述移动终端的神经网络模型输出的识别结果信息不包括任何一个槽位字段的词槽信息，所述神经网络模块的输入是所述m个录音数据对应的文本。6.根据权利要求1至5任一项所述的方法，其特征在于，所述方法还包括：所述移动终端向所述车载终端发送所述m个录音数据对应的文本，所述m个录音数据对应的文本用于所述车载终端显示所述m个录音数据对应的文本。7.根据权利要求6所述的方法，其特征在于，所述方法还包括：所述移动终端向所述车载终端发送第一指示信息，所述第一指示信息用于指示所述语音指令是无效语音指令，并触发所述车载终端终止显示所述m个录音数据对应的文本。8.根据权利要求1至7任一项所述的方法，其特征在于，所述移动终端对所述n个录音数据中的前m个录音数据进行自动语音识别，得到所述m个录音数据对应的文本，包括：当m＝1时，所述m个录音数据包括第一录音数据，自动语音识别状态为第二状态，所述第二状态表示所述移动终端开启自动语音识别功能，所述移动终端对所述第一录音数据进行自动语音识别，得到所述第一录音数据对应的文本。9.根据权利要求1至7任一项所述的方法，其特征在于，所述移动终端对所述n个录音数据中的前m个录音数据进行自动语音识别，得到所述m个录音数据对应的文本，包括：当m>1时，所述m个录音数据包括第一至第m录音数据，自动语音识别状态为第二状态，所述第二状态表示所述移动终端开启自动语音识别功能，所述移动终端对第i录音数据进
行自动语音识别，得到所述第i录音数据对应的文本；所述移动终端根据所述第i录音数据对应的文本，确定所述第i录音数据不是无效语音指令且满足等待下一个录音数据的条件；所述移动终端响应于所述第i录音数据不是无效语音指令且满足等待下一个录音数据的条件，对第i+1录音数据执行所述进行自动语音识别的步骤，直至得到所述第m录音数据对应的文本；其中，i取1至m
‑
1，所述等待下一个录音数据的条件包括：与第一录音数据或第一至第i录音数据匹配的预先设置的正则表达式未匹配完全，或者，所述第一录音数据或第一至第i录音数据的识别结果信息未包括执行语音指令所需的所有槽位字段的词槽信息，所述识别结果信息是神经网络模型对所述第一录音数据或第一至第i录音数据处理得到的。10.根据权利要求8或9所述的方法，其特征在于，所述方法还包括：在所述移动终端对所述第一录音数据进行自动语音识别之前，所述自动语音识别状态为第一状态，所述移动终端响应于语音活性检测满足人声开始的条件，控制自动语音识别状态由所述第一状态切换至所述第二状态；所述移动终端判断所述语音活性检测是否满足人声结束的条件，响应于所述语音活性检测不满足人声结束的条件，执行所述移动终端对所述n个录音数据中的前m个录音数据进行自动语音识别的步骤；响应于所述语音活性检测满足人声结束的条件，控制自动语音识别状态由所述第二状态切换至所述第一状态。11.根据权利要求10所述的方法，其特征在于，所述方法还包括：在所述移动终端对所述第一录音数据进行自动语音识别之前，所述自动语音识别状态为第一状态，所述移动终端响应于语音活性检测不满足人声开始的条件，控制自动语音识别状态保持所述第一状态。12.根据权利要求1至11任一项所述的方法，其特征在于，所述方法还包括：所述移动终端响应于所述语音指令不是无效语音指令，且所述m个录音数据满足执行语音指令的条件，控制所述n个录音数据中的剩余n
‑
m个录音数据不进行自动语音识别，所述移动终端响应所述语音指令；其中，所述执行语音指令的条件包括：与所述m个录音数据匹配的预先设置的正则表达式匹配完全，或者，所述m个录音数据的识别结果信息包括执行语音指令所需的至少一个槽位字段的词槽信息，所述识别结果信息是神经网络模型对所述m个录音数据对应的文本处理得到的。13.一种移动终端，其特征在于，包括：处理器、存储器和显示屏，所述存储器、所述显示屏与所述处理器耦合，所述存储器用于存储计算机程序代码，所述计算机程序代码包括计算机指令，当所述处理器从所述存储器中读取所述计算机指令，以使得所述移动终端执行如下操作：与车载终端建立通信连接，所述车载终端具有录音功能；接收所述车载终端发送的n个录音数据，所述n个...

【专利技术属性】
技术研发人员：郁东健，张腾，燕瑞，江继勇，杨仁志，
申请(专利权)人：华为技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人