语音交互方法、系统、终端及存储介质技术方案

技术编号：20007091 阅读：27 留言：0更新日期：2019-01-05 18:41

本申请提供了一种语音交互方法、系统、终端及存储介质，通过采集用户输入的第N轮语音数据，N为正整数；识别所述第N轮语音数据，生成一个第N关键词；从N个关键词中选取M个关键词；所述N个关键词为N轮语音数据中的关键词，M为小于或等于N的正整数；从内容库中获取与所述M个关键词匹配的至少一个输出结果。当用户对智能语音终端下达指令时，简短的关键词指令下达方式可在瞬间完成，很多程度上降低了用户在使用语音智能设备的不适应感，且每次在指令下达后，智能设备即重新反馈内容给用户，语音交互的效率大大提高。

Voice interaction methods, systems, terminals and storage media

This application provides a voice interaction method, system, terminal and storage medium. N is a positive integer by collecting the input voice data of the user in the Nth round; recognizing the said Nth round voice data, generating a Nth keyword; selecting M keywords from N keywords; the N keywords are keywords in the N round voice data, M is a positive integer smaller than or equal to N from the content library; At least one output result matching the M keywords is obtained. When users give instructions to intelligent voice terminals, short keyword instructions can be delivered in an instant, which reduces the user's inadaptability to use voice intelligent devices to a great extent, and each time after the instructions are issued, the intelligent devices will feed back the content to the users, thus greatly improving the efficiency of voice interaction.

全部详细技术资料下载

【技术实现步骤摘要】
语音交互方法、系统、终端及存储介质
本申请涉及电子
，特别是一种语音交互方法、系统、终端及存储介质。
技术介绍
随着科技的发展，语音交互技术已经成功进入人们的生活。一般而言，用户对智能终端下达语音数据时，需要使用该智能终端能够识别的标准口音语言，并使用完整的语句来描述指令任务，举例来说，当你使用苹果手机想听张三的《茉莉花》时，你通常需要说：“Siri，请播放一首张三的歌曲茉莉花。”。一个完整的语句被智能语音设备识别及理解后，只能输出一个最终结果，若输出内容不满意，则又需重新下达一次完整的语音数据，这使得语音交互的效率大大降低。
技术实现思路
本申请实施例公开了一种语音交互方法、系统、终端及存储介质，用于解决语音交互的效率较低的问题。本申请实施例第一方面提供了一种语音交互方法，其中：采集用户输入的第N轮语音数据，N为正整数；识别所述第N轮语音数据，生成一个第N关键词；从N个关键词中选取M个关键词；所述N个关键词为N轮语音数据中的关键词，M为小于或等于N的正整数；从内容库中获取与所述M个关键词匹配的至少一个输出结果。本申请实施例第二方面提供了一种语音交互系统，包括：...

【技术保护点】
1.一种语音交互方法，其特征在于，包括：采集用户输入的第N轮语音数据，N为正整数；识别所述第N轮语音数据，生成一个第N关键词；从N个关键词中选取M个关键词；所述N个关键词为N轮语音数据中的关键词，M为小于或等于N的正整数；从内容库中获取与所述M个关键词匹配的至少一个输出结果。

【技术特征摘要】
1.一种语音交互方法，其特征在于，包括：采集用户输入的第N轮语音数据，N为正整数；识别所述第N轮语音数据，生成一个第N关键词；从N个关键词中选取M个关键词；所述N个关键词为N轮语音数据中的关键词，M为小于或等于N的正整数；从内容库中获取与所述M个关键词匹配的至少一个输出结果。2.根据权利要求1所述的方法，其特征在于，所述采集用户输入的第N轮语音数据，包括：通过麦克风阵列采集用户输入的第N轮语音数据，所述麦克风阵列包括至少两个具有指向性的声学传感器。3.根据权利要求1所述的方法，其特征在于，所述识别所述第N轮语音数据，生成一个第N关键词之前，还包括：对所述语音数据进行预处理，所述预处理包括降噪处理、回声消除处理和波束合成处理。4.根据权利要求1所述的方法，其特征在于，所述识别所述第N轮语音数据，生成一个第N关键词，包括：通过神经网络模型识别所述语音数据，生成一个第N关键词，所述神经网络模型包括卷积神经网络模型或循环神经网络模型。5.根据权利要求1所述的方法，其特征在于，所述从内容库中获取与M个关键词匹配的至少一个输出结果之后，所述方法还包括：展示所述至少一个输出结果，所述输出结果对应的内容包括音频、视频、文字中的至少一种。6.根据权利要求1～5...

【专利技术属性】
技术研发人员：刘均，吴新龙，
申请(专利权)人：深圳市元征科技股份有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人