一种快速实现语音交互功能的系统技术方案

技术编号：26169897 阅读：36 留言：0更新日期：2020-10-31 13:35

本申请涉及一种快速实现语音交互功能的系统，其中，该一种快速实现语音交互功能的系统通过I2S标准麦克风阵列采集用户的第一模拟语音数据；语音转换单元将第一模拟语音数据转换为第一数字语音数据，以及将第二数字语音数据转换为第二模拟语音数据；语音处理单元对第一数字语音数据进行全链路语音处理，以生成与第一数字语音数据相对应的第二数字语音数据，其中，语音处理单元独立运行于安卓设备的操作系统；I2S标准播放器播放第二模拟语音数据。通过本申请，解决了现有技术中语音交互功能开发难度高、周期长、不具有可移植性以及复杂度高的问题，实现了快速开发语音交互功能的技术效果。

A system for fast realization of voice interaction

全部详细技术资料下载

【技术实现步骤摘要】
一种快速实现语音交互功能的系统
本申请涉及语音交互领域，特别是涉及一种快速实现语音交互功能的系统。
技术介绍
随着人工智能技术的普及，语音识别技术也发展的越来越快，且被应用于各种安卓设备上，用以提升安卓设备的操控便捷性和人机交互体验。现有的安卓设备的语音交互功能的开发流程一般为如下步骤：硬件选型，根据语音交互功能对算力、RAM(RandomAccessMemory，随机存取存储器)、ROM(Read-OnlyMemory，只读存储器)等资源的需求，选择相应CPU(CentralProcessingUnit，中央处理器)、DDRSDRAM(DoubleDataRateSynchronousDynamicRandomAccessMemory，双倍速率同步动态随机存储器)、麦克风和喇叭等硬件；识别引擎移植，根据安卓设备部署的操作系统，在对语音识别引擎的算法进行交叉编译和调试的情况下，将语音识别引擎移植到安卓设备上；录音和放音开发测试，对已经选择好的硬件进行开发调试，如在对麦克风阵列录音质量测试的情况...

【技术保护点】
1.一种快速实现语音交互功能的系统，应用于安卓设备，其特征在于，包括：/nI2S标准麦克风阵列，用于采集用户的第一模拟语音数据；/n语音转换单元，用于将所述第一模拟语音数据转换为第一数字语音数据，以及将第二数字语音数据转换为第二模拟语音数据；/n语音处理单元，用于对所述第一数字语音数据进行全链路语音处理，以生成与所述第一数字语音数据相对应的所述第二数字语音数据，其中，所述语音处理单元独立运行于所述安卓设备的操作系统，所述全链路语音处理包括语音识别、语义理解、对话管理、自然语言生成以及文本转语音；/nI2S标准播放器，用于播放所述第二模拟语音数据。/n

【技术特征摘要】
1.一种快速实现语音交互功能的系统，应用于安卓设备，其特征在于，包括：
I2S标准麦克风阵列，用于采集用户的第一模拟语音数据；
语音转换单元，用于将所述第一模拟语音数据转换为第一数字语音数据，以及将第二数字语音数据转换为第二模拟语音数据；
语音处理单元，用于对所述第一数字语音数据进行全链路语音处理，以生成与所述第一数字语音数据相对应的所述第二数字语音数据，其中，所述语音处理单元独立运行于所述安卓设备的操作系统，所述全链路语音处理包括语音识别、语义理解、对话管理、自然语言生成以及文本转语音；
I2S标准播放器，用于播放所述第二模拟语音数据。

2.根据权利要求1所述的系统，其特征在于，还包括：
I2S标准接口，用于接收所述I2S标准麦克风阵列发送的所述第一模拟语音数据、并将所述第一模拟语音数据发送到所述语音转换单元，以及接收所述语音转换单元发送的所述第二模拟语音数据、并将所述第二模拟语音数据发送到所述I2S标准播放器。

3.根据权利要求1所述的系统，其特征在于，所述语音处理单元包括：
语音识别模块，用于识别所述第一数字语音数据以获取用户意图，并将所述用户意图发送到所述安卓设备的应用层，其中，所述语音识别模块具有可移植性，能够使所述语音处理单元运行在若干种处理器架构上。
...

【专利技术属性】
技术研发人员：刘重凯，李旭滨，
申请(专利权)人：上海茂声智能科技有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人