一种快速实现语音交互功能的系统技术方案

技术编号:26169897 阅读:36 留言:0更新日期:2020-10-31 13:35
本申请涉及一种快速实现语音交互功能的系统,其中,该一种快速实现语音交互功能的系统通过I2S标准麦克风阵列采集用户的第一模拟语音数据;语音转换单元将第一模拟语音数据转换为第一数字语音数据,以及将第二数字语音数据转换为第二模拟语音数据;语音处理单元对第一数字语音数据进行全链路语音处理,以生成与第一数字语音数据相对应的第二数字语音数据,其中,语音处理单元独立运行于安卓设备的操作系统;I2S标准播放器播放第二模拟语音数据。通过本申请,解决了现有技术中语音交互功能开发难度高、周期长、不具有可移植性以及复杂度高的问题,实现了快速开发语音交互功能的技术效果。

A system for fast realization of voice interaction

【技术实现步骤摘要】
一种快速实现语音交互功能的系统
本申请涉及语音交互领域,特别是涉及一种快速实现语音交互功能的系统。
技术介绍
随着人工智能技术的普及,语音识别技术也发展的越来越快,且被应用于各种安卓设备上,用以提升安卓设备的操控便捷性和人机交互体验。现有的安卓设备的语音交互功能的开发流程一般为如下步骤:硬件选型,根据语音交互功能对算力、RAM(RandomAccessMemory,随机存取存储器)、ROM(Read-OnlyMemory,只读存储器)等资源的需求,选择相应CPU(CentralProcessingUnit,中央处理器)、DDRSDRAM(DoubleDataRateSynchronousDynamicRandomAccessMemory,双倍速率同步动态随机存储器)、麦克风和喇叭等硬件;识别引擎移植,根据安卓设备部署的操作系统,在对语音识别引擎的算法进行交叉编译和调试的情况下,将语音识别引擎移植到安卓设备上;录音和放音开发测试,对已经选择好的硬件进行开发调试,如在对麦克风阵列录音质量测试的情况下,需要对麦克风进行本文档来自技高网...

【技术保护点】
1.一种快速实现语音交互功能的系统,应用于安卓设备,其特征在于,包括:/nI2S标准麦克风阵列,用于采集用户的第一模拟语音数据;/n语音转换单元,用于将所述第一模拟语音数据转换为第一数字语音数据,以及将第二数字语音数据转换为第二模拟语音数据;/n语音处理单元,用于对所述第一数字语音数据进行全链路语音处理,以生成与所述第一数字语音数据相对应的所述第二数字语音数据,其中,所述语音处理单元独立运行于所述安卓设备的操作系统,所述全链路语音处理包括语音识别、语义理解、对话管理、自然语言生成以及文本转语音;/nI2S标准播放器,用于播放所述第二模拟语音数据。/n

【技术特征摘要】
1.一种快速实现语音交互功能的系统,应用于安卓设备,其特征在于,包括:
I2S标准麦克风阵列,用于采集用户的第一模拟语音数据;
语音转换单元,用于将所述第一模拟语音数据转换为第一数字语音数据,以及将第二数字语音数据转换为第二模拟语音数据;
语音处理单元,用于对所述第一数字语音数据进行全链路语音处理,以生成与所述第一数字语音数据相对应的所述第二数字语音数据,其中,所述语音处理单元独立运行于所述安卓设备的操作系统,所述全链路语音处理包括语音识别、语义理解、对话管理、自然语言生成以及文本转语音;
I2S标准播放器,用于播放所述第二模拟语音数据。


2.根据权利要求1所述的系统,其特征在于,还包括:
I2S标准接口,用于接收所述I2S标准麦克风阵列发送的所述第一模拟语音数据、并将所述第一模拟语音数据发送到所述语音转换单元,以及接收所述语音转换单元发送的所述第二模拟语音数据、并将所述第二模拟语音数据发送到所述I2S标准播放器。


3.根据权利要求1所述的系统,其特征在于,所述语音处理单元包括:
语音识别模块,用于识别所述第一数字语音数据以获取用户意图,并将所述用户意图发送到所述安卓设备的应用层,其中,所述语音识别模块具有可移植性,能够使所述语音处理单元运行在若干种处理器架构上。
...

【专利技术属性】
技术研发人员:刘重凯李旭滨
申请(专利权)人:上海茂声智能科技有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1