【技术实现步骤摘要】
一种快速实现语音交互功能的系统
本申请涉及语音交互领域,特别是涉及一种快速实现语音交互功能的系统。
技术介绍
随着人工智能技术的普及,语音识别技术也发展的越来越快,且被应用于各种安卓设备上,用以提升安卓设备的操控便捷性和人机交互体验。现有的安卓设备的语音交互功能的开发流程一般为如下步骤:硬件选型,根据语音交互功能对算力、RAM(RandomAccessMemory,随机存取存储器)、ROM(Read-OnlyMemory,只读存储器)等资源的需求,选择相应CPU(CentralProcessingUnit,中央处理器)、DDRSDRAM(DoubleDataRateSynchronousDynamicRandomAccessMemory,双倍速率同步动态随机存储器)、麦克风和喇叭等硬件;识别引擎移植,根据安卓设备部署的操作系统,在对语音识别引擎的算法进行交叉编译和调试的情况下,将语音识别引擎移植到安卓设备上;录音和放音开发测试,对已经选择好的硬件进行开发调试,如在对麦克风阵列录音质量测试的情况 ...
【技术保护点】
1.一种快速实现语音交互功能的系统,应用于安卓设备,其特征在于,包括:/nI2S标准麦克风阵列,用于采集用户的第一模拟语音数据;/n语音转换单元,用于将所述第一模拟语音数据转换为第一数字语音数据,以及将第二数字语音数据转换为第二模拟语音数据;/n语音处理单元,用于对所述第一数字语音数据进行全链路语音处理,以生成与所述第一数字语音数据相对应的所述第二数字语音数据,其中,所述语音处理单元独立运行于所述安卓设备的操作系统,所述全链路语音处理包括语音识别、语义理解、对话管理、自然语言生成以及文本转语音;/nI2S标准播放器,用于播放所述第二模拟语音数据。/n
【技术特征摘要】
1.一种快速实现语音交互功能的系统,应用于安卓设备,其特征在于,包括:
I2S标准麦克风阵列,用于采集用户的第一模拟语音数据;
语音转换单元,用于将所述第一模拟语音数据转换为第一数字语音数据,以及将第二数字语音数据转换为第二模拟语音数据;
语音处理单元,用于对所述第一数字语音数据进行全链路语音处理,以生成与所述第一数字语音数据相对应的所述第二数字语音数据,其中,所述语音处理单元独立运行于所述安卓设备的操作系统,所述全链路语音处理包括语音识别、语义理解、对话管理、自然语言生成以及文本转语音;
I2S标准播放器,用于播放所述第二模拟语音数据。
2.根据权利要求1所述的系统,其特征在于,还包括:
I2S标准接口,用于接收所述I2S标准麦克风阵列发送的所述第一模拟语音数据、并将所述第一模拟语音数据发送到所述语音转换单元,以及接收所述语音转换单元发送的所述第二模拟语音数据、并将所述第二模拟语音数据发送到所述I2S标准播放器。
3.根据权利要求1所述的系统,其特征在于,所述语音处理单元包括:
语音识别模块,用于识别所述第一数字语音数据以获取用户意图,并将所述用户意图发送到所述安卓设备的应用层,其中,所述语音识别模块具有可移植性,能够使所述语音处理单元运行在若干种处理器架构上。
...
【专利技术属性】
技术研发人员:刘重凯,李旭滨,
申请(专利权)人:上海茂声智能科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。