一种在移动设备中实现本地语音识别的方法技术

技术编号:13010179 阅读:273 留言:0更新日期:2016-03-10 23:39
本发明专利技术公开了一种在移动手持设备中实现本地语音智能识别的方法,利用3D非易失性存储器在本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库。所述3D非易失性存储器技术的特点并非是通过芯片的堆叠或3D封装来实现,而是存储单元采用的是3D工艺,因而可达到高存储密度。本发明专利技术通过在3D非易失性存储器中本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库,避免了移动手持设备通过网络与云端数据中心传输数据的步骤,从而大大提高了语音识别的响应速度,更确保了使用的安全性。为了进一步降低功耗,可以让基带处理器响应用户语音命令,而让漏电厉害的应用处理器和内存处于休眠状态,从而更加降低功耗。

【技术实现步骤摘要】

本专利技术涉及语音识别领域,尤其涉及。
技术介绍
随着对人工类神经网络(ANN)研究的不断深入,现代科技技术在人工智能领域中取得了很大进展。比如,模式识别、智能机器人、自动控制以及语音识别技术等领域,都表现出了良好的智能特性。其中,语音识别技术将替代按键输入,成为移动手持设备的下一个发展方向。由于语音识别技术需要能存储超大容量数据的语音数据库,而且人工类神经网络学习也需要大容量存储器的支持,且对数据处理能力要求也非常高,因此智能语音识别技术的实现一般是在云端数据中心中实现的。当前移动手持设备(例如手机、平板电脑)存储能力和数据处理能力都是相当有限的,因此很难实现智能语音识别。云端数据中心的语音数据库是针对广泛的大众人群,并不能特定于某个人的口音、语调、用语习惯和语速等来制定个人语音数据库,因此云端设备中心的语音数据库的准确性对不同个人来说是不相同的。移动手持设备对语音处理的基本流程,如图1所示。移动手持设备接收到用户的语音数据,会通过网络将接收到的语音数据发送给云端数据中心,由云端数据中心对语音数据经过处理后,把解析后的命令操作再通过网络发送回移动手持设备,移动手持设备根据该命令操作做出响应。由此可以看出,实时的网络传输速度是影响移动手持设备能否快速响应的潜在因素。常见的移动手持设备对语音识别和处理通常是由移动手持设备内部应用处理器(Applicat1n processor)在内存中执行和处理。因此应用处理器和内存必须始终保持开启状态才能够及时响应语音命令,显然功耗会大大增加,为了保证较长的续航能力,移动手持设备需要高容量的电池作为支撑,这无疑将增加移动手持设备的成本。因此,本领域的技术人员致力于开发一种在移动手持设备中实现本地语音智能识别的方法,提高了语音识别的准确性,加快了语音响应速度,降低了功耗。
技术实现思路
有鉴于现有技术的上述缺陷,本专利技术所要解决的技术问题是如何在移动设备的本地实现语音识别,提高识别的准确度和加快响应速度。为实现上述目的,本专利技术提供了,基于3D非易失性存储器,在所述移动设备本地存储中建立语音数据库和人工类神经网络学习数据库。进一步地,所述语音数据库是针对每个设备用户的口音、语调、用语习惯和语速进行学习从而分析和存储的。进一步地,所述移动设备是手机或平板电脑。进一步地,基带处理器模块被配置为进行用户语音智能识别,包括响应用户语音命令。进一步地,基带处理器模块与3D非易失性存储器集成在一起,且所述基带处理器模块被制作在3D非易失性存储器硅衬底上。进一步地,所述移动设备被配置为点亮或不点亮屏幕都能进行本地语音智能识别。进一步地,所述3D非易失性存储器是指存储单元阵列采用3D工艺。进一步地,所述3D非易失性存储器的硅衬底为体硅或绝缘体上硅。本专利技术提出一种在移动手持设备中实现本地语音智能识别的方法,利用3D非易失性存储器在本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库。所述移动手持设备可以是手机、平板电脑等。本专利技术所述3D非易失性存储器技术的特点并非是通过芯片的堆叠或3D封装来实现,而是存储单元采用的是3D工艺,因而可以达到超高的存储密度。如图2所示的是本专利技术3D非易失性存储器的结构示意图。其中,1为3D非易失性存储器的存储阵列,用以在本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库;2为硅衬底,可以使体硅或者绝缘体上硅,用以实现3D非易失性存储器的夕卜围逻辑电路(比如,译码电路、读写电路、控制电路、输出输入电路等)。此外,本专利技术这种超高存储密度的3D非易失性存储器(NVM)还可以替代传统的移动手持设备中的存储芯片(一般为NAND闪存芯片)。本专利技术通过在3D非易失性存储器中本地存储针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库,避免了移动手持设备通过网络与云端数据中心传输数据的步骤,从而大大提高了语音识别的响应速度,更确保了使用的安全性。由于这些数据是针对特定使用者的,可以针对每个不同用户的口音、语调、用语习惯和语速等进行学习从而分析和存储,因此可以更加精准的对用户个人进行语音识别。为了进一步降低功耗,可以让基带处理器响应用户语音命令,而让漏电厉害的应用处理器和内存处于休眠状态,从而更加降低功耗。为了进一步降低功耗和提高响应速度,本专利技术还可以将3D非易失性存储器与基带处理器集成在一起,如图3所示。其中,(1)为本专利技术3D非易失性存储器和基带处理器实现的三维立体图,(2)为截面图。其中,硅片之上是3D非易失性存储器的存储阵列;衬底硅上除了实现3D非易失性存储器的外围逻辑电路(比如,译码电路、读写电路、控制电路、输出输入电路等)之外,还将实现基带处理器逻辑电路。本专利技术在一颗芯片上同时集成了 3D非易失性存储器和基带处理器,大大提高了硅片利用率,并且降低了制造成本;同时,能够进一步提高了语音识别的响应速度,也能够进一步节省功耗。由上可见,本专利技术这种在移动手持设备中实现本地语音智能识别的方法,将针对每个设备使用者的语音数据库信息和人工类神经网络学习数据库存储至本地的大容量的3D非易失性存储器中,提高了语音识别的准确性,加快了语音响应速度,降低了功耗。进一步的,在一颗芯片上同时集成了 3D非易失性存储器和基带处理器,能够大大提高了硅片利用率,并且降低了制造成本。以下将结合附图对本专利技术的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本专利技术的目的、特征和效果。【附图说明】图1是现有技术中移动设备依靠云端实现语音识别的功能示意图;图2是本专利技术的一个较佳实施例的3D非易失性存储器的结构示意图;图3是本专利技术的一个较佳实施例的3D非易失性存储器和基带处理器实现的三维立体图和截面图;图4是本专利技术的一个较佳实施例的移动设备响应用户的语音操作示意图。【具体实施方式】下面举一具体实例下作进一步阐述:目前传统的手机只支持按键操作,如果用户正在开车,用户突然想查看一个邮件,他就必须拿起手机通过按键点亮屏幕,然后找到邮箱所在位置,然后通过按键打开想要查看的邮件,而在开车过程中做这样的事情是很危险的。如果采用本专利技术这种能在移动手持设备中实现本地语音智能识别的方法,就可以简单的多。用户可以不用拿起手机,只需要对手机进行语音操作就可以了。如图4所示,手机响应用户的语音操作,由基带处理器在本地的3D非易失性存储器内部的语音数据库和人工类神经网络学习数据库查找并分析和匹配,手机屏幕都可以不用亮起,然后快速的响应相应的语音操作,将用户想查找的邮件信息通过语音形式反馈给用户。可见,本专利技术这种在本地实现语音识别的方法,无需按键操作,更快,更安全,更省功耗。本专利技术这种智能语音操作除了用于查看邮件,还可以用来打电话,查看或回复短信,语音密码输入,播放音乐,阅读文章等等,广泛的适用于人们生活之中。以上详细描述了本专利技术的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本专利技术的构思作出诸多修改和变化。因此,凡本
中技术人员依本专利技术的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。【主权项】1.,其特征在于,基于3D非易失性存储器,在所述移动设备本地存储中建立语音数据库和人工本文档来自技高网
...

【技术保护点】
一种在移动设备中实现本地语音识别的方法,其特征在于,基于3D非易失性存储器,在所述移动设备本地存储中建立语音数据库和人工类神经网络学习数据库。

【技术特征摘要】

【专利技术属性】
技术研发人员:景蔚亮陈邦明
申请(专利权)人:上海新储集成电路有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1