【技术实现步骤摘要】
本专利技术涉及一种视听播放装置,更具体地涉及一种能够识别语音指令的视听播放装置和方法。
技术介绍
现行的电子娱乐产品发展趋势是小型化、便利化,因而其操作的按键受产品的体积限制,按键数量越来越少,增加了对产品操作的不便,特别是在MP3播放器中不能任意直接选择相关的曲目,需要顺次翻动,操作多有不便。语音识别技术是一项由来已久的公知技术,按用户范围可分为非特定人识别和特定人识别。非特定人识别采用隐藏马尔可夫模型HMM(HiddenMarkov Model)来建模,基本原理是系统首先对大量的真实世界中的人的语音进行分析,并建立模型。在识别时,系统同样先对输入的语音进行分析,提取特征,然后通过一定的算法并使用已建立的模型,从而识别出用户所说的话。特定人系统仅仅为同一个人服务,使用之前用户必须对词汇表进行语音训练。这种系统通常基于动态时间偏差DTW(Dynamic Time Wrap)技术,能够达到较高识别率,但应用范围较窄。
技术实现思路
本专利技术要解决的技术问题是利用语音指令替代现有的按键指令,提出一种能够识别语音指令的视听播放装置。本专利技术要解决的另一个技术问题是提 ...
【技术保护点】
一种视听播放装置,包括视听数据处理单元、视听数据存储单元、操作输入单元、数模变换器及视听数据输出单元,其特征在于,所述的装置还包括:语音输入单元,将话音指令变换为模拟信号,并传送到模数变换器;模数变换器,该模数变换器连接语音输入单元,转换语音输入单元的模拟信号为数字信号;语音识别处理单元,该语音识别微处理单元连接模数变换器,根据从模数变换器接收到的数字信号与预存储的语音模型数据对比产生操作指令,并传送所述视听数据处理单元;存储器单元,该存储器单元与语音识别处理单元连接,用于存储设定的程序和语音数据。
【技术特征摘要】
1.一种视听播放装置,包括视听数据处理单元、视听数据存储单元、操作输入单元、数模变换器及视听数据输出单元,其特征在于,所述的装置还包括语音输入单元,将话音指令变换为模拟信号,并传送到模数变换器;模数变换器,该模数变换器连接语音输入单元,转换语音输入单元的模拟信号为数字信号;语音识别处理单元,该语音识别微处理单元连接模数变换器,根据从模数变换器接收到的数字信号与预存储的语音模型数据对比产生操作指令,并传送所述视听数据处理单元;存储器单元,该存储器单元与语音识别处理单元连接,用于存储设定的程序和语音数据。2.根据权利要求1所述的装置,其特征在于,所述的存储器单元包括第一只读存储器ROM1,存储控制程序和提示音数据;第二只读存储器ROM2,存储语言模型和声学模型数据;随机存取存储器RAM,在语音识别微处理单元运行时,加载常用的数据和程序。3.根据权利要求1所述的装置,其特征在于,所述的存储器单元包括只读存储器ROM,存储控制程序和提示音数据;闪存存储器FLASH,存储模式库数据;随机存取存储器RAM,在语音识别微处理单元运行时,加载常用的数据和程序。...
【专利技术属性】
技术研发人员:黄光明,向锋,成晓华,
申请(专利权)人:深圳市朗科科技有限公司,
类型:发明
国别省市:94[中国|深圳]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。