基于小词汇量语音识别技术的方言语音拨号通讯设备制造技术

技术编号:28678364 阅读:8 留言:0更新日期:2021-06-02 02:55
本发明专利技术公开了一种基于小词汇量语音识别技术的方言语音拨号通讯设备,包括语音录入模块、语音特征提取模块、特征储存数据库、特征匹配模块和操作执行模块,语音录入模块的输出端连接语音特征提取模块的输入端,语音特征提取模块的输出端连接特征储存数据库的输入端,语音特征提取模块和储存数据库分别连接特征匹配模块连接,特征匹配模块的输出端连接操作执行模块的输入端。本发明专利技术采用一人一数据库的方式,对可能使用到的高频操作进行语音录制,建立相关操作对应的语音特征数据库,在使用语音操作手机时将语音内容的语音特征与数据库内录制的语音特征直接比较,提高了语音操作识别的准确性,降低了使用手机的难度。

【技术实现步骤摘要】
基于小词汇量语音识别技术的方言语音拨号通讯设备
本专利技术涉及语音识别
,特别是一种基于小词汇量语音识别技术的方言语音拨号通讯设备。
技术介绍
随着移动互联网技术的爆炸式发展,移动支付、外卖订餐、在线购物等已经成为人们不可或缺的生活方式,智能手机也成为了人们现阶段生活的必需品。但是在一部分欠发达的地区还存在大量低文化层次或者拥有视力障碍的老人无法正常使用手机,发达的移动互联网不仅无法给这部分老人提供便利,反而给他们带来了生活的不便。传统的语音识别技术就是将语音识别为文字,再通过文字进行语义分析来获取用户发出的指令。但是对于上面所提到的用户群体,此类语言识别技术存在着一下几个问题:1)现有的语音识别技术只能对普通话或使用人数较多的方言进行识别,对于小众方言则无法识别;2)语言识别功能过于多样,无法减轻此类用户的学习成本;3)准确率不够高,容易识别为错误的语义。而且由于此类用户的普通话水平、文化层次、学习能力有限,本身已经很难学会手机的复杂操作,传统的语音识别技术不仅不会给用户带来方便,还增加了老人使用手机的难度。
技术实现思路
本专利技术需要解决的技术问题是提供一种基于小词汇量语音识别技术的方言语音拨号通讯设备,提高语音操作识别的准确性,降低使用难度。为解决上述技术问题,本专利技术所采取的技术方案如下。基于小词汇量语音识别技术的方言语音拨号通讯设备,包括在手机上录入与本操作方法相关数据的语音录入模块、用于将语音数据转换为语音特征的语音特征提取模块、用于储存语音特征及对应操作的特征储存数据库、用于将本次识别的语音特征与特征储存数据库中的特征进行依次比较的特征匹配模块和用于控制手机执行语音操作的操作执行模块,语音录入模块的输出端连接语音特征提取模块的输入端,语音特征提取模块的输出端连接特征储存数据库的输入端,语音特征提取模块和储存数据库分别连接特征匹配模块连接,特征匹配模块的输出端连接操作执行模块的输入端。上述基于小词汇量语音识别技术的方言语音拨号通讯设备,所述语音录入模块是将有限个操作的语音数据逐个由手机使用者本人朗读并分别录入手机,并为录入的语音数据分配一唯一的ID。上述基于小词汇量语音识别技术的方言语音拨号通讯设备,所述语音特征提取模块采用MFCC特征提取技术进行提取。上述基于小词汇量语音识别技术的方言语音拨号通讯设备,所述MFCC特征提取步骤包括预处理、快速傅里叶变换、Mei滤波器组、对数运算、离散余弦变换以及动态特征提取。上述基于小词汇量语音识别技术的方言语音拨号通讯设备,所述特征储存数据库储存的是提取的特征与其对应的操作语音ID和操作ID。上述基于小词汇量语音识别技术的方言语音拨号通讯设备,所述特征储存数据库将语音特征存储在手机本地或者上传至服务器。上述基于小词汇量语音识别技术的方言语音拨号通讯设备,所述操作执行模块是特征匹配模块中匹配度最高的特征的相似度在可接受的阈值内,则执行对应操作;如果低于可接受的阈值,则提醒用户重新录入操作,或者选取本次对应的正确操作以更新特征数据库。由于采用了以上技术方案,本专利技术所取得技术进步如下。本专利技术采用一人一数据库的方式,对可能使用到的高频操作进行语音录制,建立相关操作对应的语音特征数据库,在使用语音操作手机时将语音内容的语音特征与数据库内录制的语音特征直接比较,提高了语音操作识别的准确性,降低了使用手机的难度。附图说明图1为本专利技术中建立操作语音特征库的流程框图;图2为本专利技术中提取操作语音的流程框图;图3为本专利技术中目标操作匹配的流程框图。具体实施方式下面将结合附图和具体实施例对本专利技术进行进一步详细说明。基于小词汇量语音识别技术的方言语音拨号通讯设备,包括语音录入模块、语音特征提取模块、特征储存数据库、特征匹配模块和操作执行模块。语音录入模块用来在收集上录入与本操作方法相关的数据,语音特征提取模块用来将语音数据转换为语音特征,特征储存模块用来储存语音特征及对应操作,特征匹配模块用来将本次识别的语音特征与特征储存数据库中的特征进行依次比较,操作执行模块用来执行语音操作。语音录入模块的输出端连接语音特征提取模块的输入端,语音特征提取模块的输出端连接特征储存数据库的输入端,语音特征提取模块和储存数据库分别连接特征匹配模块连接,特征匹配模块的输出端连接操作执行模块的输入端。语音录入模块是录入语音数据,通过语音特征提取模块对录入的语音数据进行预处理,转换为语音特征,在通过特征储存数据库将录入的语音特征进行储存,建立操作语音特征库。其流程框图如图1所示,具体的操作方法是将可能需要用到的有限个操作的语音数据逐个有手机使用者本人朗读并分别录入手机,并为此段语音数据分配唯一ID,以便于引用。将语音数据最初和最后一段空白数据进行删除,保留有效数据,并对操作语音数据进行降噪处理,以便于后续识别。这里的语音格式通常为WMA系列标准格式,关于WMA标准请参考IEC61939标准WMA说明系列规范文档。录入的语音数据进行预处理后,一个原始语音片段被处理为有效片段,并保存在计算机系统待处理区域中,从而大大缩小了需要数据处理的信息量。语音特征提取模块用来将语音数据转换为语音特征,采用MFCC(梅尔倒谱系数)特征提取技术进行提取,其流程框图如图2所示,包括预处理、快速傅里叶变换、Mei滤波器组、对数运算、离散余弦变换、动态特征提取等步骤。提取后的MFCC特征通过特征储存数据库进行储存,存储的位置取决于收集算力的情况,若手机的算力足够,能够在不影响体验的时间内进行提取特征、特征比对等操作,则存储在本地以节省服务器资源;若手机本地算力不够,则上传至服务器,在服务器中计算。特征提取完后,特征与其对对应的操作语音ID、操作ID构成整个数据库的内容。除了存入数据库外,还需要在ROM上单独开辟一个区域,用来存储样本语音,每个样本语音使用其ID命名,这个ID与数据库里的样本特征语音ID对应。特征匹配模块是以匹配用户使用手机时录入语音的特征相似度为基础,对目标语音进行匹配,其流程框图如图3所示,首先进行对比特征,将本次别的语音特征与语音数据库中的特征进行对比,计算出特征相似度,对相似度进行排序,选取相似度最高的语音特征,其对应的操作ID即用户本次操作对应的操作ID。然后通过操作执行模块来反馈结果,如果匹配度最高的特征的相似度在可接受阈值内,则执行对应操作。如果低于可接受的阈值,则提醒用户重新录入操作,或者选取本次对应的正确操作以更新特征数据库。本专利技术采用小词汇量语音识别技术操作手机的方法,包括以步骤:1)在手机销售人员或者其他熟悉手机操作的用户的帮助下录入与本操作方法相关的数据,这里的“数据”包括:各高频操作对应操作的语音数据、联系人的语音数据与对应联系人的手机号码。语音数据均在销售人员指导下由用户亲自朗读。由用户本人对联系人姓名、高频操作发音进行录制,避免了识别文字、自然语言理解等步骤使语音识本文档来自技高网...

【技术保护点】
1.基于小词汇量语音识别技术的方言语音拨号通讯设备,其特征在于:包括在手机上录入与本操作方法相关数据的语音录入模块、用于将语音数据转换为语音特征的语音特征提取模块、用于储存语音特征及对应操作的特征储存数据库、用于将本次识别的语音特征与特征储存数据库中的特征进行依次比较的特征匹配模块和用于控制手机执行语音操作的操作执行模块,语音录入模块的输出端连接语音特征提取模块的输入端,语音特征提取模块的输出端连接特征储存数据库的输入端,语音特征提取模块和储存数据库分别连接特征匹配模块连接,特征匹配模块的输出端连接操作执行模块的输入端。/n

【技术特征摘要】
1.基于小词汇量语音识别技术的方言语音拨号通讯设备,其特征在于:包括在手机上录入与本操作方法相关数据的语音录入模块、用于将语音数据转换为语音特征的语音特征提取模块、用于储存语音特征及对应操作的特征储存数据库、用于将本次识别的语音特征与特征储存数据库中的特征进行依次比较的特征匹配模块和用于控制手机执行语音操作的操作执行模块,语音录入模块的输出端连接语音特征提取模块的输入端,语音特征提取模块的输出端连接特征储存数据库的输入端,语音特征提取模块和储存数据库分别连接特征匹配模块连接,特征匹配模块的输出端连接操作执行模块的输入端。


2.根据权利要求1所述的基于小词汇量语音识别技术的方言语音拨号通讯设备,其特征在于:所述语音录入模块是将有限个操作的语音数据逐个由手机使用者本人朗读并分别录入手机,并为录入的语音数据分配一唯一的ID。


3.根据权利要求1所述的基于小词汇量语音识别技术的方言语音拨号通讯设备,其特征在于:所述语音特征提取模块采...

【专利技术属性】
技术研发人员:茅伟龙朱永明
申请(专利权)人:无锡市科易达电控有限公司
类型:发明
国别省市:江苏;32

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1