一种基于人工智能算法的语音识别系统技术方案

技术编号:29050695 阅读:20 留言:0更新日期:2021-06-26 06:14
本发明专利技术提供一种基于人工智能算法的语音识别系统。所述基于人工智能算法的语音识别系统包括用户界面,所述用户界面用于显示内容;语音接收模块,所述语音接收模块用于接收语音信号;语音识别模块,所述语音识别模块用于将所述语音信号进行识别;对比模块,所述对比模块用于检测解码结果的准确率;摄像模块,所述摄像模块用于提供用户的图像信号;意图判断模块,所述意图判断模块针对所述摄像模块所拍摄的图像信号和所识别出的发声,判断所述用户有无操作所述被控制装置的意图。本发明专利技术提供的基于人工智能算法的语音识别系统具有识别准确率高、可对用户操作意识进行判断的优点。可对用户操作意识进行判断的优点。

【技术实现步骤摘要】
一种基于人工智能算法的语音识别系统


[0001]本专利技术涉及语音识别
,尤其涉及一种基于人工智能算法的语音识别系统。

技术介绍

[0002]随着数据处理技术的进步以及移动互联网的快速普及,计算机技术被广泛地运用到了社会的各个领域,随之而来的则是海量数据的产生。其中,语音数据受到了人们越来越多的重视。语音识别是一门交叉学科。近二十年来。语音识别技术取得显著进步,开始从实验室走向市场。人们预计,未来10年内,语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息
十大重要的科拄发展技术之一。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别较语音合成而言,技术上要复杂,但应用却更加广泛。语音识别的最大优势在于使得人机用户界面更加自然和容易使用。
[0003]随着微电子技术和通讯技术地高速发展,手机等嵌入式通讯装置几乎已成为人们工作生活必备的物品,而人们对其功能的要求也越来越高,这使得将语音技术应用于此类装置成为研究的热点,现有的语音功能准确率不高;而且语音识别总会被误触,不能对用户是否需要使用语音识别的意图进行判断。
[0004]因此,有必要提供一种新的基于人工智能算法的语音识别系统解决上述技术问题。

技术实现思路

[0005]本专利技术解决的技术问题是提供一种识别准确率高、可对用户操作意识进行判断的基于人工智能算法的语音识别系统。
[0006]为解决上述技术问题,本专利技术提供的基于人工智能算法的语音识别系统包括:
[0007]用户界面,所述用户界面用于显示内容;
[0008]语音接收模块,所述语音接收模块用于接收语音信号;
[0009]语音识别模块,所述语音识别模块用于将所述语音信号进行识别,所述语音识别模块包括:
[0010]信号转换模块、特征提取模块、编码模块、密码本模块和运算解码模块;
[0011]所述信号转换模块用于将所述语音信号转换为数字信号;
[0012]所述特征提取模块用于对所述数字信号进行分帧处理,提取每一帧所述数字信号的特征参数,得到特征矢量序列;
[0013]编码模块用于将所述特征适量序列转换为特征码字序列;
[0014]密码本模块储存有每个码字对应的密码本中的密码字的概率值;
[0015]解码运算模块用于对该特征码字序列进行解码运算得到识别结果,运算中对该特征码字序列中的各个码字,从密码本模块中直接查找与其具有最大匹配概率的密码字,得到解码结果;
[0016]对比模块,所述对比模块用于检测解码结果的准确率;
[0017]摄像模块,所述摄像模块用于提供用户的图像信号;
[0018]意图判断模块,所述意图判断模块针对所述摄像模块所拍摄的图像信号和所识别出的发声,判断所述用户有无操作所述被控制装置的意图。
[0019]优选的,所述密码本为高斯码本。
[0020]优选的,所述编码模块根据将特征矢量序列转换为特征码字序列的步骤如下:
[0021]S1:将所述特征矢量序列划分为多个子空间,每一个所述子空间对应于一个码本;
[0022]S2:计算各子空间中所有特征矢量与相应码本中的各码字之间的距离度量,将与该特征矢量具有最小距离度量的码字作为所述特征码字序列中对应该特征矢量的码字;
[0023]S3:将所述特征矢量序列各个子空间所有矢量所对应的码字按原矢量顺序组合起来,即得到对应的特征码字序列。
[0024]优选的,所述密码本模块通过以下步骤生成的:
[0025]L1:计算高斯码本中各码字对应的均值和方差矢量;
[0026]L2:利用上述均值和方差矢量,计算所述特征码本中各个码字与高斯码本中:各个码字相匹配的对数概率值;
[0027]L3:将特征码本中的所有码字与高斯码本中的所有码字相匹配的概率值储存起来即可得到密码本模块。
[0028]优选的,所述对比模块中储存多条常用特定句子文本,所述对比模块将语音识别模块识别的结果与特定句子文本进行对比,判断语音识别模块识别的准确率。
[0029]优选的,所述摄像模块重点标识用户的眼睛关注点和嘴唇移动。
[0030]优选的,所述意图判断模块在判断为有操作意图的情况下,对表示该操作的意图达到何种程度的可靠度进行判断。
[0031]优选的,还包括控制状态变更模块,所述控制状态变更模块在所述意图判断部中判断为无操作意图的情况下,与判断为有操作意图的情况相比,将所述被控制装置的控制的状态向不让所述用户意识到的方向进行变更。
[0032]优选的,所述控制状态变更模块在所述意图判断模块中判断出的可靠度较低的情况下,与可靠度较高的情况相比,将被控制装置的控制的状态向不让所述用户意识到的方向进行变更。
[0033]优选的,所述控制状态变更模块在用户所发出的语音的识别失败的情况下,对所述被控制装置进行控制,使所述被控制装置向所述用户通知识别失败,并在关于发声的操作意图的可靠度较低的情况下,与可靠度较高的情况相比,将该通知的状态向不让所述用户意识到的方向进行变更。
[0034]与相关技术相比较,本专利技术提供的基于人工智能算法的语音识别系统具有如下有益效果:
[0035]本专利技术提供一种基于人工智能算法的语音识别系统,在语音特征矢量集聚类得到码本的过程中,增加了根据子集合中矢量数及矢量的总距离度量来动态合并和分裂子集合
的步骤,减小了聚类后集合中矢量与其对应的码字的距离度量总和,提高了聚类算法的精度,保证了语音系统识别性能的同时,大大降低了系统的存储量;而且在判断为用户无操作意图的情况下,与判断为有操作意图的情况相比,使被控制装置的控制的状态向不让用户意识到的方向进行变更,增加了用户使用的舒适度。
具体实施方式
[0036]下面结合实施方式对本专利技术作进一步说明。
[0037]一种基于人工智能算法的语音识别系统包括:
[0038]用户界面,所述用户界面用于显示内容;
[0039]语音接收模块,所述语音接收模块用于接收语音信号;
[0040]语音识别模块,所述语音识别模块用于将所述语音信号进行识别,所述语音识别模块包括:
[0041]信号转换模块、特征提取模块、编码模块、密码本模块和运算解码模块;
[0042]所述信号转换模块用于将所述语音信号转换为数字信号;
[0043]所述特征提取模块用于对所述数字信号进行分帧处理,提取每一帧所述数字信号的特征参数,得到特征矢量序列;
[0044]编码模块用于将所述特征适量序列转换为特征码字序列;
[0045]密码本模块储存有每个码字对应的密码本中的密码字的概率值;
[0046]解码运算模块用于对该特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能算法的语音识别系统,其特征在于,包括:用户界面,所述用户界面用于显示内容;语音接收模块,所述语音接收模块用于接收语音信号;语音识别模块,所述语音识别模块用于将所述语音信号进行识别,所述语音识别模块包括:信号转换模块、特征提取模块、编码模块、密码本模块和运算解码模块;所述信号转换模块用于将所述语音信号转换为数字信号;所述特征提取模块用于对所述数字信号进行分帧处理,提取每一帧所述数字信号的特征参数,得到特征矢量序列;编码模块用于将所述特征适量序列转换为特征码字序列;密码本模块储存有每个码字对应的密码本中的密码字的概率值;解码运算模块用于对该特征码字序列进行解码运算得到识别结果,运算中对该特征码字序列中的各个码字,从密码本模块中直接查找与其具有最大匹配概率的密码字,得到解码结果;对比模块,所述对比模块用于检测解码结果的准确率;摄像模块,所述摄像模块用于提供用户的图像信号;意图判断模块,所述意图判断模块针对所述摄像模块所拍摄的图像信号和所识别出的发声,判断所述用户有无操作所述被控制装置的意图。2.根据权利要求1所述的基于人工智能算法的语音识别系统,其特征在于,所述密码本为高斯码本。3.根据权利要求1所述的基于人工智能算法的语音识别系统,其特征在于,所述编码模块根据将特征矢量序列转换为特征码字序列的步骤如下:S1:将所述特征矢量序列划分为多个子空间,每一个所述子空间对应于一个码本;S2:计算各子空间中所有特征矢量与相应码本中的各码字之间的距离度量,将与该特征矢量具有最小距离度量的码字作为所述特征码字序列中对应该特征矢量的码字;S3:将所述特征矢量序列各个子空间所有矢量所对应的码字按原矢量顺序组合起来,即得到对应的特征码字序列。4.根据权利要求2所述的基于人工智能算法的语音识别系统,其特征在于,所述密码本模块...

【专利技术属性】
技术研发人员:杜金林
申请(专利权)人:上海佑译信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1