当前位置: 首页 > 专利查询>史红军专利>正文

虚拟听觉系统技术方案

技术编号:33353434 阅读:17 留言:0更新日期:2022-05-08 10:04
本发明专利技术属于计算机听觉技术领域,具体涉及虚拟听觉系统。所述系统包括:声波获取部,配置用于获取待识别的乱序的语音数据的声波;三角波生成部,配置用于对声波进行解析,生成声波对应的三角波;分隔部,配置用于对生成的三角波进行分割,以得到多个子三角波,每个子三角波表征语音数据的一个发音;时序确定部,配置用于基于子三角波的特征,为子三角波确定一个时序;所述子三角波的特征包括:子三角波的长度、相位和幅度。本发明专利技术通过将声波转换为三角波,再对三角波进行分解,以实现单个语音的识别,完成了针对乱序的或者无序的语音数据的识别,具有识别准确率高的优点。具有识别准确率高的优点。具有识别准确率高的优点。

【技术实现步骤摘要】
虚拟听觉系统


[0001]本专利技术属于计算机听觉
,具体涉及虚拟听觉系统。

技术介绍

[0002]人们越来越多地与计算设备交互并且依靠这些设备来获得信息、推荐和其他服务以帮助他们进行日常任务。但是在这些交互中计算设备理解用户所说的语句和意图仍然是个困难的技术问题。在这种交互中,用户常常因其计算机化的个人助理应用或服务无法理解他们、他们的意图或预期他们的需求而感到沮丧。
[0003]语音识别包括用于将所讲的词转换成文本的处理。通常,语音识别系统将口头发声映射成一系列计算机可读语音,并且对那些语音与和词相关的已知语音模式进行比较。例如,麦克风可以接受下述模拟信号,所述模拟信号被转换成此后被划分成更小段的数字形式。可对数字段与所讲语言的元素进行比较。根据该比较以及对发出那些语音的环境的分析,系统能够识别语音。
[0004]典型的语音识别系统可以包括识别模型、语言模型、以及字典。简言之,识别模型包括可组合以生成词语、短语等等的集合的各个语音的数字表示。语言模型分配一系列词语将一起在特定句子或短语中出现的概率。字典将语音序列转换成语言模型可理解的词语。

技术实现思路

[0005]有鉴于此,本专利技术的主要目的在于提供虚拟听觉系统,本专利技术通过将声波转换为三角波,再对三角波进行分解,以实现单个语音的识别,完成了针对乱序的或者无序的语音数据的识别,具有识别准确率高的优点。
[0006]为达到上述目的,本专利技术的技术方案是这样实现的:虚拟听觉系统,所述系统包括:声波获取部,配置用于获取待识别的乱序的语音数据的声波;三角波生成部,配置用于对声波进行解析,生成声波对应的三角波;分隔部,配置用于对生成的三角波进行分割,以得到多个子三角波,每个子三角波表征语音数据的一个发音;时序确定部,配置用于基于子三角波的特征,为子三角波确定一个时序;所述子三角波的特征包括:子三角波的长度、相位和幅度;发音识别部,配置用于基于子三角波进行发音识别,以确定子三角波对应的发音;时序冲突解决部,配置用于当多个子三角波的时序相同时,基于每个子三角波的发音,将相同时序的子三角波分别重新分配不同的时序;识别语音生成部,基于每个子三角波的发音和时序,将所有的发音进行连接,生成识别语音。
[0007]进一步的,所述系统还包括:语音调整部,配置用于对识别语音进行特征提取,以判断特征提取结果是否匹配预设的历史特征模板,若不匹配,则将相邻的设定数量的发音进行乱序重置,按照乱序重置后的时序,将发音进行连接,重新进行特征提取和将特征提取结果与历史特征模板进行匹配,循环执行上述步骤,直到特征提取结果与历史特征模板相匹配。
[0008]进一步的,所述声波获取部在获取待识别的乱序的语音数据的声波时,将按照获取声波的先后顺序,按照设定的间隔,将声波划分为多个声波段,并为每个声波段标注序号。
[0009]进一步的,所述三角波生成部对声波进行解析,生成声波对应的三角波的方法包括:首先生成声波的包络波形,生成的包络波形中与声波高点对应的点进行标注,同时在两个高点间,确定两个声波低点,也在包络波形中进行标注;所述声波高点为声波中某个幅度高于左右相邻的N个点的点;所述声波低点为声波中某个幅度低于左右相邻的N个点的点;将包络波形中的标注与声波高点对应的点与包络波形中标注与声波低点对应的点中距离最远的点进行连接,最后,去除包络波形中其他部分,得到三角波。
[0010]进一步的,所述分隔部对生成的三角波进行分割,以得到多个子三角波的方法包括:三角波中的每三个点组成的三角形视为一个待分离子三角波,将所有待分离子三角波与相邻的待分离子三角波的重叠部分进行分配后,从三角波中分离出来,得到子三角波。
[0011]进一步的,所述将所有待分离子三角波与相邻的待分离子三角波的重叠部分进行分配的方法执行以下步骤:计算每个待分离子三角波的面积,比对待分离子三角波的面积与相邻的待分离子三角波的面积进行比较,两者相较后,面积大的待分离子三角波获得重叠部分,面积小的待分离子三角波失去重叠部分。
[0012]进一步的,所述基于子三角波的特征,为子三角波确定一个时序的方法执行以下步骤:基于每个子三角波的特征,使用时序值计算公式计算子三角波的时序值,按照时序值的大小,为每个子三角波分配时序;所述时序值计算公式使用如下公式进行表示:;其中,为子三角波的长度,定义为子三角波的底边的长度;为子三角波的幅度,为子三角波的幅度。
[0013]进一步的,所述发音识别部基于子三角波进行发音识别,以确定子三角波对应的发音的方法执行以下步骤:获取一组用于训练的子三角波以及与其匹配的发音的波形,建立子三角波与发音的关联模型,得到发音字典;再根据发音字典确定三角波对应的发音。
[0014]进一步的,所述发音字典的建立过程包括:获取一组用于训练的子三角波以及与其匹配的发音的波形;提取子三角波中的FiIterBank特征和发音的波形中的离散余弦变换的FiIterBank特征;将所述发音的波形中的离散余弦变换的FiIterBank特征作为训练后的高斯混合模型的输入数据,获取所述训练后的高斯混合模型输出的第一似然概率矩阵;将所子三角波中的FilterBank特征作为训练后的二维循环神经网络模型的输入特征,分别进行时间维度和层次维度的计算,获取输出的包含有时间维度和层次维度信息的后验概率矩阵;根据所述后验概率矩阵和所述第一似然概率矩阵采用训练后的隐马尔可夫模型计算得到目标似然概率矩阵;所述目标似然概率矩阵表征每个发音的波形与子三角波的对应关系,完成发音字典的建立。
[0015]进一步的,所述对识别语音进行特征提取,以判断特征提取结果是否匹配预设的历史特征模板的方法包括:获取一组用于训练的语音,采用基于时域的特征提取对用于训练的语音进行特征提取,得到历史特征模板;所述历史特征模板表征语音的自然规律;对识别语音进行基于时域的特征提取,得到特征提取结果,再判断特征提取结果是否匹配预设的历史特征模板。
[0016]本专利技术的海量信息搜索系统,具有如下有益效果:
1.准确率较高:本专利技术针对乱序的语音提出了识别的方法,在进行识别时,通过建立语音字典的方式,提升了准确率。
[0017]2.效率高:本专利技术通过三角波的生成来提升效率,相较于包络波,其复杂度更小,算法效率更高。
附图说明
[0018]图1为本专利技术实施例提供的虚拟听觉系统的系统结构示意图;图2为本专利技术实施例提供的虚拟听觉系统的生成三角波的原理示意图;图3为本专利技术实施例提供的虚拟听觉系统的进行重新排序的原理示意图。
具体实施方式
[0019]下面结合附图及本专利技术的实施例对本专利技术的方法作进一步详细的说明。
[0020]实施例1如图1所示,虚拟听觉系统,所述系统包括:声波获取部,配置用于获取待识别的乱序的语音数据的声波;三角波生成部,配置用于对声波进行解析,生成声波对应的三角波;分隔部,配置用于对生成的三角波进行分割,以得到多个子三角波,每个子三角波表征语音数据的一个发音;时序确定部,配置本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.虚拟听觉系统,其特征在于,所述系统包括:声波获取部,配置用于获取待识别的乱序的语音数据的声波;三角波生成部,配置用于对声波进行解析,生成声波对应的三角波;分隔部,配置用于对生成的三角波进行分割,以得到多个子三角波,每个子三角波表征语音数据的一个发音;时序确定部,配置用于基于子三角波的特征,为子三角波确定一个时序;所述子三角波的特征包括:子三角波的长度、相位和幅度;发音识别部,配置用于基于子三角波进行发音识别,以确定子三角波对应的发音;时序冲突解决部,配置用于当多个子三角波的时序相同时,基于每个子三角波的发音,将相同时序的子三角波分别重新分配不同的时序;识别语音生成部,基于每个子三角波的发音和时序,将所有的发音进行连接,生成识别语音。2.如权利要求1所述的系统,其特征在于,所述系统还包括:语音调整部,配置用于对识别语音进行特征提取,以判断特征提取结果是否匹配预设的历史特征模板,若不匹配,则将相邻的设定数量的发音进行乱序重置,按照乱序重置后的时序,将发音进行连接,重新进行特征提取和将特征提取结果与历史特征模板进行匹配,循环执行上述步骤,直到特征提取结果与历史特征模板相匹配。3.如权利要求2所述的系统,其特征在于,所述声波获取部在获取待识别的乱序的语音数据的声波时,将按照获取声波的先后顺序,按照设定的间隔,将声波划分为多个声波段,并为每个声波段标注序号。4.如权利要求3所述的系统,其特征在于,所述三角波生成部对声波进行解析,生成声波对应的三角波的方法包括:首先生成声波的包络波形,生成的包络波形中与声波高点对应的点进行标注,同时在两个高点间,确定两个声波低点,也在包络波形中进行标注;所述声波高点为声波中某个幅度高于左右相邻的N个点的点;所述声波低点为声波中某个幅度低于左右相邻的N个点的点;将包络波形中的标注与声波高点对应的点与包络波形中标注与声波低点对应的点中距离最远的点进行连接,最后,去除包络波形中其他部分,得到三角波。5.如权利要求4所述的系统,其特征在于,所述分隔部对生成的三角波进行分割,以得到多个子三角波的方法包括:三角波中的每三个点组成的三角形视为一个待分离子三角波,将所有待分离子三角波与相邻的待分离子三角波的重叠部分进行分配后,从三角波中分离出来,得到子三角波。6.如权利要求5所述的系统,其特征在于,所...

【专利技术属性】
技术研发人员:史红军
申请(专利权)人:史红军
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1