当前位置: 首页 > 专利查询>南京大学专利>正文

一种在线增量的语音获得和识别方法技术

技术编号:11204308 阅读:77 留言:0更新日期:2015-03-26 12:23
一种在线增量的语音获得与识别方法,包括初始化阶段、针对语音数据的输入与竞争阶段、基准点更新阶段、作用范围的阈值更新阶段以及去噪阶段。可有效避免现有技术中的所述的模型的训练需要耗费大量的时间、无法实现在线增量、这种方式不符合人的认知习惯由此导致使用很不方便的缺陷。

【技术实现步骤摘要】

本专利技术属于语音获得与识别
,具体涉及一种在线增量的语音获得与识别方法。
技术介绍
传统的语音识别算法多从统计的角度出发,通过训练大量的数据,从而得出概率相关的模型。若有新的输入语音数据,得出概率相关的模型必须重新进行训练,所述的模型的训练需要耗费大量的时间,而且这种方式不符合人的认知习惯,由此导致使用很不方便。
技术实现思路
本专利技术的目的提供一种在线增量的语音获得与识别方法,包括初始化阶段、针对语音数据的输入与竞争阶段、基准点更新阶段、作用范围的阈值更新阶段以及去噪阶段。可有效避免现有技术中的所述的模型的训练需要耗费大量的时间、这种方式不符合人的认知习惯由此导致使用很不方便的缺陷。为了克服现有技术中的不足,本专利技术提供了一种在线增量的语音获得与识别方法的解决方案,具体如下:一种在线增量的语音获得与识别方法,步骤如下:步骤1:首先,用于处理语音数据的终端接收到外部输入的语音数据;步骤2:用于处理语音数据的终端接收到外部输入的语音数据后,就进入初始化阶段,所述的初始化阶段具体如下:1)构建基准点集合A={L1,L2

【技术保护点】
一种在线增量的语音获得与识别方法,其特征在于,步骤如下:步骤1:首先,用于处理语音数据的终端接收到外部输入的语音数据;步骤2:用于处理语音数据的终端接收到外部输入的语音数据后,就进入初始化阶段,所述的初始化阶段具体如下:1)构建基准点集合A={L1,L2},其中第一基准点L1,第二基准点L2是从外部输入的语音数据中选取的两个随机数据;2)构建边集合其初始值为空集,即第一基准点L1,第二基准点L2之间没有初始连接;3)构建第一基准点L1的激活数构建第二基准点L2的激活数ML2=0;]]>4)构建第一基准点L1的作用范围的阈值构建第二基准点L2的作用范围的阈值所述的dis tan ce(.,.)为相似性距离算法函数;步骤3:进入针对语音数据的输入与竞争阶段,所述的针对语音数据的输入与竞争阶段的具体方法如下:1)从外部对用于处理语音数据的终端输入一个新的语音数据样本ξ∈RD,其中RD表示D维实数向量,D表示自然数;2)找出A中与ξ最相似的两个基准点,所述的最相似的两个基准点分别为胜者基准点s1和亚军基准点s2,所述的胜者基准点s1和亚军基准点s2分别由如下所示公式所求得:s1=arg minx∈Adis tan ce(ξ,x)]]>s2=argminx∈A-{s1}distance(ξ,x);]]>步骤4:接着进入基准点更新阶段,所述的基准点更新阶段具体如下:1)如果或者成立,就为基准点集合A生成一个新的基准点ξ,令A=A∪{ξ},其中表示针对胜者基准点s1的作用范围的阈值,表示针对亚军基准点s2的作用范围的阈值,然后跳转至步骤3中继续执行;2)如果胜者基准点s1和亚军基准点s2间不存在连接,令C=C∪{(s1,s2)}即为胜者基准点s1和亚军基准点s2建立连接,然后令即刷新边(s1,s2)的连接年龄;3)如果(s1,Li)∈C,则即与胜者基准点s1相连的所有边连接年龄增加1,其中Li表示基准点集合A中与胜者基准点s1有边相连的所有节点;4)即把胜者基准点s1的激活数增加1;5)将胜者基准点s1和输入的新的语音数据样本ξ变形到相等的长度,即其中s1'为调整后的新的胜者基准点,而ξ'为调整后的新的语音数据样本,所述的为变形转化函数;6)更新胜者基准点其中即执行胜者基准点s1向输入的新的语音数据样本ξ移动操作;7)检查所有连接(Li,Lj)∈C当前的连接年龄如果就从边集合C中移除该连接,其中agemax是预先定义的连接年龄的阈值参数;步骤5:然后进入作用范围的阈值更新阶段,所述的作用范围的阈值更新阶段包括将胜者基准点s1的作用范围的阈值和亚军基准点s2的作用范围的阈值分别如下式所示来更新为与胜者基准点s1和亚军基准点s2的相邻基准点的最大距离,其中x分别表示基准点集合A中与胜者基准点s1有边相连的所有节点和基准点集合A中与亚军基准点s2有边相连的所有节点:TS1=arg max(x,s1)∈Cdis tan ce(x,s1)]]>TS2=argmax(x,s2)∈Cdistance(x,s2);]]>步骤6:最后进入去噪阶段,所述的去噪阶段包括如果当前输入的语音数据的样本总数是λ的整数倍,λ即为一个学习周期,检查整个基准点集合A,如果存在只有一个相邻基准点的基准点,并且该基准点的激活数小于设定的激活数的阈值,就在基准点集合A中删去该基准点,然后跳转至步骤3中执行,等到训练用的语音数据样本全部输入完毕后,就能得到所需的语音数据的基准点集合A以及基准点之间的连接C。...

【技术特征摘要】
1.一种在线增量的语音获得与识别方法,其特征在于,步骤如
下:
步骤1:首先,用于处理语音数据的终端接收到外部输入的语音
数据;

【专利技术属性】
技术研发人员:申富饶许浩然赵金熙
申请(专利权)人:南京大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1