一种语音识别中的标点添加方法和装置制造方法及图纸

技术编号:8834254 阅读:190 留言:0更新日期:2013-06-22 20:28
本发明专利技术实施例公开了一种语音识别中的标点添加方法和装置,以解决进行语音识别得到的识别结果缺少实效性的问题。所述方法包括:对通过语音识别得到的语句中的当前字词进行特征提取;将提取到的当前字词的特征在预先建立的最大熵模型中进行识别,得到当前字词之后的标识字符;根据获取到的标识字符与各标点的关联关系,在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点,添加到当前字词之后。本发明专利技术实施例根据当前字词与其前后几个字词之间的逻辑关系等,按照预先建立的最大熵模型,预测当前字词后应该添加的标点(标点可以为空)。添加标点后的语音识别结果提高了语音识别结果的实效性。

【技术实现步骤摘要】

本专利技术实施例涉及语音识别
,特别是涉及一种语音识别中的标点添加方法和装置
技术介绍
在进行语音识别时,只能将接收到的语音内容识别、转化为汉字或英文等文字。当接收到的语音内容为一连串的文字语音时,识别转化的结果只是一连串的汉字或英文等文字。由于标点符号属于不发音信息,一般的语音识别结果只是汉字或英文等文字信息,没有标点信息。标点信息需要用户手动添加到语音识别结果当中。然而在进行连续语音识别时,对于自动添加标点符号的研究并不多,大多是当语音识别时,中间有停顿的地方识别为逗号,结束时自动添加句号,整个句子都被视为陈述语气,缺少实效性。
技术实现思路
本专利技术实施例公开一种语音识别中的标点添加方法和装置,以解决进行语音识别得到的识别结果缺少实 效性的问题。为了解决上述问题,本专利技术实施例公开了一种语音识别中的标点添加方法,包括: 对通过语音识别得到的语句中的当前字词进行特征提取;将提取到的当前字词的特征在预先建立的最大熵模型中进行识别,得到当前字词之后的标识字符;根据获取到的标识字符与各标点的关联关系,在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点,添加到当前字词之后。优选的,所述对通过语音识别得到的语句中的当前字词进行特征提取,包括:根据语音识别得到的语句中各字词的顺序依次判定每个字词为当前字词,并确定当前字词的前η个字词和后m个字词,做为当前字词的特征,n、m为正整数;其中,所述当前字词的前η个字词和后m个字词包括空字词。优选的,所述将提取到的当前字词的特征在预先建立的最大熵模型中进行识别,得到当前字词之后的标识字符,包括:在

【技术保护点】
一种语音识别中的标点添加方法,其特征在于,包括:对通过语音识别得到的语句中的当前字词进行特征提取;将提取到的当前字词的特征在预先建立的最大熵模型中进行识别,得到当前字词之后的标识字符;根据获取到的标识字符与各标点的关联关系,在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点,添加到当前字词之后。

【技术特征摘要】
1.一种语音识别中的标点添加方法,其特征在于,包括: 对通过语音识别得到的语句中的当前字词进行特征提取; 将提取到的当前字词的特征在预先建立的最大熵模型中进行识别,得到当前字词之后的标识字符; 根据获取到的标识字符与各标点的关联关系,在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点,添加到当前字词之后。2.根据权利要求1所述的方法,其特征在于,所述对通过语音识别得到的语句中的当前字词进行特征提取,包括: 根据语音识别得到的语句中各字词的顺序依次判定每个字词为当前字词,并确定当前字词的前η个字词和后m个字词,做为当前字词的特征,n、m为正整数; 其中,所述当前字词的前η个字词和后m个字词包括空字词。3.根据权利要求1所述的方法,其特征在于,所述将提取到的当前字词的特征在预先建立的最大熵模型中进行识别,得到当前字词之后的标识字符,包括: 在1 x) = z^)exp(^Xifiy-' ^7 根据x 输出 y; 其中,P(y|x)为预先建立的最大熵模型,X为当前字词的特征, 为当前字词之后的标识字符,Z (X)为归一化系数,fi (X, y)为特征函数,λ j为特征函数A (X, y)的权重,i为正整数。4.根据权利要求1所述的 方法,其特征在于,所述根据获取到的标识字符与各标点的关联关系,在已知的标识字符集合中选择与当前字词之后的标识字符对应的标点,添加到当前字词之后,包括: 如果当前字词之后的标识字符y=Yn,在已知的标识字符集合Y中选择与Yn具有关联关系的标点,添加到当前字词之后; 其中,所述已知的标识字符集合Y={Y1,Y2,Y3,……,Υη,0} ;Υ1、Υ2、Υ3……Υη、0为...

【专利技术属性】
技术研发人员:李健吴飞郑晓明张连毅武卫东
申请(专利权)人:北京捷通华声语音技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1