语音中的数字识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:20007013 阅读:40 留言:0更新日期:2019-01-05 18:38
本发明专利技术公开了一种语音中的数字识别方法、装置、计算机设备及存储介质,所述方法包括:首先获取待训练文本,将所述待训练文本中的阿拉伯数字进行中文数字转换处理,并根据所述待训练文本训练数字识别模型;再获取待识别语音,通过所述数字识别模型将所述待识别语音中包含的所有数字语音识别为中文数字;而在输出语音识别文本之前,将所述中文数字转换为阿拉伯数字后输出。本发明专利技术提高了对语音中的阿拉伯数字的识别率和准确率,进而提高了输出语音识别文本的精准度。

Digital Recognition Method, Device, Computer Equipment and Storage Media in Speech

The invention discloses a digital recognition method, device, computer equipment and storage medium in speech. The method includes: firstly, acquiring the text to be trained, converting the Arabic numerals in the text to be trained into Chinese numerals, and training the numeral recognition model according to the text to be trained; secondly, acquiring the speech to be recognized, and using the numeral recognition model to convert the Arabic numerals into Chinese numerals. It states that all the digits contained in the speech to be recognized are Chinese digits, and the Chinese digits are converted to Arabic digits before the speech recognition text is output. The invention improves the recognition rate and accuracy rate of Arabic numerals in speech, thereby improving the accuracy of output speech recognition text.

【技术实现步骤摘要】
语音中的数字识别方法、装置、计算机设备及存储介质
本专利技术涉及语音识别领域,具体涉及一种语音中的数字识别方法、装置、计算机设备及存储介质。
技术介绍
近年来,语音识别被普遍应用到人们的日常生活中,比如,语音拨号,语音搜索,微信或QQ语音转换以及人机语音交互等,语音识别技术具有巨大的市场价值和广泛的发展方向。而在识别语音的过程中,在对包含的阿拉伯数字“0”到“9”语音进行识别时,往往会出现误插入或者误删除的现象,其次,在对具体的语境中出现的数字进行识别时,会出现数字混淆的现象。因此,当前缺少一种可以将待识别语音包含的数字语音精确识别的方法。
技术实现思路
本专利技术实施例提供一种语音中的数字识别方法、装置、计算机设备及存储介质,用于提高语音识别中对阿拉伯数字的识别率和准确率。第一方面,本专利技术案例提供一种语音中的数字识别方法,包括:获取待训练文本,并根据预设的转换规则将所述待训练文本中的阿拉伯数字转换为中文数字;对包含所述中文数字的所述待训练文本进行分词,并根据分词后的所述待训练文本生成语言模型;获取声学模型,并根据所述声学模型与所述语言模型生成数字识别模型;获取待识别语音,并通过所述本文档来自技高网...

【技术保护点】
1.一种语音中的数字识别方法,其特征在于,包括:获取待训练文本,并根据预设的转换规则将所述待训练文本中的阿拉伯数字转换为中文数字;对包含所述中文数字的所述待训练文本进行分词,并根据分词后的所述待训练文本生成语言模型;获取声学模型,并根据所述声学模型与所述语言模型生成数字识别模型;获取待识别语音,并通过所述数字识别模型将所述待识别语音中包含的所有数字语音识别为中文数字;根据预设的逆向转换规则,将所述中文数字转换为阿拉伯数字,输出包含所述阿拉伯数字的语音识别文本。

【技术特征摘要】
1.一种语音中的数字识别方法,其特征在于,包括:获取待训练文本,并根据预设的转换规则将所述待训练文本中的阿拉伯数字转换为中文数字;对包含所述中文数字的所述待训练文本进行分词,并根据分词后的所述待训练文本生成语言模型;获取声学模型,并根据所述声学模型与所述语言模型生成数字识别模型;获取待识别语音,并通过所述数字识别模型将所述待识别语音中包含的所有数字语音识别为中文数字;根据预设的逆向转换规则,将所述中文数字转换为阿拉伯数字,输出包含所述阿拉伯数字的语音识别文本。2.如权利要求1所述的语音中的数字识别方法,所述获取待训练文本,并根据预设的转换规则将所述待训练文本中的阿拉伯数字转换为中文数字,其特征在于,包括:获取所述待训练文本,并提取所述待训练文本中的阿拉伯数字;检测所述阿拉伯数字中是否包含千分位符号,在所述阿拉伯数字中包含千分位符号时,将包含所述千分位符号的所述阿拉伯数字转换为包含计数单位的中文数字;检测所述阿拉伯数字中是否包含小数点,在所述阿拉伯数字中包含小数点时,将提取的所述阿拉伯数字转换为包含小数点符号的中文数字;检测所述阿拉伯数字中是否包含预设的日期符号,在所述阿拉伯数字中包含日期符号时,将提取的所述阿拉伯数字转换为中文日期数字;检测所述阿拉伯数字中是否包含预设的金额符号,在所述阿拉伯数字中包含金额符号时,将提取的所述阿拉伯数字转成中文金额数字;检测所述阿拉伯数字是否超过预设长度,在所述阿拉伯数字超过预设长度时,将所述阿拉伯数字的每一个数字转换为对应的中文数字;在所述阿拉伯数字未超过预设长度时,将所述阿拉伯数字转换为包含计数单位的中文数字。3.如权利要求1所述语音中的数字识别的方法,所述对包含所述中文数字的所述待训练文本进行分词,并根据分词后的所述待训练文本生成语言模型,其特征在于,包括:将包含所述中文数字的所述待训练文本拆分为多个小文本,并将所有小文本保存到预设的文本路径下;对所述文本路径下的所有小文本进行词频统计,并将统计的词频统计结果存放在预设的计数目录下;合并所述计数目录下的所有计数文本,并通过语言训练工具将合并后的所述计数文本进行训练后生成语言模型。4.如权利要求1所述的语音中的数字识别方法,所述获取声学模型,并根据所述声学模型与所述语言模型生成数字识别模型之前,其特征在于,包括:根据训练语音对应的注释文本和所述训练语音训练所述声学模型,生成用于获取语音中的特征向量序列的所述声学模型。5.如权利要求1所述的语音中的数字识别方法,所述根据预设的逆向转换规则,将所述中文数字转换为阿拉伯数字,输出包含所述阿...

【专利技术属性】
技术研发人员:彭捷
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1