语音识别方法及装置制造方法及图纸

技术编号：24941904 阅读：32 留言：0更新日期：2020-07-17 21:48

本发明专利技术公开了一种语音识别方法及装置，所述方法包括：接收发言人的语音数据，并获取与所述语音数据相关的文本材料；提取所述文本材料中的关键词；利用解码网络对所述语音数据进行语音识别，并根据所述关键词调整所述解码网络中解码路径的得分，根据各解码路径的得分得到语音识别文本。利用本发明专利技术方案，可以大大提高语音识别结果的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别方法及装置
本专利技术涉及语音识别领域，具体涉及一种语音识别方法及装置。
技术介绍
目前，随着人工智能技术的发展，出现了机器同传，机器同传最大的优势是不会因为疲倦而导致译出率下降。机器同传受限于语音识别技术及机器翻译技术，而机器翻译的质量又有赖于语音识别文本的质量，因此，为了提高机器同传的准确率，必须要有一个高质量的语音识别系统。在一些机器同传应用场景，经常会遇到人名、地名、产品名等实体词或者专业名词的识别和翻译问题，而这些实词往往对现场效果起到重要作用。在现有技术中，语音识别模型通常采用通用的声学模型及语言模型，优先识别出常用词及语料中出现概率较大的词。而针对一些特定应用场景，为了提高识别的准确率，往往需要针对该特定应用场景定制模型。定制模型的训练需要预先得到大量该应用场景的相关语料，但对于一些会议等场景，由于事先无法获得与会人员发言的具体内容，使得定制无法进行。
技术实现思路
本专利技术实施例提供一种语音识别方法及装置，以提高语音识别结果的准确性。为此，本专利技术提供如下技术方...

【技术保护点】
1.一种语音识别方法，其特征在于，所述方法包括：/n接收发言人的语音数据，并获取与所述语音数据相关的文本材料；/n提取所述文本材料中的关键词；/n利用解码网络对所述语音数据进行语音识别，并根据所述关键词调整所述解码网络中解码路径的得分，根据各解码路径的得分得到语音识别文本。/n

【技术特征摘要】
1.一种语音识别方法，其特征在于，所述方法包括：
接收发言人的语音数据，并获取与所述语音数据相关的文本材料；
提取所述文本材料中的关键词；
利用解码网络对所述语音数据进行语音识别，并根据所述关键词调整所述解码网络中解码路径的得分，根据各解码路径的得分得到语音识别文本。

2.根据权利要求1所述的方法，其特征在于，所述与所述语音数据相关的文本材料包括以下任意一种或多种：与发言现场相关的宣传材料、发言现场展示的演讲材料。

3.根据权利要求1所述的方法，其特征在于，所述获取与所述语音数据相关的文本材料包括：
通过图像设备获取与所述语音数据相关的图片；
通过OCR识别所述图片中的文本，获得与所述语音数据相关的文本材料。

4.根据权利要求1所述的方法，其特征在于，所述关键词包括以下任意一种或多种：实体词、专业名词。

5.根据权利要求1至4任一项所述的方法，其特征在于，所述方法还包括：
展现所述语音识别文本；
接收对所述语音识别文本中的识别错误的修正；
根据所述修正调整所述解码网络中解码路径的得分。

6.一种语音识别装置，其特征在于，所述装置包括：
语音接收模块，用于接收发言人...

【专利技术属性】
技术研发人员：赵超，
申请(专利权)人：北京搜狗科技发展有限公司，搜狗杭州智能科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人