语音识别方法及装置制造方法及图纸

技术编号:24941904 阅读:32 留言:0更新日期:2020-07-17 21:48
本发明专利技术公开了一种语音识别方法及装置,所述方法包括:接收发言人的语音数据,并获取与所述语音数据相关的文本材料;提取所述文本材料中的关键词;利用解码网络对所述语音数据进行语音识别,并根据所述关键词调整所述解码网络中解码路径的得分,根据各解码路径的得分得到语音识别文本。利用本发明专利技术方案,可以大大提高语音识别结果的准确性。

【技术实现步骤摘要】
语音识别方法及装置
本专利技术涉及语音识别领域,具体涉及一种语音识别方法及装置。
技术介绍
目前,随着人工智能技术的发展,出现了机器同传,机器同传最大的优势是不会因为疲倦而导致译出率下降。机器同传受限于语音识别技术及机器翻译技术,而机器翻译的质量又有赖于语音识别文本的质量,因此,为了提高机器同传的准确率,必须要有一个高质量的语音识别系统。在一些机器同传应用场景,经常会遇到人名、地名、产品名等实体词或者专业名词的识别和翻译问题,而这些实词往往对现场效果起到重要作用。在现有技术中,语音识别模型通常采用通用的声学模型及语言模型,优先识别出常用词及语料中出现概率较大的词。而针对一些特定应用场景,为了提高识别的准确率,往往需要针对该特定应用场景定制模型。定制模型的训练需要预先得到大量该应用场景的相关语料,但对于一些会议等场景,由于事先无法获得与会人员发言的具体内容,使得定制无法进行。
技术实现思路
本专利技术实施例提供一种语音识别方法及装置,以提高语音识别结果的准确性。为此,本专利技术提供如下技术方案:一种语音本文档来自技高网...

【技术保护点】
1.一种语音识别方法,其特征在于,所述方法包括:/n接收发言人的语音数据,并获取与所述语音数据相关的文本材料;/n提取所述文本材料中的关键词;/n利用解码网络对所述语音数据进行语音识别,并根据所述关键词调整所述解码网络中解码路径的得分,根据各解码路径的得分得到语音识别文本。/n

【技术特征摘要】
1.一种语音识别方法,其特征在于,所述方法包括:
接收发言人的语音数据,并获取与所述语音数据相关的文本材料;
提取所述文本材料中的关键词;
利用解码网络对所述语音数据进行语音识别,并根据所述关键词调整所述解码网络中解码路径的得分,根据各解码路径的得分得到语音识别文本。


2.根据权利要求1所述的方法,其特征在于,所述与所述语音数据相关的文本材料包括以下任意一种或多种:与发言现场相关的宣传材料、发言现场展示的演讲材料。


3.根据权利要求1所述的方法,其特征在于,所述获取与所述语音数据相关的文本材料包括:
通过图像设备获取与所述语音数据相关的图片;
通过OCR识别所述图片中的文本,获得与所述语音数据相关的文本材料。


4.根据权利要求1所述的方法,其特征在于,所述关键词包括以下任意一种或多种:实体词、专业名词。


5.根据权利要求1至4任一项所述的方法,其特征在于,所述方法还包括:
展现所述语音识别文本;
接收对所述语音识别文本中的识别错误的修正;
根据所述修正调整所述解码网络中解码路径的得分。


6.一种语音识别装置,其特征在于,所述装置包括:
语音接收模块,用于接收发言人...

【专利技术属性】
技术研发人员:赵超
申请(专利权)人:北京搜狗科技发展有限公司搜狗杭州智能科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1