一种数据处理方法、装置和用于数据处理的装置制造方法及图纸

技术编号:24760226 阅读:27 留言:0更新日期:2020-07-04 10:06
本发明专利技术实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括:根据多语言声学模型,确定语音信息中语音帧的语言类型;其中,所述多语言声学模型为根据至少两种语言类型的声学数据训练得到;根据所述语音帧的语言类型对应的解码网络,对所述语音帧进行解码,以得到所述语音帧的第一解码结果;根据所述第一解码结果,确定所述语音信息对应的识别结果。本发明专利技术实施例可以提高语音识别的准确率。

A data processing method, device and device for data processing

【技术实现步骤摘要】
一种数据处理方法、装置和用于数据处理的装置
本专利技术涉及计算机
,尤其涉及一种数据处理方法、装置和用于数据处理的装置。
技术介绍
语音识别技术,也被称为ASR(AutomaticSpeechRecognition,自动语音识别),其目标是将语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。在日常的语言表达中,可能会出现多种语言混合表达的情况。以中文和英文混合表达为例,用户在使用中文进行表达的过程中,可以穿插使用英文词句。例如,“我买了最新款的iPhone”、“来一首Yesterdayoncemore”。然而,目前的语音识别技术,对于单一语言的语音识别较为准确,而在语音中包含多种语言的情况下,识别的准确率明显下降。
技术实现思路
本专利技术实施例提供一种数据处理方法、装置和用于数据处理的装置,可以提高在语音中包含多种语言的情况下,语音识别的准确率。为了解决上述问题,本专利技术实施例公开了一种数据处理方法,所述方法包括:根据多语言声学模型,确定语音信息中语音帧的语言本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n根据多语言声学模型,确定语音信息中语音帧的语言类型;其中,所述多语言声学模型为根据至少两种语言类型的声学数据训练得到;/n根据所述语音帧的语言类型对应的解码网络,对所述语音帧进行解码,以得到所述语音帧的第一解码结果;/n根据所述第一解码结果,确定所述语音信息对应的识别结果。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
根据多语言声学模型,确定语音信息中语音帧的语言类型;其中,所述多语言声学模型为根据至少两种语言类型的声学数据训练得到;
根据所述语音帧的语言类型对应的解码网络,对所述语音帧进行解码,以得到所述语音帧的第一解码结果;
根据所述第一解码结果,确定所述语音信息对应的识别结果。


2.根据权利要求1所述的方法,其特征在于,所述根据多语言声学模型,确定语音信息中语音帧的语言类型,包括:
根据多语言声学模型,确定语音帧对应各状态的后验概率;其中,所述状态与语言类型之间具有对应关系;
根据所述语音帧对应各状态的后验概率、以及各状态对应的语言类型,确定所述语音帧的后验概率对应各语言类型状态的概率比值;
根据所述概率比值,确定所述语音帧的语言类型。


3.根据权利要求1所述的方法,其特征在于,在所述根据多语言声学模型,确定语音信息中语音帧的语言类型之前,所述方法还包括:
从所述至少两种语言类型中确定目标语言类型;
根据所述目标语言类型对应的解码网络,对所述语音信息中的各语音帧进行解码,以得到所述各语音帧的第二解码结果;
在所述根据多语言声学模型,确定语音信息中语音帧的语言类型之后,所述方法还包括:
从所述语音信息的语音帧中,确定目标语音帧,以及确定所述目标语音帧的第二解码结果;其中,所述目标语音帧的语言类型为非目标语言类型;
所述根据所述语音帧的语言类型对应的解码网络,对所述语音帧进行解码,以得到所述语音帧的第一解码结果,包括:
根据所述目标语音帧的语言类型对应的解码网络,对所述目标语音帧进行解码,以得到所述目标语音帧的第一解码结果;
所述根据所述第一解码结果,确定所述语音信息对应的识别结果,包括:
将所述目标语音帧的第二解码结果替换为所述目标语音帧对应语言类型的第一解码结果,以及将替换后的第二解码结果,作为所述语音信息对应的识别结果。


4.根据权利要求3所述的方法,其特征在于,所述第一解码结果、以及所述第二解码结果包括:对应语音帧的时间边界信息;
所述将所述目标语音帧的第二解码结果替换为所述目标语音帧对应语言类型的第一解码结果,包括:
从所述目标语音帧的第二解码结果中,确定被替换结果;其中,所述被替换结果与所述目标语音帧对应语言类型的第一解码结果的时间边界相重合;
将所述被替换结果替换为所述目标语音帧对应语言类型的第一解码结果。


5.根据权利要求1所述的方法,其特征在于,所述解...

【专利技术属性】
技术研发人员:周盼
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1