一种语音识别方法和装置制造方法及图纸

技术编号：12512935 阅读：82 留言：0更新日期：2015-12-16 10:40

本发明专利技术公开了一种语音识别方法和装置。所述方法包括：对输入语音进行声学特征提取，并根据所述提取的声学特征分别计算多个不同类型的声学模型中各声学建模单元的似然值；将所述多个不同类型的声学模型中各声学建模单元的似然值进行融合处理；根据融合处理结果获取所述输入语音的识别结果。所述装置包括：似然值计算模块，用于对输入语音进行声学特征提取，并根据所述提取的声学特征分别计算多个不同类型的声学模型中各声学建模单元的似然值；融合处理模块，用于将所述多个不同类型的声学模型中各声学建模单元的似然值进行融合处理；识别模块，用于根据融合处理结果获取所述输入语音的识别结果，增强了语音识别的鲁棒性，提高了识别准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种语音识别方法和装置
本专利技术实施例涉及语音识别
，尤其涉及一种语音识别方法和装置。
技术介绍
语音识别技术已逐渐普及到我们熟知的各个领域中，语音识别服务支持的场景也伴随着用户需求的增加而逐步增多，比如普通话语音识别、英文语音识别、粤语语音识别和四川话语音识别等。基于统计的声学模型在选定的实际产品方向中的建模能力非常强，比如普通话语音识别方向、英文语音识别方向和各个方言语音识别方向等。每个产品方向的声学模型可以通过累积语音数据，来进一步提高声学模型的建模能力。但是，实际的语音识别服务场景可能无法有效区分用户的语音内容，从而无法有效的把用户的语音识别请求定位到对应的声学模型上进行语音识别，比如对于普通话的语音识别服务，可能会有说粤语的用户对其进行语音识别请求，或者还可能会有带粤语口音的用户对其进行语音识别请求等。这时普通话的语音识别服务可能无法有效区分上述用户的语音内容，导致语音识别准确率的急剧下降或者识别结果完全不对，给用户的语音识别服务体验带来挫败感。现有技术中的语音识别服务在处理用户的语音识别请求时，一般都使用单个声学模型，且通常会有如下三种处理方式：1、专注于特定产品方向的语音识别请求，通过识别结果引导或者在客户端提示用户使用产品方向的语音来获得更好的用户体验。该方式专注于特定产品方向的语音识别请求，一旦用户的语音识别请求和声学模型不匹配，那么用户体验无法保证。例如普通话的语音识别服务只能提供用户的普通话语音识别请求，而无法满足四川话语音识别请求。2、部分或者全面覆盖用户可能使用的产品方向的语音，该方法通过增加声学模型训练在多个产品方向的语...
一种语音识别方法和装置

【技术保护点】
一种语音识别方法，其特征在于，包括：对输入语音进行声学特征提取，并根据所述提取的声学特征分别计算多个不同类型的声学模型中各声学建模单元的似然值；将所述多个不同类型的声学模型中各声学建模单元的似然值进行融合处理；根据融合处理结果获取所述输入语音的识别结果。

【技术特征摘要】
1.一种语音识别方法，其特征在于，包括：对输入语音进行声学特征提取，并根据所述提取的声学特征分别计算多个不同类型的声学模型中各声学建模单元的似然值；根据多个不同类型的声学模型中各声学建模单元的似然值排序结果，以及多个不同类型的声学模型的似然值融合权重系数排序结果，对所述多个不同类型的声学模型中各声学建模单元的似然值进行加权求和；根据融合处理结果获取所述输入语音的识别结果。2.根据权利要求1所述的方法，其特征在于，所述多个不同类型的声学模型包括：朗读语音声学模型和自然语音声学模型。3.根据权利要求1或2所述的方法，其特征在于，所述多个不同类型的声学模型包括：多个声学模型的语种类型不同和/或方言类型不同。4.根据权利要求1所述的方法，其特征在于，当第i个声学模型的第k个声学建模单元的似然值大于其他声学模型的第k个声学建模单元的似然值的连续帧数T大于预设帧数X时，在根据多个不同类型的声学模型的似然值融合权重系数，对所述多个不同类型的声学模型中各声学建模单元的似然值进行加权求和之前，还包括：对所述多个不同类型的声学模型的似然值融合权重系数进行后向掩蔽处理；其中,i和k为正整数，X为大于或者等于2的正整数，T为大于X的正整数；根据多个不同类型的声学模型的似然值融合权重系数，对所述多个不同类型的声学模型中各声学建模单元的似然值进行加权求和，包括：根据后向掩蔽处理结果对所述多个不同类型的声学模型中各声学建模单元的似然值进行加权求和。5.根据权利要求4所述的方法，其特征在于，所述对所述多个不同类型的声学模型的似然值融合权重系数进行后向掩蔽处理，包括：当第i个声学模型的第k个声学建模单元的似然值大于其他声学模型的第k个声学建模单元的似然值的连续帧数T大于预设帧数X时，在连续T帧后的Y帧内增加所述第i个声学模型的似然值融合权重...

【专利技术属性】
技术研发人员：贺利强，钱胜，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人