语音识别方法及装置制造方法及图纸

技术编号：12401993 阅读：66 留言：0更新日期：2015-11-28 16:48

本发明专利技术公开了一种语音识别方法及装置，其中所述方法包括：根据语音信息识别得到发音信息；根据所述查分树信息加载语言模型查分树，查询所述语言模型查分树确定与所述发音信息匹配的文字识别结果的概率得分；其中，所述查分树信息包括与文字对应的多个节点，每个节点至少包括当前节点与子节点之间的存储位置偏移量；根据所述概率得分选择文字识别结果，作为最终的识别结果。本发明专利技术实施例通过在启动时直接根据当前节点与子节点之间的存储位置偏移量加载语言模型查分树，这样大大的缩短了启动时间。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术实施例涉及语音识别
，尤其涉及一种语音识别方法及装置。
技术介绍
在嵌入式语音识别领域，语音识别结果由声学模型和语言模型两部分决定。而语言模型有着十分重要的作用，例如，当"北戴河"和"被带河"发音相似，声学模型的得分相差无几，这时就需要使用语言模型来进一步决定哪一个词是语言中会用到的。也就是说，语言模型解决了语音识别中对自然语言顺序的评测问题。如图1所示，为现有技术中提供的语音识别方法，主要包括以下步骤： S11、从硬盘上读取语言模型资源，资源以节点的方式存储；其中，每个节点对应一个字，每个节点由节点信息（包括所对应的字或词、孩子信息，例如孩子节点对应的字以及孩子数目），概率列表（ProbList)(存储概率），回退概率列表（BackOff)三部分组成；即如下表一所示：表一 S12、根据读取的语言模型资源构建多叉查分树；构建查分树的过程，具体是：将语言模型资源加载到缓存之后，节点的存储地址发生了变化，因此每个节点只知道自身的孩子节点是哪个字，而不知道其存储地址，因此需要根据每个节点中记录的孩子节点信息，逐一查询其孩子节点的存储地址，并添加至父节点中，从而建立查分树。 S13、加载声学模型和其他语音识别的资源； S14、接收输入的语音信息，使用维特比算法进行解码； S15、在解码的过程中，使用声学模型进行语音识别，得到发音信息，并根据发音信息查询语言模型的多叉查分树进行查分； S16、获得语言模型的识别结果； S17、输出识别结果，释放资源。但是，现有的语音识别方法在读取语言模型资源之后，需要对语言模...
语音识别方法及装置

【技术保护点】
一种语音识别方法，其特征在于，包括：根据语音信息识别得到发音信息；根据所述查分树信息加载语言模型查分树，查询所述语言模型查分树确定与所述发音信息匹配的文字识别结果的概率得分；其中，所述查分树信息包括与文字对应的多个节点，每个节点至少包括当前节点与子节点之间的存储位置偏移量；根据所述概率得分选择文字识别结果，作为最终的识别结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：唐立亮，贾磊，彭守业，
申请(专利权)人：百度在线网络技术北京有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人