热门媒资语音识别方法、装置、设备及介质制造方法及图纸

技术编号:37764080 阅读:30 留言:0更新日期:2023-06-06 13:22
本公开涉及一种热门媒资语音识别方法、装置、设备及介质,该方法包括:在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表;获取待识别语音;基于所述热门词表和基础语言模型识别所述待识别语音,得到识别结果。本公开通过在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表中,然后在获取到待识别语音进行语音识别时,利用热门词表来帮助基础语言模型识别待识别语音中可能包含的热门媒体资源,从而提升语音识别中热门媒体资源的识别准确度,可以减少更新语言模型所消耗的时间和资源。耗的时间和资源。耗的时间和资源。

【技术实现步骤摘要】
热门媒资语音识别方法、装置、设备及介质


[0001]本公开涉及语音识别
,具体涉及一种热门媒资语音识别方法、装置、设备及介质。

技术介绍

[0002]在音乐、有声读物等场景中常常有热门榜单,这些榜单上的歌曲/有声读物近期被频繁点映。在智能音箱、智能电视等产品中,用户发出播放热门歌曲/有声读物指令的情况非常常见。在这类场景中,如果asr(Automatic Speech Recognition,自动语音识别)系统长时间不更新的话无法响应用户对实时热门歌曲/有声读物的需求,进而导致用户对产品的不满。因此热门歌曲/有声读物的识别有着现实和使用的需求价值,解决这个问题的常见的解决方法是频繁的将热门歌曲/有声读物的语料加入到之前的语言模型训练语料中进行语言模型的迭代训练。
[0003]但是因为热门榜单更新的频率很快,所以按照上述方法语言模型也需要频繁的进行更新测试,而语言模型要和词典、声学模型融合生成解码图才能参与音频的解码,这些过程耗费的时间很多。而且由于热门榜单更新频率比较快的原因,每次更新语言模型时能收集到的文本语料不多,这些文本相对本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种热门媒资语音识别方法,其特征在于,包括:在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表;获取待识别语音;基于所述热门词表和基础语言模型识别所述待识别语音,得到识别结果。2.如权利要求1所述的方法,其特征在于,所述在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表,包括:在预设周期内,使用爬虫程序持续抓取位于热门榜单上的媒体资源的文本语料录入所述热门词表中。3.如权利要求1所述的方法,其特征在于,所述基于所述热门词表和基础语言模型识别所述待识别语音,得到识别结果,包括:使用所述热门词表对所述基础语言模型进行热词解码增强,以增加所述基础语言模型识别所述热门词表包含的文本语料的概率;利用所述基础语言模型解码所述待识别语音,并将所述待识别语音的解码结果最大概率对应的单词序列作为所述识别结果。4.如权利要求1所述的方法,其特征在于,所述方法还包括:响应于所述预设周期结束,将所述热门词表包含的多个文本语料录入训练文本,并清空所述热门词表;利用所述训练文本对所述基础语言模型进行迭代训练,得到新训练的语言模型;将所述基础语言模型替换为所述新训练的语言模型。5.如权利要求4所述的方法,其特征在于,所述将所述热门词表包含的多个文本语料录入训练文本,包括:根据每个热门媒体资源的被点映次数,将所述热门词表包含的多个文本语料录入训练文本,以使被点映次数更多的热门媒体资源对...

【专利技术属性】
技术研发人员:王宁李良斌
申请(专利权)人:北京声智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1