本公开涉及一种热门媒资语音识别方法、装置、设备及介质,该方法包括:在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表;获取待识别语音;基于所述热门词表和基础语言模型识别所述待识别语音,得到识别结果。本公开通过在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表中,然后在获取到待识别语音进行语音识别时,利用热门词表来帮助基础语言模型识别待识别语音中可能包含的热门媒体资源,从而提升语音识别中热门媒体资源的识别准确度,可以减少更新语言模型所消耗的时间和资源。耗的时间和资源。耗的时间和资源。
【技术实现步骤摘要】
热门媒资语音识别方法、装置、设备及介质
[0001]本公开涉及语音识别
,具体涉及一种热门媒资语音识别方法、装置、设备及介质。
技术介绍
[0002]在音乐、有声读物等场景中常常有热门榜单,这些榜单上的歌曲/有声读物近期被频繁点映。在智能音箱、智能电视等产品中,用户发出播放热门歌曲/有声读物指令的情况非常常见。在这类场景中,如果asr(Automatic Speech Recognition,自动语音识别)系统长时间不更新的话无法响应用户对实时热门歌曲/有声读物的需求,进而导致用户对产品的不满。因此热门歌曲/有声读物的识别有着现实和使用的需求价值,解决这个问题的常见的解决方法是频繁的将热门歌曲/有声读物的语料加入到之前的语言模型训练语料中进行语言模型的迭代训练。
[0003]但是因为热门榜单更新的频率很快,所以按照上述方法语言模型也需要频繁的进行更新测试,而语言模型要和词典、声学模型融合生成解码图才能参与音频的解码,这些过程耗费的时间很多。而且由于热门榜单更新频率比较快的原因,每次更新语言模型时能收集到的文本语料不多,这些文本相对于之前的语言模型的文本语料来说可能微乎其微,导致新训练的模型可能不起作用。
技术实现思路
[0004]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种热门媒资语音识别方法、装置、设备及介质。
[0005]第一方面,本公开提供了一种热门媒资语音识别方法,包括:
[0006]在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表;
[0007]获取待识别语音;
[0008]基于所述热门词表和基础语言模型识别所述待识别语音,得到识别结果。
[0009]可选的,所述在预设周期内持续收集关于热门媒体资源的文本语5料录入热门词表,包括:
[0010]在预设周期内,使用爬虫程序持续抓取位于热门榜单上的媒体资源的文本语料录入所述热门词表中。
[0011]可选的,所述基于所述热门词表和基础语言模型识别所述待识别
[0012]语音,得到识别结果,包括:
[0013]0使用所述热门词表对所述基础语言模型进行热词解码增强,以增
[0014]加所述基础语言模型识别所述热门词表包含的文本语料的概率;
[0015]利用所述基础语言模型解码所述待识别语音,并将所述待识别语音的解码结果最大概率对应的单词序列作为所述识别结果。
[0016]可选的,所述方法还包括:
[0017]5响应于所述预设周期结束,将所述热门词表包含的多个文本语料
[0018]录入训练文本,并清空所述热门词表;
[0019]利用所述训练文本对所述基础语言模型进行迭代训练,得到新训练的语言模型;
[0020]将所述基础语言模型替换为所述新训练的语言模型。
[0021]0可选的,所述将所述热门词表包含的多个文本语料录入训练文本,
[0022]包括:
[0023]根据每个热门媒体资源的被点映次数,将所述热门词表包含的多个文本语料录入训练文本,以使被点映次数更多的热门媒体资源对应的文本语料,在所述训练文本中录入的条数更多。
[0024]5可选的,所述利用所述训练文本对所述基础语言模型进行迭代训
[0025]练,得到新训练的语言模型,包括:
[0026]根据分词词表对所述训练文本中的文本语料进行分词处理,得到分词结果,所述分词词表中加入了网络上新出现的词组;
[0027]将所述分词结果与基础预训练分词按照预设比例进行融合,得到训练分词集合;
[0028]使用所述训练分词集合对所述基础语言模型进行迭代训练,得到新训练的语言模型。
[0029]可选的,所述将所述基础语言模型替换为所述新训练的语言模型之前,还包括:
[0030]根据预设的剪枝系数对所述新训练的语言模型进行剪枝处理。
[0031]第二方面,本公开提供了一种热门媒资语音识别装置,包括:
[0032]收集模块,用于在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表;
[0033]获取模块,用于获取待识别语音;
[0034]识别模块,用于基于所述热门词表和基础语言模型识别所述待识别语音,得到识别结果。
[0035]可选的,所述收集模块在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表时,具体用于在预设周期内,使用爬虫程序持续抓取位于热门榜单上的媒体资源的文本语料录入所述热门词表中。
[0036]可选的,所述识别模块在基于所述热门词表和基础语言模型识别所述待识别语音,得到识别结果时,具体用于使用所述热门词表对所述基础语言模型进行热词解码增强,以增加所述基础语言模型识别所述热门词表包含的文本语料的概率;利用所述基础语言模型解码所述待识别语音,并将所述待识别语音的解码结果最大概率对应的单词序列作为所述识别结果。
[0037]可选的,所述装置还包括训练模块,用于响应于所述预设周期结束,将所述热门词表包含的多个文本语料录入训练文本,并清空所述热门词表;利用所述训练文本对所述基础语言模型进行迭代训练,得到新训练的语言模型;将所述基础语言模型替换为所述新训练的语言模型。
[0038]可选的,所述训练模块在将所述热门词表包含的多个文本语料录入训练文本时,具体用于根据每个热门媒体资源的被点映次数,将所述热门词表包含的多个文本语料录入训练文本,以使被点映次数更多的热门媒体资源对应的文本语料,在所述训练文本中录入
的条数更多。
[0039]可选的,所述训练模块在利用所述训练文本对所述基础语言模型进行迭代训练,得到新训练的语言模型时,具体用于根据分词词表对所述训练文本中的文本语料进行分词处理,得到分词结果,所述分词词表中加入了网络上新出现的词组;将所述分词结果与基础预训练分词按照预设比例进行融合,得到训练分词集合;使用所述训练分词集合对所述基础语言模型进行迭代训练,得到新训练的语言模型。
[0040]可选的,所述训练模块在将所述基础语言模型替换为所述新训练的语言模型之前,用于根据预设的剪枝系数对所述新训练的语言模型进行剪枝处理。
[0041]第三方面,本公开提供了一种电子设备,包括:
[0042]存储器;
[0043]处理器;以及
[0044]计算机程序;
[0045]其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现如第一方面所述的方法。
[0046]第四方面,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的方法。
[0047]本公开提供的技术方案与现有技术相比具有如下优点:
[0048]本公开提供的热门媒资语音识别方法、装置、设备及介质,通过在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表中,然后在获取到待识别语音进行语音识别时,利用热门词表来帮助基础语本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种热门媒资语音识别方法,其特征在于,包括:在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表;获取待识别语音;基于所述热门词表和基础语言模型识别所述待识别语音,得到识别结果。2.如权利要求1所述的方法,其特征在于,所述在预设周期内持续收集关于热门媒体资源的文本语料录入热门词表,包括:在预设周期内,使用爬虫程序持续抓取位于热门榜单上的媒体资源的文本语料录入所述热门词表中。3.如权利要求1所述的方法,其特征在于,所述基于所述热门词表和基础语言模型识别所述待识别语音,得到识别结果,包括:使用所述热门词表对所述基础语言模型进行热词解码增强,以增加所述基础语言模型识别所述热门词表包含的文本语料的概率;利用所述基础语言模型解码所述待识别语音,并将所述待识别语音的解码结果最大概率对应的单词序列作为所述识别结果。4.如权利要求1所述的方法,其特征在于,所述方法还包括:响应于所述预设周期结束,将所述热门词表包含的多个文本语料录入训练文本,并清空所述热门词表;利用所述训练文本对所述基础语言模型进行迭代训练,得到新训练的语言模型;将所述基础语言模型替换为所述新训练的语言模型。5.如权利要求4所述的方法,其特征在于,所述将所述热门词表包含的多个文本语料录入训练文本,包括:根据每个热门媒体资源的被点映次数,将所述热门词表包含的多个文本语料录入训练文本,以使被点映次数更多的热门媒体资源对...
【专利技术属性】
技术研发人员:王宁,李良斌,
申请(专利权)人:北京声智科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。