【技术实现步骤摘要】
语音识别服务定制方法、介质、装置和计算设备
[0001]本专利技术的实施方式涉及语音识别
,更具体地,本专利技术的实施方式涉及语音识别服务定制方法、介质、装置和计算设备。
技术介绍
[0002]本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]在目前的语音识别服务中,针对大量有定制需求的用户难以做到低成本高效率的语音识别服务快速定制。语音识别的领域自适应能力主要由语言模型提供,传统的定制做法是先收集领域相关语料,利用收集的语料和通用语料共同构建语言模型,最后生成专门用于该领域的解码网络。这种方式得到的模型识别效果往往是最好的,但是如果针对每个领域的用户都设置专门的语言模型,成本将非常大。
[0004]为了解决这一问题,目前提出了采用通用模型和针对特定用户的用户模型融合的方式,首先利用通用模型识别出多种候选,随后利用针对特定用户的用户模型对多种候选重新打分排序。这种方法虽然可以快速定制,但是会增加识别过程中的复杂度和所需时间, ...
【技术保护点】
【技术特征摘要】
1.一种语音识别服务定制方法,其特征在于,包括:获取用于语音识别的通用模型以及针对特定用户的用户模型,其中,所述通用模型和所述用户模型中均包括用于指示模型路径跳转的连接状态;分别从所述通用模型的初始状态和所述用户模型的初始状态出发并行开始进行多次单步解码;在任一模型的每次单步解码过程中,当上一步的状态队列中存在所述连接状态时,将与所述任一模型并行的另一模型的连接状态加入本次单步解码的状态队列;直至所述多次单步解码结束时,根据最终的状态队列确定对音频内容的语音识别结果。2.根据权利要求1所述的方法,其特征在于,所述用户模型和所述通用模型为加权有限状态转换器WFST形式的用于识别解码的模型。3.根据权利要求1或2所述的方法,其特征在于,所述当上一步的状态队列中存在所述连接状态时,将与所述任一模型并行的另一模型的连接状态加入本次单步解码的状态队列,包括:当上一步的状态队列中存在所述通用模型的连接状态时,将所述用户模型的连接状态加入本次单步解码的状态队列,并根据所述通用模型的连接状态的分数及跳入代价确定所述用户模型的连接状态的分数;其中,所述跳入代价为从所述通用模型的连接状态跳转到所述用户模型的连接状态的边权重;或者,当上一步的状态队列中存在所述用户模型的连接状态时,将所述通用模型的连接状态加入本次单步解码的状态队列,并根据所述用户模型的连接状态的分数及跳出代价确定所述通用模型的连接状态的分数;其中,所述跳出代价为从所述用户模型的连接状态跳转到所述通用模型的连接状态的边权重。4.根据权利要求1或2所述的方法,其特征在于,所述根据最终的状态队列确定对音频内容的语音识别结果,包括:根据所述最终的状态队列确定至少一个候选状态队列序列;在所述至少一个候选状态队列序列中,去除最后一次跳转是连接状态之间跳转的候选状态队列序列;从剩余的候选状态队列序列中,选择分数最低的候选状态队列序列,作为对所述用户的音频内容的语音识别结果。5.根据权利要求4所述的方法,其特征在于,所述根据所述最终的状态队列确定至少一个候选状态队列序列,包括:针对所述最终的状态队列中的各个最终状态,确定从所述通用模型的初始状态或所述用户模型的初始状态跳转至所述最终状态的路径,将所述路径经过的多个状态组成所述最终状态对应的候选状态队列序列,并将所述最终状态的分数作为所述候选...
【专利技术属性】
技术研发人员:韩其琛,刘东,李响,杨震,张神权,
申请(专利权)人:网易杭州网络有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。