【技术实现步骤摘要】
语音解码方法、装置、引擎及存储介质
本专利技术涉及语音识别
,尤其涉及一种语音解码方法、装置、引擎及存储介质。
技术介绍
随着计算机技术的发展,越来越多的技术(大数据、分布式、区块链Blockchain、人工智能等)应用在金融领域,传统金融业正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要求,也对技术提出了更高的要求。语音解码是语音识别的重要组成部分。当前,一般基于通用模型对语音流数据进行解码获得该语音流数据对应的文本。若需要实现并行处理提高语音解码效率,则只能在进程级别通过部署更多的通用模型来实现,但是通用模型体积大,如此大大提升了硬件成本。
技术实现思路
本专利技术提供一种语音解码方法、装置、引擎及存储介质,旨在创建多个解码通道共用一个通用模型,实现线程级别的并行处理,降低硬件成本,提高语音解码的并发能力和解码效率。为实现上述目的,本专利技术提供一种语音解码方法,所述方法包括:当接收到多个语音解码请求时,申请多个线程级解码通道,所述多个语音解码请 ...
【技术保护点】
1.一种语音解码方法,其特征在于,所述方法应用于语音解码引擎,包括:/n当接收到多个语音解码请求时,申请多个线程级解码通道,所述多个语音解码请求与所述多个线程级解码通道一一对应;/n利用所述多个线程级解码通道分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果,并基于所述解码结果响应所述多个语音解码请求。/n
【技术特征摘要】
1.一种语音解码方法,其特征在于,所述方法应用于语音解码引擎,包括:
当接收到多个语音解码请求时,申请多个线程级解码通道,所述多个语音解码请求与所述多个线程级解码通道一一对应;
利用所述多个线程级解码通道分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果,并基于所述解码结果响应所述多个语音解码请求。
2.根据权利要求1所述的方法,其特征在于,所述线程级解码通道包括通道解码单元、数据缓存区和回调接口单元;所述利用所述多个线程级解码通道分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果,并基于所述解码结果响应所述多个语音解码请求的步骤包括:
利用所述多个线程级解码通道的数据缓存区分别缓存所述多个语音解码请求中的语音流数据;
利用所述多个线程级解码通道的通道解码单元,分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果;
利用所述多个线程级解码通道的回调接口单元基于所述解码结果分别响应所述多个语音解码请求。
3.根据权利要求2所述的方法,其特征在于,所述利用所述多个线程级解码通道的数据缓存区分别缓存所述多个语音解码请求中的语音流数据,包括:
针对所述多个线程级解码通道中任一特定线程级解码通道,查看所述特定线程级解码通道的数据缓存区的数据状态;
若所述特定线程级解码通道的数据缓存区的数据状态是等待数据,则直接将所述特定线程级解码通道对应的语音流数据暂存在所述特定线程级解码通道的数据缓存区;
若所述特定线程级解码通道的数据缓存区的数据状态是有数据,则将所述特定线程级解码通道对应的语音流数据暂存在所述特定线程级解码通道的数据缓存区的末尾。
4.根据权利要求2所述的方法,其特征在于,所述利用所述多个线程级解码通道的通道解码单元,分别调用通用模型,对所述多个语音解码请求中的语音流数据进行并行解码处理,获得解码结果的步骤包括:
利用所述多个线程级解码通道的通道解码单元,分别调用通用模型;
基于所述通用模型,在各个所述通道解码单元中并行将所述语音流数据转换为特征向量集合,并将所述特征向量集合转换为解码结果。
5.根据权利要求2所述的方法,其特征在于,所述线程级解码通道还包括状态控制单元,
所述方法还包括:
通过所述线程级解码通道的状态控制单元实时更新所述线程级解码通道的运行状态、所述数据缓存区的数据状态、以及所述回调接口...
【专利技术属性】
技术研发人员:赵伟伟,
申请(专利权)人:深圳前海微众银行股份有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。