一种数据处理方法、装置和用于数据处理的装置制造方法及图纸

技术编号:24712276 阅读:24 留言:0更新日期:2020-07-01 00:36
本发明专利技术实施例提供了一种数据处理方法、装置和用于数据处理的装置。其中的方法具体包括:确定当前语音帧在解码网络中对应的活跃节点;根据所述活跃节点从其前驱节点接收的所述前驱节点的节点索引,以及节点索引与有序链表之间的映射关系,确定所述活跃节点的前驱节点对应的有序链表;根据预置的合并算法,对待合并的至少一个有序链表进行合并;其中,所述待合并的至少一个有序链表包括:所述活跃节点的至少一个前驱节点对应的有序链表。本发明专利技术实施例可以降低合并多个有序链表的复杂度,进而可以提高解码速度以及提高语音识别的效率。

【技术实现步骤摘要】
一种数据处理方法、装置和用于数据处理的装置
本专利技术涉及计算机
,尤其涉及一种数据处理方法、装置和用于数据处理的装置。
技术介绍
语音识别,也被称为ASR(AutomaticSpeechRecognition,自动语音识别),其目标是将语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。具体地,可以将声学模型、语言模型、以及发音词典等知识源编译成解码网络,语音识别就是在解码网络中寻找一条最优路径的过程。然而,由于解码网络通常比较庞大,因此,在遍历解码网络对语音信息进行解码的过程中,往往存在解码速度较慢,进而影响语音识别效率的问题。
技术实现思路
本专利技术实施例提供一种数据处理方法、装置和用于数据处理的装置,可以提高解码速度以及提高语音识别的效率。为了解决上述问题,本专利技术实施例公开了一种数据处理方法,所述方法包括:确定当前语音帧在解码网络中对应的活跃节点;根据所述活跃节点从其前驱节点接收的所述前驱节点的节点索引,以及节点索引与有序链表之间的映射关系,确本文档来自技高网...

【技术保护点】
1.一种数据处理方法,其特征在于,所述方法包括:/n确定当前语音帧在解码网络中对应的活跃节点;/n根据所述活跃节点从其前驱节点接收的所述前驱节点的节点索引,以及节点索引与有序链表之间的映射关系,确定所述活跃节点的前驱节点对应的有序链表;/n根据预置的合并算法,对待合并的至少一个有序链表进行合并;其中,所述待合并的至少一个有序链表包括:所述活跃节点的至少一个前驱节点对应的有序链表。/n

【技术特征摘要】
1.一种数据处理方法,其特征在于,所述方法包括:
确定当前语音帧在解码网络中对应的活跃节点;
根据所述活跃节点从其前驱节点接收的所述前驱节点的节点索引,以及节点索引与有序链表之间的映射关系,确定所述活跃节点的前驱节点对应的有序链表;
根据预置的合并算法,对待合并的至少一个有序链表进行合并;其中,所述待合并的至少一个有序链表包括:所述活跃节点的至少一个前驱节点对应的有序链表。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述活跃节点的前驱节点数目;
确定所述前驱节点数目超过预设阈值的活跃节点为目标活跃节点;
所述待合并的至少一个有序链表,包括:所述目标活跃节点的至少一个前驱节点对应的有序链表。


3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
向所述活跃节点的后驱节点传递所述活跃节点的节点索引。


4.根据权利要求1所述的方法,其特征在于,所述根据预置的合并算法,对待合并的至少一个有序链表进行合并,包括:
根据待合并的有序链表数目,建立最大堆;
将所述待合并的有序链表的链表头存入所述最大堆中;
删除所述最大堆的堆顶,以获取所述堆顶中的数据元素,以及将所述数据元素所在有序链表的下一个数据元素加入所述最大堆,直到满足合并终止条件。


5.根据权利要求1所述的方法,其特征在于,所述根据预置的合并算法,对待合并的至少一个有序链表进行合并,包括:
将待合并的至少一个有序链表平均分为两组,再将分组后每组中的有序链表平均分为两组,直到分组后每组中有序链表的数目为1;
对分组后的每组有序链表,两两进行合并,直到将各组有序链表合并为...

【专利技术属性】
技术研发人员:姚光超
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1