集束搜索处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:38005404 阅读:25 留言:0更新日期:2023-06-30 10:21
本申请涉及一种集束搜索处理方法、装置、计算机设备和存储介质。所述方法包括:基于当前待匹配对象与当前集束宽度,对词表进行集束搜索,得到当前搜索结果,当前搜索结果中包括与当前待匹配对象匹配成功、数量与当前集束宽度匹配的多个目标词;根据已执行的集束搜索次数所匹配的集束宽度衰减方式,对当前集束宽度进行宽度衰减,得到下一次集束搜索的集束宽度;将各目标词作为下一次集束搜索的待匹配对象,迭代进行集束搜索,直至衰减所得的集束宽度等于集束宽度阈值,并将此时的搜索结果,作为目标待匹配对象,基于集束宽度阈值,对词表进行集束搜索,得到目标搜索结果。采用本方法能够在超长序列场景下,在确保搜索效果的同时,提高搜索效率。提高搜索效率。提高搜索效率。

【技术实现步骤摘要】
集束搜索处理方法、装置、计算机设备和存储介质


[0001]本申请涉及计算机
,特别是涉及一种集束搜索处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]现有技术中,一般将Exhausitive Search(穷举搜索)、Greedy Search(贪心搜索)、Beam Search(集束搜素)等搜索方法运用于文本生成、机器翻译、语音识别等多种领域,以完成搜索任务。
[0003]然而,在超长序列场景下(在搜索结束后,输出的序列长度较长),需要进行多轮搜索,Exhausitive Search在每一次搜索时都会计算所有搜索结果的概率,虽然能够获得全局最优解,但时间复杂度高,搜索过程更耗时,导致搜索效率不高。Greedy Search时间复杂度低,但搜索空间小,容易陷入局部最优解,导致搜索效果不佳。Beam Search在集束宽度(搜索空间)较小时,虽然能提高搜索效率,但容易陷入局部最优解,影响搜索效果,而在集束宽度(搜索空间)较大时,虽然能提高搜索效果,但会导致搜索效率不高。因此,在超长序列场景下,现有技术中的搜索方法无法在本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种集束搜索处理方法,其特征在于,所述方法包括:基于当前待匹配对象与当前集束宽度,对存储有多个词的词表进行集束搜索,得到当前搜索结果,所述当前搜索结果中包括所述词表中与所述当前待匹配对象匹配成功的多个目标词,所述目标词的数量与所述当前集束宽度匹配;根据已执行的集束搜索次数所匹配的集束宽度衰减方式,对所述当前集束宽度进行宽度衰减,得到下一次集束搜索的集束宽度;将各所述目标词分别作为下一次集束搜索的待匹配对象,迭代对所述词表进行集束搜索,直至衰减所得的集束宽度等于集束宽度阈值;将在衰减所得的集束宽度等于所述集束宽度阈值时的搜索结果,作为目标待匹配对象,并基于所述集束宽度阈值,对所述词表进行集束搜索,得到目标搜索结果。2.根据权利要求1所述的方法,其特征在于,所述基于当前待匹配对象与当前集束宽度,对存储有多个词的词表进行集束搜索,得到当前搜索结果,包括:基于当前待匹配对象,通过集束搜索从所述词表中获得与所述当前待匹配对象匹配成功的多个未筛选词,每一所述未筛选词均有各自对应的概率值;对多个所述未筛选词各自的概率值进行排序,得到概率值排序结果;按照与所述当前集束宽度匹配的目标词数量、以及所述概率值排序结果,从所述未筛选词中筛选出多个目标词作为当前搜索结果。3.根据权利要求2所述的方法,其特征在于,所述当前待匹配对象的数量为至少一个;所述基于当前待匹配对象,通过集束搜索从所述词表中获得与所述当前待匹配对象匹配成功的多个未筛选词包括:获取进行集束搜索时,当前待匹配对象的可匹配的词数量;根据所述可匹配的词数量,通过集束搜索从所述词表中获得与所述当前待匹配对象匹配成功的多个未筛选词,每一所述当前待匹配对象对应的未筛选词的数量均与所述可匹配的词数量一致。4.根据权利要求2所述的方法,其特征在于,所述按照与所述当前集束宽度匹配的目标词数量、以及所述概率值排序结果,从所述未筛选词中筛选出多个目标词作为当前搜索结果,包括:当所述当前集束宽度大于或等于集束宽度阈值时,将所述当前集束宽度确定为目标词数量,根据所述概率值排序结果,从多个所述未筛选词中,筛选出数量与所确定的目标词数量一致的多个目标词,将多个所述目标词作为当前搜索结果;当所述当前集束宽度小于集束宽度阈值时,将所述集束宽度阈值作为当前集束宽度并确定为目标词数量,根据所述概率值排序结果,从多个所述未筛选词中,筛选出数量与...

【专利技术属性】
技术研发人员:吴松程杨徐伟林昊王福海林华春
申请(专利权)人:招联消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1