【技术实现步骤摘要】
解码处理方法、设备和存储介质
[0001]本公开涉及计算机
,具体涉及深度学习、自然语言处理等人工智能
,尤其涉及解码处理方法、设备和存储介质。
技术介绍
[0002]自然语言处理(Natural Language Processing,NLP)是涉及计算机科学、人工智能(Artificial Intelligence,AI)和语言学的交叉技术,目的是让计算机处理或“理解”自然语言,以执行诸如语言翻译和问题回答等任务。随着语音接口和聊天机器人的兴起,NLP成为了信息时代最重要的技术之一,是人工智能的重要组成部分。
[0003]其中,自然语言生成(Natural Language Generation,NLU)任务是自然语言处理的重要组成部分。目前,在自然语言生成任务中,如何使得自然语言生成模型中的编码层可快速进行解码,对于快速得到自然语言生成任务的结果是重要的。
技术实现思路
[0004]本公开提供了一种用于解码处理方法、设备和存储介质。
[0005]根据本公开的一方面,提供了一种解码处理方法,包括:获取自然语言生成模型的编码层对输入文本进行编码所得到的编码结果;根据所述编码结果,确定所述自然语言生成模型的解码层所引用的预设词表中各个词汇在所述输入文本的下一个位置上的概率值;根据各个词汇在所述下一个位置上的概率值,从各个词汇中选择概率值靠前的K个候选词汇,K为正整数;在所述K个候选词汇在所述下一个位置上的概率之和大于或者等于预设概率阈值的情况下,从所述K个候选词中确定出所述 ...
【技术保护点】
【技术特征摘要】
1.一种解码处理方法,包括:获取自然语言生成模型的编码层对输入文本进行编码所得到的编码结果;根据所述编码结果,确定所述自然语言生成模型的解码层所引用的预设词表中各个词汇在所述输入文本的下一个位置上的概率值;根据各个词汇在所述下一个位置上的概率值,从各个词汇中选择概率值靠前的K个候选词汇,K为正整数;在所述K个候选词汇在所述下一个位置上的概率之和大于或者等于预设概率阈值的情况下,从所述K个候选词中确定出所述下一个位置上的目标词汇。2.根据权利要求1所述的方法,其中,所述根据各个词汇在所述下一个位置上的概率值,从各个词汇中选择概率值靠前的K个候选词汇,包括:对各个词汇进行分组处理,以得到多个词汇组;针对各个词汇组,根据所述词汇组中各个词汇在所述下一个位置上的概率值,从所述词汇组中选择出概率值靠前的M个候选词汇,其中,M为正整数,并且M小于K;根据各个所述词汇组所确定出的M个候选词汇,确定出概率值靠前的所述K个候选词汇。3.根据权利要求2所述的方法,其中,通过多个线程对所述多个词汇组进行并行处理,所述针对各个词汇组,根据所述词汇组中各个词汇在所述下一个位置上的概率值,从所述词汇组中选择出概率值靠前的M个候选词汇,包括:针对每个线程:从所述多个词汇组中获取一个未被进行处理的目标词汇组;调用所述线程,根据所述目标词汇组中各个词汇在所述下一个位置上的概率值,从所述目标词汇组中选择出概率值靠前的M个候选词汇。4.根据权利要求2所述的方法,其中,在所述根据各个词汇在所述下一个位置上的概率值,从各个词汇中选择概率值靠前的K个候选词汇之前,所述方法还包括:根据所述预设词表中的词汇总数,确定所述K的取值;根据所述K的取值,确定所述M的取值。5.根据权利要求4所述的方法,其中,所述根据所述K的取值,确定所述M的取值,包括:获取所述K的取值除以第一预设值所得到的商值;将所述商值和第二预设值中的最小值作为所述M的取值。6.根据权利要求1所述的方法,其中,所述方法还包括:在所述K个候选词汇在所述下一个位置上的概率之和小于预设概率阈值的情况下,按照所述概率值从大到小的顺序,对各个词汇进行排序,以得到排序结果;针对第i轮迭代,按照多个线程束的调用顺序,依次调用每个线程束从所述排序结果中获取L个词汇的概率值,其中,L等于所述线程束中的线程个数,其中,i为大于1的整数;针对每个线程束,将第i
‑
1轮迭代中所述线程束计算得到的第一概率累积值与所述第i轮迭代中所述线程束获取的L个词汇的概率值进行加和处理,得到所述第i轮迭代中所述线程束计算得到的第二概率累积值;在存在第二概率累积值大于或者等于所述预设概率阈值的目标线程束的情况下,根据所述目标线程束中各个线程在第i轮迭代中所获取的概率值所对应的词汇,确定所述下一
个位置上的目标词汇。7.根据权利要求6所述的方法,其中,所述根据所述目标线程束中各个线程在第i轮迭代中所获取的概率值所对应的词汇,确定所述下一个位置上的目标词汇,包括:从所述目标线程束获取目标线程,其中,所述目标线程所获取的概率值、所述目标线程束中在所述目标线程之前的各个线程所获取的概率值以及所述第一概率累积值的总和大于或者等于所述预设概率阈值,并且所述目标线程束中在所述目标线程之前的各个线程所获取的概率值以及所述第一概率累积值的总和小于所述预设概率阈值;确定所述目标线程在第i轮迭代中所处理的概率值所对应的词汇在所述排序结果中的位置;根据所述位置,从所述排序结果中获取词汇,将所获取到的词汇作为目标词汇。8.根据权利要求7所述的方法,其中,所述确定所述目标线程在第i轮迭代中所处理的概率值所对应的词汇在所述排序结果中的位置,包括:根据m、所述多个线程束的数量以及所述L,确定前i
‑
1轮迭代中所获取的概率值的总数,其中,m等于i
‑
1;获取所述目标线程束的调用序号;获取所述目标线程在所述目标线程束中的序号;根据所述总数、所述调用序号、所述L和所述序号,确定所述目标线程在第i轮迭代中所处理的概率值所对应的词汇在所述排序结果中的位置。9.根据权利要求1
‑
8中任一项所述的方法,其中,所述方法还包括:对所述预设概率阈值进行缩小处理。10.根据权利要求9所述的方法,其中,所述对所述预设概率阈值进行缩小处理,包括:获取0到1之间的随机数;根据所述随机数,对所述预设概率阈值进行缩小处理。11.根据权利要求9所述的方法,其中,所述从所述K个候选词中确定出所述下一个位置上的目标词汇,包括:将所述K个候选词汇中概率最小的候选词汇作为所述下一个位置上的目标词汇。12.一种解码处理装置,包括:第一获取模块,用于获取自然语言生成模型的编码层对输入文本进行编码所得到的编码结果;第一确定模块,用于根据所述编码结果,确定所述自然语言生成模型的解码层所引用的预设词表中各个词汇在所述输入文本的下...
【专利技术属性】
技术研发人员:李振宇,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。