【技术实现步骤摘要】
文本生成方法、装置、电子设备和存储介质
[0001]本专利技术涉及自然语言处理
,尤其涉及一种文本生成方法
、
装置
、
电子设备和存储介质
。
技术介绍
[0002]文本生成是指通过计算机程序
、
人工智能模型或自然语言处理技术来生成自然语言文本的过程
。
在生成文本的过程中,通常文本生成模型会根据当前的输入和上下文信息预测下一个最有可能的词或字符
。
束搜索通过维护一个候选文本序列集合,并根据预测的概率对这些文本序列进行扩展和排序,从而选择最有可能的输出文本序列
。
[0003]然而,现有的束搜索在输入输出内存共享的情况下,在每次选取新的候选输出文本序列时,需要完全拷贝新的候选输出文本序列中的各分词至对应内存,拷贝开销较大
。
技术实现思路
[0004]本专利技术提供一种文本生成方法
、
装置
、
电子设备和存储介质,用以解决现有技术中文本生成拷贝开销较大的
【技术保护点】
【技术特征摘要】
1.
一种文本生成方法,其特征在于,包括:对文本特征进行词语生成,得到多个分词;对所述多个分词进行排序,得到生成文本;其中,在对所述多个分词进行排序的过程中,基于所述多个分词获取各时间步的文本序列,其中各时间步的文本序列中的分词数量随时间步递增,且任一时间步的文本序列的分词顺序是以最大化所述任一时间步与上一时间步的文本序列间相同排序的分词数量为目标进行调整的,所述生成文本基于最后一个时间步的文本序列确定
。2.
根据权利要求1所述的文本生成方法,其特征在于,所述任一时间步的文本序列的分词顺序的调整步骤包括:按照所述上一时间步的文本序列的分词顺序,遍历所述上一时间步的文本序列中的各分词;在所述任一时间步的文本序列中存在任一分词与所述上一时间步的文本序列中当前位置的分词相同的情况下,将所述任一时间步的文本序列对应的分词添加至数组,并删除所述任一时间步的文本序列对应的分词;遍历完成所述上一时间步的文本序列中的各分词后,将所述任一时间步的文本序列中的剩余分词按照分词顺序依次添加至所述数组,以所述数组的分词顺序作为所述任一时间步的文本序列调整后的分词顺序
。3.
根据权利要求2所述的文本生成方法,其特征在于,所述调整步骤还包括:在所述任一时间步的文本序列中存在任一分词与所述上一时间步的文本序列中当前位置的分词不同的情况下,返回执行按照所述上一时间步的文本序列的分词顺序,遍历所述上一时间步的文本序列中的各分词
。4.
根据权利要求1所述的文本生成方法,其特征在于,所述任一时间步的文本序列的分词顺序的调整步骤包括:在所述上一时间步的文本序列中当前位置的分词与所述任一时间步的文本序列中对应当前位置的分词不同的情况下,遍历所述任一时间步的文本序列中对应当前位置之后的分词;在遍历后确定所述任一时间步的文本序列中存在任一分词与所述上一时间步的文本序列中当前位置的分词相同的情况下,将所述任一时间步的文本序列中对...
【专利技术属性】
技术研发人员:赵伟淇,胡国平,吴江照,
申请(专利权)人:合肥智能语音创新发展有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。