【技术实现步骤摘要】
自然语言文本生成方法和装置以及对话系统
[0001]本公开涉及自然语言处理领域,特别涉及一种自然语言文本生成方法和装置以及对话系统。
技术介绍
[0002]随着互联网技术的发展和人工智能的发展,自然语言处理技术取得了很大的进步。
[0003]自然语言文本生成(Nature Language Generating,简称NLG)技术是自然语言处理技术中重要的一部分,指的是将结构化数据生成自然语言文本。
[0004]在一些相关技术中,人工预定义文本模板以及文本模板对应的文本句式,然后确定结构化数据对应哪个文本模板下哪种文本句式,利用对应的文本句式最终生成相应的自然语言文本。
技术实现思路
[0005]专利技术人发现,在相关技术中,文本模板对应的文本句式需要人工预先配置,费时费力,不够灵活。
[0006]在本公开中,利用结构化数据训练样本及其对应的文本模板对循环神经网络训练得到自然语言文本生成模型,将待生成的结构化数据输入自然语言文本生成模型并输出相应的文本句式,如果需要的话,利用待生成的结构 ...
【技术保护点】
【技术特征摘要】
1.一种自然语言文本生成方法,其特征在于,包括:获取待生成的结构化数据,所述结构化数据包括意图,或者,所述结构化数据包括意图、槽及其值;将所述结构化数据输入自然语言文本生成模型并输出相应的文本句式,所述自然语言文本生成模型是利用结构化数据训练样本及其对应的文本模板对循环神经网络进行训练得到的;如果所述结构化数据包括槽及其值,将所述文本句式中的槽的占位符替换为所述结构化数据中相应槽的值,得到相应的自然语言文本;如果所述结构化数据不包括槽及其值,将所述文本句式作为相应的自然语言文本。2.根据权利要求1所述的自然语言文本生成方法,其特征在于,所述将所述结构化数据输入自然语言文本生成模型并输出相应的文本句式包括:将所述结构化数据输入自然语言文本生成模型依次得到多个输出部分,每个输出部分包括预测的多个文本节点;根据各个输出部分中的文本节点的组合,确定所述结构化数据对应的多个文本句式。3.根据权利要求2所述的自然语言文本生成方法,其特征在于,所述根据各个输出部分中的文本节点的组合,确定所述结构化数据对应的多个文本句式包括:从每个输出部分选取预测概率最大的预设数量的文本节点,所述预设数量为多个;将各个输出部分中选取出来的一个文本节点进行组合;从多个文本节点组合中选取所述预设数量的文本节点组合作为所述结构化数据对应的多个文本句式。4.根据权利要求2所述的自然语言文本生成方法,其特征在于,所述将所述结构化数据输入自然语言文本生成模型依次得到多个输出部分包括:所述将所述结构化数据输入自然...
【专利技术属性】
技术研发人员:王娟,程建波,彭南博,黄志翔,
申请(专利权)人:京东数字科技控股有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。