长文本生成方法、装置、终端及存储介质制造方法及图纸

技术编号：28839231 阅读：14 留言：0更新日期：2021-06-11 23:37

本发明专利技术公开了一种长文本生成方法、装置、终端及存储介质，其中方法包括：获取输入数据，输入数据包括多个属性以及每个属性对应的值；基于输入数据构建预设数量个计划子文本，每个计划子文本均包括所有属性；计算每个属性在每个计划子文本的概率，并根据概率筛选出符合预设要求的目标属性，并将目标属性作为计划子文本的最终输出属性；根据输入数据和每个计划子文本的最终输出属性生成与计划子文本对应的多个输出子文本，每个子文本包括最终输出属性对应的值，多个输出子文本构成一个长文本。通过上述方式，本发明专利技术能够将一个长文本的生成任务分为多个子任务分别执行，每个子任务表达不同的属性，使得最终得到的长文本语句连贯、重复内容少。

全部详细技术资料下载

【技术实现步骤摘要】
长文本生成方法、装置、终端及存储介质
本申请涉及人工智能
，特别是涉及一种长文本生成方法、装置、终端及存储介质。
技术介绍
市场很多行业需要大量的行情文章、促销信息、导购文章、新产品上市等文本描述，例如汽车行业，据统计，汽车经销商1天发布促销行情文章超5000篇，行业经销商、生产厂商、内容编辑者迫切希望能将数据量进一步扩大。目前，随着AI技术的快速发展，自然语言处理技术近年来也不断突破，对话系统在工业界广泛应用，如智能客服，语音助手等，但是，NLP技术在具体的生成较长的复杂句子时(如在生成满足一定条件的广告文案时)，仍然存在句子与句子之间语义不连贯，以及文本重复生成的问题。
技术实现思路
本申请提供一种长文本生成方法、装置、终端及存储介质，以解决现有的NLP技术生成的长文本语句不够连贯、文本重复的技术问题。为解决上述技术问题，本申请采用的一个技术方案是：提供一种长文本生成方法，包括：获取输入数据，输入数据包括多个属性以及每个属性对应的值；基于输入数据构建预设数量个计划子文本，每个计划子文本均包括所有属性；计算每个属性在每个计划子文本的概率，并根据概率筛选出符合预设要求的目标属性，并将目标属性作为计划子文本的最终输出属性；根据输入数据和每个计划子文本的最终输出属性生成与计划子文本对应的多个输出子文本，每个子文本包括最终输出属性对应的值，多个输出子文本构成一个长文本。作为本申请的进一步改进，基于输入数据构建预设数量个计划子文本，每个计划子文本均包括所有属性，包括：对输入数...

【技术保护点】
1.一种长文本生成方法，其特征在于，包括：/n获取输入数据，所述输入数据包括多个属性以及每个属性对应的值；/n基于所述输入数据构建预设数量个计划子文本，每个所述计划子文本均包括所有属性；/n计算每个所述属性在每个所述计划子文本的概率，并根据所述概率筛选出符合预设要求的目标属性，并将所述目标属性作为所述计划子文本的最终输出属性；/n根据所述输入数据和每个所述计划子文本的最终输出属性生成与所述计划子文本对应的多个输出子文本，每个所述子文本包括所述最终输出属性对应的值，所述多个输出子文本构成一个长文本。/n

【技术特征摘要】
1.一种长文本生成方法，其特征在于，包括：
获取输入数据，所述输入数据包括多个属性以及每个属性对应的值；
基于所述输入数据构建预设数量个计划子文本，每个所述计划子文本均包括所有属性；
计算每个所述属性在每个所述计划子文本的概率，并根据所述概率筛选出符合预设要求的目标属性，并将所述目标属性作为所述计划子文本的最终输出属性；
根据所述输入数据和每个所述计划子文本的最终输出属性生成与所述计划子文本对应的多个输出子文本，每个所述子文本包括所述最终输出属性对应的值，所述多个输出子文本构成一个长文本。

2.根据权利要求1所述的方法，其特征在于，所述基于所述输入数据构建预设数量个计划子文本，每个所述计划子文本均包括所有属性，包括：
对所述输入数据进行编码操作，并结合预设的第一神经网络模型计算得到第一隐变量分布，并从所述第一隐变量分布中随机采样得到第一隐变量；
根据所述输入数据、所述第一隐变量计算得到概率分布最大的一组所述计划子文本。

3.根据权利要求2所述的方法，其特征在于，所述计算每个所述属性在每个所述计划子文本的概率，并根据所述概率筛选出符合预设要求的目标属性，并将所述目标属性作为所述计划子文本的最终输出属性，包括：
计算每个属性在每个所述计划子文本中的概率；
分别判断所述计划子文本中是否存在所述概率大于预设阈值的目标属性；
若存在，则将所述目标属性作为所述计划子文本的最终输出属性；
若不存在，则将所述概率最大的属性作为所述最终输出属性。

4.根据权利要求2所述的方法，其特征在于，所述根据所述输入数据和每个所述计划子文本的最终输出属性生成与所述计划子文本对应的多个输出子文本，每个所述子文本包括所述最终输出属性对应的值，所述多个输出子文本构成一个长文本，包括：
利用预设的第一解码端进行文本解码操作，得到第一解码端的隐状态；
根据所述第一解码端的隐状态、所述输入数据、所述第一隐变量、所述计划子文本的最终输出属性和预设的第二神经网络模型计算得到第二隐变量分布；
从所述第二隐变量分布中随机采样得到第二隐变量；
根据所述输入数据、所述第一隐变量、所述计划子文本的最终输出属性和所述第二隐变量计算得到概率分布最大的一组输出子文本的表现形式，所述表现形式用于反映所述输出子文本之间的关系；
通过预设的第二解码端基于所述输出子文本的表现形式、所述输入数据、所述第一隐变量、所述计划子文本的最终输出属性、所述第二隐变量生成所述多个输出子文本，所述多个输出子文本组合构成一个长文本。

5.根据权利要求4所...

【专利技术属性】
技术研发人员：孙思，
申请(专利权)人：平安国际智慧城市科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人