文章生成方法、文章生成模型训练方法及相关设备技术

技术编号:37642220 阅读:21 留言:0更新日期:2023-05-25 10:09
本申请实施例公开了一种文章生成方法、文章生成模型训练方法及相关设备。方法包括:获取目标事件的事件关键信息;将事件关键信息和预先创建的文章数据库进行匹配处理,从文章数据库中筛选出与事件关键信息相匹配的目标历史语句数据;文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据;将事件关键信息和目标历史语句数据输入预先训练的文章生成模型中,得到事件关键信息对应的目标文章。该技术方案能够提升文章生成的效率和智能性,且确保目标文章的语义连贯性和多样性。性。性。

【技术实现步骤摘要】
文章生成方法、文章生成模型训练方法及相关设备


[0001]本说明书涉及人工智能语言
,尤其涉及一种文章生成方法、文章生成模型训练方法及相关设备。

技术介绍

[0002]在信息迭代发展的今天,即使是“读书破万卷”的人也很难做到不知疲倦地学习,能够随时随地收集和生产内容是每一个创作者的共同目标。让机器人像人一样表达和创作,是人工智能的重要愿景之一,实现这一愿景的核心
之一是智能写作。智能写作近年来在技术上发展迅速,在应用中也体现出愈发重要的价值,例如,利用机器人对新闻事件进行智能撰稿。
[0003]相关技术中,利用机器人智能撰稿时通常采用以下方式:一种是利用文章相关信息训练深度神经网络模型,进而利用训练的深度神经网络模型生成文章。这种方式由于完全依赖深度神经网络,因此生成的文章内容不可控,容易出现语义不通顺的现象。另一种是通过人工在特定领域设置特定的模板,从而将文章信息按照模板方式进行填充,完善文章内容。这种方式虽然可读性较高,但多样性较差,每次所生成的文章行文方式基本是固定的,如果涉及新的文章领域,就需要依赖人力再单独设计新的模板,耗时耗力。

技术实现思路

[0004]本申请实施例的目的是提供一种文章生成方法、文章生成模型训练方法及相关设备,用以解决现有技术中智能生成的文章语义连贯性差以及多样性差的问题。
[0005]为解决上述技术问题,本申请实施例是这样实现的:
[0006]一方面,本申请实施例提供一种文章生成方法,包括:
[0007]获取目标事件的事件关键信息;
[0008]将所述事件关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述事件关键信息相匹配的目标历史语句数据;所述文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据;
[0009]将所述事件关键信息和所述目标历史语句数据输入预先训练的文章生成模型中,得到所述事件关键信息对应的目标文章。另一方面,本申请实施例提供一种文章生成模型训练方法,包括:
[0010]获取样本文章,并对所述样本文章进行语义分析,确定所述样本文章对应的样本关键信息;
[0011]将所述样本关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述样本关键信息相匹配的样本历史语句数据;所述文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据;
[0012]将所述样本关键信息和所述样本历史语句数据作为待训练的文章生成模型的输入数据,得到所述样本关键信息对应的预测文章数据;
[0013]基于所述预测文章数据和所述样本文章对所述待训练的文章生成模型进行训练,训练后的文章生成模型用于根据目标事件的事件关键信息和目标历史语句信息生成所述事件关键信息对应的目标文章;所述目标历史语句数据是将所述事件关键信息和所述文章数据库进行匹配处理,从所述文章数据库中筛选出的与所述事件关键信息相匹配的历史语句数据。
[0014]再一方面,本申请实施例提供一种文章生成装置,包括:
[0015]获取模块,用于获取目标事件的事件关键信息;
[0016]筛选模块,用于将所述事件关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述事件关键信息相匹配的目标历史语句数据;所述文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据;
[0017]生成模块,用于将所述事件关键信息和所述目标历史语句数据输入预先训练的文章生成模型中,得到所述事件关键信息对应的目标文章。
[0018]再一方面,本申请实施例提供一种文章生成模型训练装置,包括:
[0019]获取模块,用于获取样本文章,并对所述样本文章进行语义分析,确定所述样本文章对应的样本关键信息;
[0020]筛选模块,用于将所述样本关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述样本关键信息相匹配的样本历史语句数据;所述文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据;
[0021]预测模块,用于将所述样本关键信息和所述样本历史语句数据作为待训练的文章生成模型的输入数据,得到所述样本关键信息对应的预测文章数据;
[0022]训练模块,基于所述预测文章数据和所述样本文章对所述待训练的文章生成模型进行训练,训练后的文章生成模型用于根据目标事件的事件关键信息和目标历史语句信息生成所述事件关键信息对应的目标文章;所述目标历史语句数据是将所述事件关键信息和所述文章数据库进行匹配处理,从所述文章数据库中筛选出的与所述事件关键信息相匹配的历史语句数据。
[0023]再一方面,本申请实施例提供一种电子设备,包括处理器和与所述处理器电连接的存储器,所述存储器存储有计算机程序,所述处理器用于从所述存储器调用并执行所述计算机程序以实现上述文章生成方法,或者,所述处理器用于从所述存储器调用并执行所述计算机程序以实现上述文章生成模型训练方法。
[0024]再一方面,本申请实施例提供一种计算机可读存储介质,用于存储计算机程序,所述计算机程序能够被处理器执行以实现上述文章生成方法,或者,所述计算机程序能够被处理器执行以实现上述文章生成模型训练方法。
[0025]采用本申请实施例的技术方案,通过获取目标事件的事件关键信息,并将事件关键信息和预先创建的文章数据库进行匹配处理,筛选出与事件关键信息相匹配的目标历史语句数据,其中,文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据。由于文章中的语句数据不仅包括文字内容,还包括文字所具有的语义信息,因此,通过将事件关键信息和历史语句数据进行匹配处理,使得筛选出的目标历史语句数据和事件关键信息之间不仅具有高度匹配的文字内容,还具有高度匹配的语义信息。进而,通过将事件关键信息和筛选出的目标历史语句数据输入预先训练的文章生成模型中,使得文章生成模
型能够基于与事件关键信息具有高度匹配的文字内容和语义信息的目标历史语句数据生成对应的目标文章,从而使目标文章不仅与历史文章中的历史语句数据相匹配(比如与历史语句数据对应的语句结构相匹配),且大大提升了文章生成的效率和智能性。此外,文章生成过程同时依赖于高度匹配的历史语句数据以及文章生成模型,基于历史语句数据的多样性以及文章生成模型的智能化,确保了目标文章的语义连贯性和多样性。
附图说明
[0026]为了更清楚地说明本说明书一个或多个实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书一个或多个实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0027]图1是根据本申请一实施例的一种文章生成方法的示意性流程图;
[0028]图2是根据本申请一实施例的一种文章生成方法的示意性原理图;
[0029]图3是根据本申请一实施例本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文章生成方法,其特征在于,包括:获取目标事件的事件关键信息;将所述事件关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述事件关键信息相匹配的目标历史语句数据;所述文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据;将所述事件关键信息和所述目标历史语句数据输入预先训练的文章生成模型中,得到所述事件关键信息对应的目标文章。2.根据权利要求1所述的方法,其特征在于,所述事件关键信息包括至少一个关键信息元素;与所述事件关键信息相匹配的目标历史语句数据包括所述至少一个关键信息元素中每个关键信息元素对应的子目标历史语句数据;所述将所述事件关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述事件关键信息相匹配的目标历史语句数据,包括:计算每个关键信息元素和每个历史语句数据之间的第一相似度;根据所述每个关键信息元素和每个历史语句数据之间的第一相似度,从所述文章数据库中筛选出每个关键信息元素对应的子目标历史语句数据;任意一个关键信息元素对应的子目标历史语句数据与所述任意一个关键信息元素之间的第一相似度大于或等于第一预设阈值。3.根据权利要求1所述的方法,其特征在于,所述事件关键信息包括至少一个关键信息元素;与所述事件关键信息相匹配的目标历史语句数据包括所述至少一个关键信息元素中每个关键信息元素对应的子目标历史语句数据;所述将所述事件关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述事件关键信息相匹配的目标历史语句数据,包括:从所述文章数据库中确定多个第一历史文章;计算所述事件关键信息和所述多个第一历史文章之间的第二相似度;根据所述事件关键信息和所述多个第一历史文章之间的第二相似度,从所述多个第一历史文章中筛选出第二历史文章;所述第二历史文章与所述事件关键信息之间的第二相似度大于或等于第二预设阈值;计算每个关键信息元素和所述第二历史文章中每个历史语句数据之间的第三相似度;根据所述每个关键信息元素和所述第二历史文章中每个历史语句数据之间的第三相似度,从所述第二历史文章中筛选出每个关键信息元素对应的子目标历史语句数据;任意一个关键信息元素对应的子目标历史语句数据与所述任意一个关键元素信息之间的第三相似度大于或等于第三预设阈值。4.根据权利要求3所述的方法,其特征在于,每个历史文章对应各自的文章类别;所述从所述文章数据库中确定多个第一历史文章,包括:确定所述目标事件对应的事件类别;将所述事件类别和所述文章数据库中每个历史文章的文章类别进行匹配处理,确定与所述事件类别相匹配的目标文章类别;确定所述文章数据库中与所述目标文章类别对应的历史文章为多个第一历史文章。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采集待更新的文章相关内容;所述文章相关内容包括已发布的文章和/或指定类型的字符;在所述文章数据库满足预设更新条件时,基于所述文章相关内容更新所述文章数据库;所述预设更新条件包括以下至少一项:所述已发布的文章数量达到预设阈值、所述文章数据库的上一次更新时间距离当前时间达到预设时长、所述历史文章中存在至少一个所述指定类型的字符被更新。6.根据权利要求2或3所述的方法,其特征在于,每个关键信息元素包括符合预设信息结构的关键信息字段和关键信息内容;所述获取目标事件的事件关键信息,包括:确定与所述目标事件的事件类别相匹配的关键信息字段;获取所述目标事件对应的、且与所述关键信息字段相匹配的关键信息内容;按照所述预设信息结构,对每个关键信息字段及其对应的关键信息内容进行结构化处理,得到所述事件关键信息。7.一种文章生成模型训练方法,其特征在于,包括:获取样本文章,并对所述样本文章进行语义分析,确定所述样本文章对应的样本关键信息;将所述样本关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述样本关键信息相匹配的样本历史语句数据;所述文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据;将所述样本关键信息和所述样本历史语句数据作为待训练的文章生成模型的输入数据,得到所述样本关键信息对应的预测文章数据;基于所述预测文章数据和所述样本文章对所述待训练的文章生成模型进行训练,训练后的文章生成模型用于根据目标事件的事件关键信息和目标历史语句信息生成所述事件关键信息对应的目标文章;所述目标历史语句数据是将所述事件关键信息和所述文章数据库进行匹配处理,从所述文章数据库中筛选出的与所述事件关键...

【专利技术属性】
技术研发人员:吕乐宾蒋宁肖冰李宽丁隆耀
申请(专利权)人:马上消费金融股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1