【技术实现步骤摘要】
文章生成方法、文章生成模型训练方法及相关设备
[0001]本说明书涉及人工智能语言
,尤其涉及一种文章生成方法、文章生成模型训练方法及相关设备。
技术介绍
[0002]在信息迭代发展的今天,即使是“读书破万卷”的人也很难做到不知疲倦地学习,能够随时随地收集和生产内容是每一个创作者的共同目标。让机器人像人一样表达和创作,是人工智能的重要愿景之一,实现这一愿景的核心
之一是智能写作。智能写作近年来在技术上发展迅速,在应用中也体现出愈发重要的价值,例如,利用机器人对新闻事件进行智能撰稿。
[0003]相关技术中,利用机器人智能撰稿时通常采用以下方式:一种是利用文章相关信息训练深度神经网络模型,进而利用训练的深度神经网络模型生成文章。这种方式由于完全依赖深度神经网络,因此生成的文章内容不可控,容易出现语义不通顺的现象。另一种是通过人工在特定领域设置特定的模板,从而将文章信息按照模板方式进行填充,完善文章内容。这种方式虽然可读性较高,但多样性较差,每次所生成的文章行文方式基本是固定的,如果涉及新的文章领域,就需要依赖人力再单独设计新的模板,耗时耗力。
技术实现思路
[0004]本申请实施例的目的是提供一种文章生成方法、文章生成模型训练方法及相关设备,用以解决现有技术中智能生成的文章语义连贯性差以及多样性差的问题。
[0005]为解决上述技术问题,本申请实施例是这样实现的:
[0006]一方面,本申请实施例提供一种文章生成方法,包括:
[0007]获取目标事件的事件关键 ...
【技术保护点】
【技术特征摘要】
1.一种文章生成方法,其特征在于,包括:获取目标事件的事件关键信息;将所述事件关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述事件关键信息相匹配的目标历史语句数据;所述文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据;将所述事件关键信息和所述目标历史语句数据输入预先训练的文章生成模型中,得到所述事件关键信息对应的目标文章。2.根据权利要求1所述的方法,其特征在于,所述事件关键信息包括至少一个关键信息元素;与所述事件关键信息相匹配的目标历史语句数据包括所述至少一个关键信息元素中每个关键信息元素对应的子目标历史语句数据;所述将所述事件关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述事件关键信息相匹配的目标历史语句数据,包括:计算每个关键信息元素和每个历史语句数据之间的第一相似度;根据所述每个关键信息元素和每个历史语句数据之间的第一相似度,从所述文章数据库中筛选出每个关键信息元素对应的子目标历史语句数据;任意一个关键信息元素对应的子目标历史语句数据与所述任意一个关键信息元素之间的第一相似度大于或等于第一预设阈值。3.根据权利要求1所述的方法,其特征在于,所述事件关键信息包括至少一个关键信息元素;与所述事件关键信息相匹配的目标历史语句数据包括所述至少一个关键信息元素中每个关键信息元素对应的子目标历史语句数据;所述将所述事件关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述事件关键信息相匹配的目标历史语句数据,包括:从所述文章数据库中确定多个第一历史文章;计算所述事件关键信息和所述多个第一历史文章之间的第二相似度;根据所述事件关键信息和所述多个第一历史文章之间的第二相似度,从所述多个第一历史文章中筛选出第二历史文章;所述第二历史文章与所述事件关键信息之间的第二相似度大于或等于第二预设阈值;计算每个关键信息元素和所述第二历史文章中每个历史语句数据之间的第三相似度;根据所述每个关键信息元素和所述第二历史文章中每个历史语句数据之间的第三相似度,从所述第二历史文章中筛选出每个关键信息元素对应的子目标历史语句数据;任意一个关键信息元素对应的子目标历史语句数据与所述任意一个关键元素信息之间的第三相似度大于或等于第三预设阈值。4.根据权利要求3所述的方法,其特征在于,每个历史文章对应各自的文章类别;所述从所述文章数据库中确定多个第一历史文章,包括:确定所述目标事件对应的事件类别;将所述事件类别和所述文章数据库中每个历史文章的文章类别进行匹配处理,确定与所述事件类别相匹配的目标文章类别;确定所述文章数据库中与所述目标文章类别对应的历史文章为多个第一历史文章。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
采集待更新的文章相关内容;所述文章相关内容包括已发布的文章和/或指定类型的字符;在所述文章数据库满足预设更新条件时,基于所述文章相关内容更新所述文章数据库;所述预设更新条件包括以下至少一项:所述已发布的文章数量达到预设阈值、所述文章数据库的上一次更新时间距离当前时间达到预设时长、所述历史文章中存在至少一个所述指定类型的字符被更新。6.根据权利要求2或3所述的方法,其特征在于,每个关键信息元素包括符合预设信息结构的关键信息字段和关键信息内容;所述获取目标事件的事件关键信息,包括:确定与所述目标事件的事件类别相匹配的关键信息字段;获取所述目标事件对应的、且与所述关键信息字段相匹配的关键信息内容;按照所述预设信息结构,对每个关键信息字段及其对应的关键信息内容进行结构化处理,得到所述事件关键信息。7.一种文章生成模型训练方法,其特征在于,包括:获取样本文章,并对所述样本文章进行语义分析,确定所述样本文章对应的样本关键信息;将所述样本关键信息和预先创建的文章数据库进行匹配处理,从所述文章数据库中筛选出与所述样本关键信息相匹配的样本历史语句数据;所述文章数据库中包括多个历史文章,每个历史文章包括至少一个历史语句数据;将所述样本关键信息和所述样本历史语句数据作为待训练的文章生成模型的输入数据,得到所述样本关键信息对应的预测文章数据;基于所述预测文章数据和所述样本文章对所述待训练的文章生成模型进行训练,训练后的文章生成模型用于根据目标事件的事件关键信息和目标历史语句信息生成所述事件关键信息对应的目标文章;所述目标历史语句数据是将所述事件关键信息和所述文章数据库进行匹配处理,从所述文章数据库中筛选出的与所述事件关键...
【专利技术属性】
技术研发人员:吕乐宾,蒋宁,肖冰,李宽,丁隆耀,
申请(专利权)人:马上消费金融股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。