文本自动化生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:27468114 阅读:21 留言:0更新日期:2021-03-02 17:32
本发明专利技术实施例提供一种文本自动化生成方法、装置、电子设备及存储介质,首先分别获取待生成文本的关键词以及估算语句数量;然后基于所述关键词、所述估算语句数量以及预先构建的词语关联图谱,确定所述待生成文本的段落数量以及段落主题词;最后基于Transfromer模型、所述待生成文本的段落数量以及段落主题词,生成所述待生成文本。这是通过Transformer模型实现的一种新型的文本生成方法,引入了段落主题词的筛选确定,可以实现对生成文本主题的扩展与约束,使得生成的文本具有核心思想;同时利用Transformer模型,可以使生成的文本不再像传统方法生成的文本那样内容单一、格式固定。格式固定。格式固定。

【技术实现步骤摘要】
文本自动化生成方法、装置、电子设备及存储介质


[0001]本专利技术涉及人工智能
,尤其涉及一种文本自动化生成方法、装置、电子设备及存储介质。

技术介绍

[0002]目前,基于人工智能(Artificial Intelligence,AI)实现的文本生成是自然语言处理领域的一项具有挑战性的任务,其目的是让计算机能够像人一样写出高质量的文章。这就要求采用的模型拥有更强大的理解、生成文本的能力。传统的文本生成方法有两种,一种是基于规则和模板的生成方法,一种是基于抽取的生成方法,这两种方法生成的文本格式都比较固定,不能生成内容丰富、风格多样的文本。

技术实现思路

[0003]本专利技术实施例提供一种文本自动化生成方法、装置、电子设备及存储介质,用以解决现有技术中存在的缺陷。
[0004]本专利技术实施例提供一种文本自动化生成方法,包括:
[0005]分别获取待生成文本的关键词以及估算语句数量;
[0006]基于所述关键词、所述估算语句数量以及预先构建的词语关联图谱,确定所述待生成文本的段落数量以及段落主题本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种文本自动化生成方法,其特征在于,包括:分别获取待生成文本的关键词以及估算语句数量;基于所述关键词、所述估算语句数量以及预先构建的词语关联图谱,确定所述待生成文本的段落数量以及段落主题词;基于Transfromer模型、所述待生成文本的段落数量以及段落主题词,生成所述待生成文本。2.根据权利要求1所述的文本自动化生成方法,其特征在于,所述基于所述关键词、所述估算语句数量以及预先构建的词语关联图谱,确定所述待生成文本的段落数量以及段落主题词,具体包括:若判断获知所述关键词以及所述估算语句数量满足第一条件,则确定所述段落数量为默认数量,并基于所述词语关联图谱,确定与每个关键词具有相关关系的词语构成的相关词语列表;对所有关键词对应的相关词语列表进行汇总,确定主题词语列表;基于所述估算语句数量,确定词语保留数量,并基于所述主题词语列表中所述词语保留数量的词语,确定所述段落主题词。3.根据权利要求1所述的文本自动化生成方法,其特征在于,所述基于所述关键词、所述估算语句数量以及预先构建的词语关联图谱,确定所述待生成文本的段落数量以及段落主题词,具体包括:若判断获知所述关键词以及所述估算语句数量满足第二条件,则确定所述段落数量为默认数量,并基于所述词语关联图谱,确定与每个关键词具有相关关系的词语数量;若任一所述关键词对应的所述词语数量小于等于第一预设阈值,则基于所述词语关联图谱,确定所述任一关键词具有相似关系的相似词语,并基于所述词语关联图谱,确定每个相似词语的相关词语列表;对所有相关词语列表进行汇总,确定主题词语列表;若判断获知所述主题词语列表中的词语数量大于等于第二预设阈值,则基于所述主题词语列表中的词语,确定所述段落主题词。4.根据权利要求1所述的文本自动化生成方法,其特征在于,所述基于所述关键词、所述估算语句数量以及预先构建的词语关联图谱,确定所述待生成文本的段落数量以及段落主题词,具体包括:若判断获知所述关键词以及所述估算语句数量满足第三条件,则基于所述词语关联图谱,确定与每个关键词具有相关关系的词语构成的相关词语列表;对所有关键词对应的相关词语列表进行汇总,确定主题词语列表;基于所述估算语句数量,确定词语保留数量,并基于所述主题词语列表中所述词语保留数量的词语,确定所述段落主题词;对所...

【专利技术属性】
技术研发人员:夏维孙赫张恒高鹏
申请(专利权)人:中译语通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1