【技术实现步骤摘要】
一种文本生成方法及设备
[0001]本申请涉及计算机
,尤其涉及一种文本生成方法及设备。
技术介绍
[0002]日常生活中常会对报告、通知、简报等具备统一格式或相似风格文章进行编写或改写,通常在编写或改写过程中需要人工进行研究、整理、编辑、润色等,耗费大量时间和精力,并且在人工处理过程中,会面临信息筛选、结构安排、语言表达等多个问题,导致编写效率低下,且文章质量参差不齐。
[0003]在现有技术中,常用模板填充法生成文本,模板填充是一种基于模板和占位符的文本生成技术,其原理为通过将特定的值插入到模板的占位符中来生成文本,并且在模板中包含预定义文本和占位符的字符串,占位符可以被替换为特定的值,具体填充方法如下:
[0004]1.字符串格式化:使用字符串格式化函数将特定值插入到字符串中的占位符中。例如,Python中的字符串格式化可以使用“%”运算符或者.format()方法来实现。
[0005]2.文本模板引擎:使用文本模板引擎来实现模板填充。常见的文本模板引擎包括Jinja2和Mustache等 ...
【技术保护点】
【技术特征摘要】
1.一种文本生成方法,其中,所述方法包括:将获取的样例文本输入至用于识别文本结构的自然语言处理模型,生成用于指示所述样例文本的文章大纲的结构树,所述结构树包括每个节点及其对应的原有文本内容和结构类型;获取用户输入的待生成文本的文本主题;将所述结构树、所述文本主题作为提示词,输入至所述自然语言处理模型,对所述结构树进行改写,得到新的结构树,所述新的结构树包括每个所述节点及其对应的段落主旨和结构类型;将所述新的结构树中的每个所述节点的段落主旨和所述用户输入的描述信息作为提示词,输入至所述自然语言处理模型,逐个生成每个所述节点对应的新文本内容。2.根据权利要求1所述的方法,其中,所述将获取的样例文本输入至用于识别文本结构的自然语言处理模型,生成用于指示所述样例文本的文章大纲的结构树,所述结构树包括每个节点及其对应的原有文本内容和结构类型,包括:获取样例文本;通过用于识别文本结构的自然语言处理模型,对所述样例文本进行分词,以将所述样例文本转化为相互独立的单词;分别对所述样例文本中的每个句子中的各单词进行标记化处理,得到每个句子中的各单词对应的标记符;使用多层变换模型Transformer网络,分别对每个所述句子中的各单词对应的标记符进行编码,生成每个所述句子对应的高维向量;将每个所述句子对应的高维向量输入至已训练好的分类器,进行每个所述句子所属的结构类型的判断与分类,得到每个所述句子对应的结构类型;构建一棵空的结构树,将所述样例文本的文章标题作为所述空的结构树的根节点;遍历所述样例文本中的每个所述句子,按照所述结构类型的逻辑关系,将每个所述句子插入到所述空的结构树中,生成所述样例文本对应的文档结构树;遍历样例文本对应的文档结构树,将所述文档结构树中的...
【专利技术属性】
技术研发人员:张炯,王沛泓,田远,葛翔,刘瑾,贾雪丽,贾雪娜,
申请(专利权)人:上海星图比特信息技术服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。