公文写作模型训练方法及装置、介质、设备制造方法及图纸

技术编号:43366351 阅读:16 留言:0更新日期:2024-11-19 17:48
本发明专利技术提供一种公文写作模型训练方法及装置、介质、设备。该方法包括:通过网络爬虫技术获取多种公文类型的公文数据;对所述公文数据进行清洗;基于清洗后的公文数据,构造训练集;其中,所述训练集中包括多条训练样本,每一条训练样本包括任务指令、用户输入信息和公文信息;根据所述训练集,进行模型训练,得到公文写作模型;其中,所述公文写作模型能够在应用场景中基于用户输入信息和任务指令,生成公文大纲,并对所述公文大纲进行内容填充,得到对应的公文信息。基于本发明专利技术实施例可以得到一种公文写作模型。

【技术实现步骤摘要】

本专利技术涉及智能模型,尤其是涉及一种公文写作模型训练方法及装置、介质、设备


技术介绍

1、大语言模型近年来飞速发展,例如,chatgpt、文心一言等开源模型,它们是通过在海量文本数据上进行预训练,进而学习到了丰富的语言表示,能够完成文本生成、文本分类、问答系统等任务。因此可以基于大语言模型强大的文本生成能力,提供一种能够实现公文写作的智能模型。


技术实现思路

1、针对以上至少一个技术问题,本专利技术实施例提供一种公文写作模型训练方法及装置、介质、设备。

2、根据第一方面,本专利技术实施例提供的公文写作模型训练方法包括:

3、通过网络爬虫技术获取多种公文类型的公文数据;

4、对所述公文数据进行清洗;

5、基于清洗后的公文数据,构造训练集;其中,所述训练集中包括多条训练样本,每一条训练样本包括任务指令、用户输入信息和公文信息;

6、根据所述训练集,进行模型训练,得到公文写作模型;其中,所述公文写作模型能够在应用场景中基于用户输入信息和任务指令,生成公本文档来自技高网...

【技术保护点】

1.一种公文写作模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述公文类型包括通知、公告、纪要、意见和议案中的至少两种。

3.根据权利要求1所述的方法,其特征在于,所述对所述公文数据进行清洗,包括:

4.根据权利要求1所述的方法,其特征在于,所述公文大纲包括普通大纲和长篇大纲,所述普通大纲的篇幅小于所述长篇大纲的篇幅;

5.根据权利要求4所述的方法,其特征在于,在所述普通大纲对应的模板中的任务指令涉及到的元素包括主题、关键词、时间、地点、公文类型、公文标题和大纲目录,所述用户输入信息为所述任务指令中各个元素对应...

【技术特征摘要】

1.一种公文写作模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述公文类型包括通知、公告、纪要、意见和议案中的至少两种。

3.根据权利要求1所述的方法,其特征在于,所述对所述公文数据进行清洗,包括:

4.根据权利要求1所述的方法,其特征在于,所述公文大纲包括普通大纲和长篇大纲,所述普通大纲的篇幅小于所述长篇大纲的篇幅;

5.根据权利要求4所述的方法,其特征在于,在所述普通大纲对应的模板中的任务指令涉及到的元素包括主题、关键词、时间、地点、公文类型、公文标题和大纲目录,所述用户输入信息为所述任务指令中各个元素对应的内容;所述普通大纲为满足所述任务指令和所述用户输入信息的大纲。

6.根据权利要求4所述的方法,其特征在于,在所述长篇大纲对应的模板中的任务指令涉及到的元素包括主题、关键词、时间、地点、公文类型、公文...

【专利技术属性】
技术研发人员:闫茂松陈建国蒋豪禹
申请(专利权)人:浪潮云信息技术股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1