【技术实现步骤摘要】
本专利技术涉及智能模型,尤其是涉及一种公文写作模型训练方法及装置、介质、设备。
技术介绍
1、大语言模型近年来飞速发展,例如,chatgpt、文心一言等开源模型,它们是通过在海量文本数据上进行预训练,进而学习到了丰富的语言表示,能够完成文本生成、文本分类、问答系统等任务。因此可以基于大语言模型强大的文本生成能力,提供一种能够实现公文写作的智能模型。
技术实现思路
1、针对以上至少一个技术问题,本专利技术实施例提供一种公文写作模型训练方法及装置、介质、设备。
2、根据第一方面,本专利技术实施例提供的公文写作模型训练方法包括:
3、通过网络爬虫技术获取多种公文类型的公文数据;
4、对所述公文数据进行清洗;
5、基于清洗后的公文数据,构造训练集;其中,所述训练集中包括多条训练样本,每一条训练样本包括任务指令、用户输入信息和公文信息;
6、根据所述训练集,进行模型训练,得到公文写作模型;其中,所述公文写作模型能够在应用场景中基于用户输入信
...【技术保护点】
1.一种公文写作模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述公文类型包括通知、公告、纪要、意见和议案中的至少两种。
3.根据权利要求1所述的方法,其特征在于,所述对所述公文数据进行清洗,包括:
4.根据权利要求1所述的方法,其特征在于,所述公文大纲包括普通大纲和长篇大纲,所述普通大纲的篇幅小于所述长篇大纲的篇幅;
5.根据权利要求4所述的方法,其特征在于,在所述普通大纲对应的模板中的任务指令涉及到的元素包括主题、关键词、时间、地点、公文类型、公文标题和大纲目录,所述用户输入信息为所述任
...【技术特征摘要】
1.一种公文写作模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述公文类型包括通知、公告、纪要、意见和议案中的至少两种。
3.根据权利要求1所述的方法,其特征在于,所述对所述公文数据进行清洗,包括:
4.根据权利要求1所述的方法,其特征在于,所述公文大纲包括普通大纲和长篇大纲,所述普通大纲的篇幅小于所述长篇大纲的篇幅;
5.根据权利要求4所述的方法,其特征在于,在所述普通大纲对应的模板中的任务指令涉及到的元素包括主题、关键词、时间、地点、公文类型、公文标题和大纲目录,所述用户输入信息为所述任务指令中各个元素对应的内容;所述普通大纲为满足所述任务指令和所述用户输入信息的大纲。
6.根据权利要求4所述的方法,其特征在于,在所述长篇大纲对应的模板中的任务指令涉及到的元素包括主题、关键词、时间、地点、公文类型、公文...
【专利技术属性】
技术研发人员:闫茂松,陈建国,蒋豪禹,
申请(专利权)人:浪潮云信息技术股份公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。