基于多模态大模型的文档生成方法、装置、设备及介质制造方法及图纸

技术编号:43884116 阅读:28 留言:0更新日期:2024-12-31 19:09
本申请提供一种基于多模态大模型的文档生成方法、装置、设备及介质,涉及数据处理领域。本申请方法通过结合多模态大模型和文本解析器,实现了对输入文本的自动化大纲提取和结构化处理,进而文档生成模型通过自适应元素匹配技术,将结构化文本和其属性智能匹配到最合适的演示文档模板上,不仅减少了手动调整模板和内容的时间,还增加了演示文档模板的多样性,从而显著提高了演示文档的生成效率和成果质量。

【技术实现步骤摘要】

本申请涉及数据处理领域,尤其涉及一种基于多模态大模型的文档生成方法、装置、设备及介质


技术介绍

1、在金融领域中,营销类场景的ppt都是基于ppt模板结构的方法生成,用户通过将ppt文案内容结构化,在特定字段,例如主标题、副标题、内容、数据等,填入相应的内容,再通过字段的名称和个数匹配相应的ppt模板。

2、现有ppt生成方法虽然省去了用户制作ppt的大部分过程,但是ppt的内容都需要手动输入;且由于模板个数有限制,而ppt内容的形式多种多样,同时受限于ppt内容的字数、ppt内容的形式,容易导致ppt模板和ppt内容不匹配的问题,需要人为对ppt模板或ppt内容进行调整,使得ppt生成效率低下。

3、因此,如何提高演示文档的生成效率成为目前亟待解决的技术问题。


技术实现思路

1、本申请提供了一种基于多模态大模型的文档生成方法、装置、设备及介质,旨在提高演示文档的生成效率。

2、第一方面,本申请提供一种基于多模态大模型的文档生成方法,所述基于多模态大模型的文档生成方法包括本文档来自技高网...

【技术保护点】

1.一种基于多模态大模型的文档生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于多模态大模型的文档生成方法,其特征在于,所述基于多模态大模型,对输入文本进行大纲内容提取,并对提取的大纲内容进行结构化处理,输出结构化文本,包括:

3.根据权利要求1所述的基于多模态大模型的文档生成方法,其特征在于,所述基于多模态大模型,对输入文本进行大纲内容提取,并对提取的大纲内容进行结构化处理,输出结构化文本之前,还包括:

4.根据权利要求3所述的基于多模态大模型的文档生成方法,其特征在于,所述基于第一数据集,对图片分类模型进行图像单模态训练,直至所述图...

【技术特征摘要】

1.一种基于多模态大模型的文档生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的基于多模态大模型的文档生成方法,其特征在于,所述基于多模态大模型,对输入文本进行大纲内容提取,并对提取的大纲内容进行结构化处理,输出结构化文本,包括:

3.根据权利要求1所述的基于多模态大模型的文档生成方法,其特征在于,所述基于多模态大模型,对输入文本进行大纲内容提取,并对提取的大纲内容进行结构化处理,输出结构化文本之前,还包括:

4.根据权利要求3所述的基于多模态大模型的文档生成方法,其特征在于,所述基于第一数据集,对图片分类模型进行图像单模态训练,直至所述图片分类模型的损失值收敛,包括:

5.根据权利要求3所述的基于多模态大模型的文档生成方法,其特征在于,所述基于第二数据集,对所述图片分类模型和预训练的第一语言模型进行图像文本多模态训练,直至所述图片分类模型和所述第一语言模型的损失值收敛,包括:

6.根据权利要求...

【专利技术属性】
技术研发人员:舒畅陈远旭
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1