基于大模型的线下资料数字化方法、系统及存储介质技术方案

技术编号:45310955 阅读:41 留言:0更新日期:2025-05-16 14:53
本发明专利技术提供了一种基于大模型的线下资料数字化方法、系统及存储介质,该方法包括:对待数字化线下资料进行文本识别,得到线下文档;将内容抽取需求与线下文档进行组合,得到资料数字化提示;将资料数字化提示输入预训练后的大模型进行内容抽取,得到资料抽取数据,对资料抽取数据进行数据校验;将数据校验后的资料抽取数据填充至线上资料模板中。本发明专利技术实施例,通过对待数字化线下资料进行文本识别,使得无需采用人工的方式进行文本的复制和粘贴,通过将资料数字化提示输入预训练后的大模型进行内容抽取,以基于大模型强大的推理能力对线下文档进行内容的自动抽取,无需采用人工的方式进行内容抽取,提高了下资料数字化效率。

【技术实现步骤摘要】

本专利技术涉及数据处理,尤其涉及一种基于大模型的线下资料数字化方法、系统及存储介质


技术介绍

1、在当今信息时代,尽管电子信息技术飞速发展,但大量的线下资料仍然广泛存在。线下资料涵盖各类纸质文档,如书籍、档案、合同、手稿等,线下资料承载着丰富的知识、历史信息以及重要的业务数据。然而,线下资料在实际使用和管理过程中暴露出诸多问题。首先,在存储方面,纸质资料需要大量的物理空间,随着资料数量的不断增加,存储场地的成本急剧上升。同时,纸质资料容易受到自然环境因素的影响,如潮湿、火灾、虫蛀等,导致资料的损坏和信息的丢失,严重影响其长期保存的稳定性。因此,将线下资料进行数字化成为必然趋势。

2、现有的线下资料数字化过程中,一般是采用人工的方式进行资料数字化,导致人工操作繁琐,降低了线下资料数字化效率。


技术实现思路

1、本专利技术实施例的目的在于提供一种基于大模型的线下资料数字化方法、系统及存储介质,以解决现有技术中线下资料数字化效率低下的问题。

2、本专利技术实施例是这样实现的,一种基于大模型本文档来自技高网...

【技术保护点】

1.一种基于大模型的线下资料数字化方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,对所述待数字化线下资料进行文本识别,得到线下文档,包括:

3.如权利要求2所述的基于大模型的线下资料数字化方法,其特征在于,根据所述文本预测结果确定目标文本框,包括:

4.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,将所述资料数字化提示输入预训练后的大模型进行内容抽取之前,还包括:

5.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,对所述待数字化线下资料进行文本识别,得到线下...

【技术特征摘要】

1.一种基于大模型的线下资料数字化方法,其特征在于,所述方法包括:

2.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,对所述待数字化线下资料进行文本识别,得到线下文档,包括:

3.如权利要求2所述的基于大模型的线下资料数字化方法,其特征在于,根据所述文本预测结果确定目标文本框,包括:

4.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,将所述资料数字化提示输入预训练后的大模型进行内容抽取之前,还包括:

5.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,对所述待数字化线下资料进行文本识别,得到线下文档之后,还包括:

...

【专利技术属性】
技术研发人员:杨兴云黄伟陈吉胜
申请(专利权)人:云知声智能科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1