【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种基于大模型的线下资料数字化方法、系统及存储介质。
技术介绍
1、在当今信息时代,尽管电子信息技术飞速发展,但大量的线下资料仍然广泛存在。线下资料涵盖各类纸质文档,如书籍、档案、合同、手稿等,线下资料承载着丰富的知识、历史信息以及重要的业务数据。然而,线下资料在实际使用和管理过程中暴露出诸多问题。首先,在存储方面,纸质资料需要大量的物理空间,随着资料数量的不断增加,存储场地的成本急剧上升。同时,纸质资料容易受到自然环境因素的影响,如潮湿、火灾、虫蛀等,导致资料的损坏和信息的丢失,严重影响其长期保存的稳定性。因此,将线下资料进行数字化成为必然趋势。
2、现有的线下资料数字化过程中,一般是采用人工的方式进行资料数字化,导致人工操作繁琐,降低了线下资料数字化效率。
技术实现思路
1、本专利技术实施例的目的在于提供一种基于大模型的线下资料数字化方法、系统及存储介质,以解决现有技术中线下资料数字化效率低下的问题。
2、本专利技术实施例是这样实
...【技术保护点】
1.一种基于大模型的线下资料数字化方法,其特征在于,所述方法包括:
2.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,对所述待数字化线下资料进行文本识别,得到线下文档,包括:
3.如权利要求2所述的基于大模型的线下资料数字化方法,其特征在于,根据所述文本预测结果确定目标文本框,包括:
4.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,将所述资料数字化提示输入预训练后的大模型进行内容抽取之前,还包括:
5.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,对所述待数字化线下资料进
...【技术特征摘要】
1.一种基于大模型的线下资料数字化方法,其特征在于,所述方法包括:
2.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,对所述待数字化线下资料进行文本识别,得到线下文档,包括:
3.如权利要求2所述的基于大模型的线下资料数字化方法,其特征在于,根据所述文本预测结果确定目标文本框,包括:
4.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,将所述资料数字化提示输入预训练后的大模型进行内容抽取之前,还包括:
5.如权利要求1所述的基于大模型的线下资料数字化方法,其特征在于,对所述待数字化线下资料进行文本识别,得到线下文档之后,还包括:
...
【专利技术属性】
技术研发人员:杨兴云,黄伟,陈吉胜,
申请(专利权)人:云知声智能科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。