一种用于采销系统的多模态OCR系统及方法技术方案

技术编号:46576432 阅读:1 留言:0更新日期:2025-10-10 21:19
本发明专利技术涉及多模态OCR技术领域,具体为一种用于采销系统的多模态OCR系统及方法,包括:图像采集模块,多模态特征提取模块,数据融合模块,识别与分析模块,反馈与优化模块;有益效果为:通过构建一种用于采销系统的多模态OCR系统,实现文本识别,其技术领域具有交叉性和综合性,广泛应用于企业生产中,极大提高办公自动化。多模态OCR涉及对图像中文本的检测、定位和识别,通过计算机视觉技术处理图像信息,利用模式识别算法提取文本特征,属于该领域的重要应用。该技术学习多模态数据与文本之间的映射关系,需要对识别出的文本进行语义理解和分析,以提高识别准确率和处理复杂文本场景。

【技术实现步骤摘要】

本专利技术涉及多模态ocr,具体为一种用于采销系统的多模态ocr系统及方法。


技术介绍

1、在当今数字化时代,采销系统对于企业的运营至关重要。传统采销流程中,涉及大量的纸质文档,如采购订单、销售发票、合同等,这些文档的信息提取主要依赖人工录入,效率低下且容易出错。

2、随着ocr技术的发展,其在采销系统中的应用逐渐增多,但传统ocr技术在处理复杂文档时存在局限性。例如,当文档中存在手写文字、多种语言混合、图像与文字结合紧密等情况时,识别准确率大幅下降。此外,采销系统中的文档版式多样,传统ocr难以适应不同版式的快速变化。在采购订单中,可能存在供应商自定义的格式,传统ocr无法有效识别其中关键信息。因此,开发一种能够适应采销系统复杂需求的多模态ocr技术具有重要意义。


技术实现思路

1、本专利技术的目的在于提供一种用于采销系统的多模态ocr系统及方法,以解决上述
技术介绍
中提出的问题。

2、为实现上述目的,本专利技术提供如下技术方案:一种用于采销系统的多模态ocr系统,包括:

本文档来自技高网...

【技术保护点】

1.一种用于采销系统的多模态OCR系统,其特征在于:包括:

2.根据权利要求1所述的一种用于采销系统的多模态OCR系统,其特征在于:多模态特征提取模块中,视觉特征提取子模块、语义特征提取子模块和布局特征提取子模块可并行处理,以提高特征提取效率。

3.根据权利要求2所述的一种用于采销系统的多模态OCR系统,其特征在于:数据融合模块中,根据不同类型文档的特点,动态调整视觉特征、语义特征和布局特征的融合权重,以适应采销系统中多样化的文档需求。

4.根据权利要求3所述的一种用于采销系统的多模态OCR系统,其特征在于:识别与分析模块中,OCR识别子模块采用迁移学...

【技术特征摘要】

1.一种用于采销系统的多模态ocr系统,其特征在于:包括:

2.根据权利要求1所述的一种用于采销系统的多模态ocr系统,其特征在于:多模态特征提取模块中,视觉特征提取子模块、语义特征提取子模块和布局特征提取子模块可并行处理,以提高特征提取效率。

3.根据权利要求2所述的一种用于采销系统的多模态ocr系统,其特征在于:数据融合模块中,根据不同类型文档的特点,动态调整视觉特征、语义特征和布局特征的融合权重,以适应采销系统中多样化的文档需求。

4.根据权利要求3所述的一种用于采销系统的多模态ocr系统,其特征在于:识别与分析模块中,ocr识别子模块采用迁移学习技术,利用大规模公开数据集进行预训练,再针对采销系统的特定数据进行微调,以加快模型收敛速度,提高识别效果。

5.根据权利要求4所述的一种用于采销系统的多模态ocr系统,其特征在于:反馈与优化模块中,系统自动记录用户的纠正操作和反馈意见,定期对反馈数据进行分析总结,针对性地改进模型训练过...

【专利技术属性】
技术研发人员:李洋
申请(专利权)人:浪潮智慧供应链科技山东有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1