一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法技术

技术编号:45905858 阅读:17 留言:0更新日期:2025-07-22 21:30
本发明专利技术公开了一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法,涉及计算机视觉及图像处理领域,包括以下步骤:S1、构造代价矩阵;S2、最优匹配计算;S3、性能评估;通过融合几何距离与文本相似度的加权代价矩阵,结合匈牙利算法实现最优匹配,并支持动态参数调整与异常数据处理,以精准量化畸变校正算法对OCR识别效果的提升或退化。

【技术实现步骤摘要】

本专利技术涉及计算机视觉及图像处理领域,具体涉及一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,尤其针对通过畸变校正(dewarp)处理的图像,结合几何距离与文本相似度的综合评估,实现ocr畸变校正算法效果的精准量化分析。


技术介绍

1、目前,ocr技术在处理经过畸变校正(如畸变校正)图像时存在一定的挑战。特别是在图像经过畸变校正处理后,图像尺寸和位置可能会发生变化,导致ocr识别结果与原始图像的对应关系不再线性。由于缺乏有效的评估标准,现有技术无法精确衡量畸变校正处理后,在使用时还存在以下问题:

2、1、评估标准单一:传统方法仅通过像素对比或简单误差分析评估畸变校正效果,忽略文本语义与空间关系的关联性。

3、2、匹配精度不足:未有效结合文本框(bbox)的几何位置(如中心点欧氏距离、交并比)与文本内容(如编辑距离)的综合匹配。

4、3、动态适应性差:权重系数和评估阈值固定,无法适配不同场景(如医疗文档、票据识别)的差异化需求。

5、4、异常数据敏感:ocr识别中的缺失文本框或文本错误会导致匹配结本文档来自技高网...

【技术保护点】

1.一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法,其特征在于,所述几何距离dgeom通过以下方式计算:

3.根据权利要求1所述的一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法,其特征在于,所述文本相似度距离dtext通过归一化编辑距离计算,公式为:

4.根据权利要求1所述的一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法,其特征在于,所述权重系数α和β根据实际应用场景动态调整,具体通过以下步骤实现:

...

【技术特征摘要】

1.一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,其特征在于,所述几何距离dgeom通过以下方式计算:

3.根据权利要求1所述的一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,其特征在于,所述文本相似度距离dtext通过归一化编辑距离计算,公式为:

4.根据权利要求1所述的一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,其特征在于,所述权重系数α和β根据实际应用场景动态调整,具体通过以下步骤实现:

5.根据权利...

【专利技术属性】
技术研发人员:张昶姜博怀
申请(专利权)人:成都哈瑞特医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1