【技术实现步骤摘要】
本专利技术涉及计算机视觉及图像处理领域,具体涉及一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,尤其针对通过畸变校正(dewarp)处理的图像,结合几何距离与文本相似度的综合评估,实现ocr畸变校正算法效果的精准量化分析。
技术介绍
1、目前,ocr技术在处理经过畸变校正(如畸变校正)图像时存在一定的挑战。特别是在图像经过畸变校正处理后,图像尺寸和位置可能会发生变化,导致ocr识别结果与原始图像的对应关系不再线性。由于缺乏有效的评估标准,现有技术无法精确衡量畸变校正处理后,在使用时还存在以下问题:
2、1、评估标准单一:传统方法仅通过像素对比或简单误差分析评估畸变校正效果,忽略文本语义与空间关系的关联性。
3、2、匹配精度不足:未有效结合文本框(bbox)的几何位置(如中心点欧氏距离、交并比)与文本内容(如编辑距离)的综合匹配。
4、3、动态适应性差:权重系数和评估阈值固定,无法适配不同场景(如医疗文档、票据识别)的差异化需求。
5、4、异常数据敏感:ocr识别中的缺失文本框或
...【技术保护点】
1.一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法,其特征在于,所述几何距离dgeom通过以下方式计算:
3.根据权利要求1所述的一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法,其特征在于,所述文本相似度距离dtext通过归一化编辑距离计算,公式为:
4.根据权利要求1所述的一种基于多模态距离协同优化的OCR弯曲文档矫正性能检测方法,其特征在于,所述权重系数α和β根据实际应用场景动态调整,具体通过以
...【技术特征摘要】
1.一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,其特征在于,所述几何距离dgeom通过以下方式计算:
3.根据权利要求1所述的一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,其特征在于,所述文本相似度距离dtext通过归一化编辑距离计算,公式为:
4.根据权利要求1所述的一种基于多模态距离协同优化的ocr弯曲文档矫正性能检测方法,其特征在于,所述权重系数α和β根据实际应用场景动态调整,具体通过以下步骤实现:
5.根据权利...
【专利技术属性】
技术研发人员:张昶,姜博怀,
申请(专利权)人:成都哈瑞特医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。