当前位置: 首页 > 专利查询>西北大学专利>正文

一种基于YOLO模型的古契约文书文字识别方法技术

技术编号:42182401 阅读:38 留言:0更新日期:2024-07-30 18:35
本发明专利技术公开了一种基于YOLO模型的古契约文书文字识别方法,通过使用少样本、多类别数据集分别训练一个目标检测模型和一个分类模型,级联两个模型可以单独训练和优化,提供较高的灵活性,目标检测模型仅检测图像中的所有目标,并找到它们的位置信息,并不会直接识别出它们的类别;分类模型仅识别所有目标区域中的目标类别;相比传统的依赖单模型完成少样本、多类别数据集的检测识别方法,级联方式能够更好的定位目标、并识别其类别,具有更强的灵活性、泛用性及准确率。

【技术实现步骤摘要】

本专利技术涉及深度学习与目标检测,具体涉及一种基于yolo模型的古契约文书文字识别方法。


技术介绍

1、少样本多类别的目标检测问题属于计算机视觉领域问题,其一般定义为:在一个含有少量样本(不超过1000张图片)的数据集中,每张图片中都含有大量的目标(200个以上)待识别,且数据集中含有的类别不少于1500个;任务是训练模型,使其能够在这些少量样本的基础上学习到每个类别的特征,并能够在新的图像中准确检测和识别这些类别的目标。

2、目前,目标检测领域所包含的算法通常分为一阶段检测算法(如you only lookonce(yolo)算法,直接在网络的最后输出目标的类别和位置信息)和两阶段检测算法(如fast-r-cnn,首先生成一系列候选区域,之后再对这些候选区域进行分类和边界框回归)。一阶段检测算法相较于两阶段检测算法速度更快,但精度稍差。然而,这些模型目前在少样本、含有大量类别的数据集上表现较差。因此需要设计新的方法来提高在这些数据集上的目标识别准确率。


技术实现思路

1、为了克服现有技术在少样本本文档来自技高网...

【技术保护点】

1.一种基于YOLO模型的古契约文书文字识别方法,其特征在于包括以下步骤:

2.如权利要求1所述的基于YOLO模型的古契约文书文字识别方法,其特征在于:所述步骤1中YOLO格式标签文件,以“.txt”为文件扩展名,且单个标签信息为<类别信息><目标中心点x坐标><目标中心点y坐标><目标的宽带><目标的高度>,其中目标的坐标信息均已归一化处理。

3.如权利要求1所述的基于YOLO模型的古契约文书文字识别方法,其特征在于:所述步骤3中所述YOLO目标检测模型为采用可变形卷积CSP模块替换YOLO目标检测模型...

【技术特征摘要】

1.一种基于yolo模型的古契约文书文字识别方法,其特征在于包括以下步骤:

2.如权利要求1所述的基于yolo模型的古契约文书文字识别方法,其特征在于:所述步骤1中yolo格式标签文件,以“.txt”为文件扩展名,且单个标签信息为<类别信息><目标中心点x坐标><目标中心点y坐标><目标的宽带><目标的高度>,其中目标的坐标信息均已归一化处理。

3.如权利要求1所述的基于yolo模型的古契约文书文字识别方法,其特征在于:所述步骤3中所述yolo目标检测...

【专利技术属性】
技术研发人员:陈莉何前宝郝星星张瑞帮马亮韩志周
申请(专利权)人:西北大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1