【技术实现步骤摘要】
本专利技术涉及深度学习与目标检测,具体涉及一种基于yolo模型的古契约文书文字识别方法。
技术介绍
1、少样本多类别的目标检测问题属于计算机视觉领域问题,其一般定义为:在一个含有少量样本(不超过1000张图片)的数据集中,每张图片中都含有大量的目标(200个以上)待识别,且数据集中含有的类别不少于1500个;任务是训练模型,使其能够在这些少量样本的基础上学习到每个类别的特征,并能够在新的图像中准确检测和识别这些类别的目标。
2、目前,目标检测领域所包含的算法通常分为一阶段检测算法(如you only lookonce(yolo)算法,直接在网络的最后输出目标的类别和位置信息)和两阶段检测算法(如fast-r-cnn,首先生成一系列候选区域,之后再对这些候选区域进行分类和边界框回归)。一阶段检测算法相较于两阶段检测算法速度更快,但精度稍差。然而,这些模型目前在少样本、含有大量类别的数据集上表现较差。因此需要设计新的方法来提高在这些数据集上的目标识别准确率。
技术实现思路
1、为了
...【技术保护点】
1.一种基于YOLO模型的古契约文书文字识别方法,其特征在于包括以下步骤:
2.如权利要求1所述的基于YOLO模型的古契约文书文字识别方法,其特征在于:所述步骤1中YOLO格式标签文件,以“.txt”为文件扩展名,且单个标签信息为<类别信息><目标中心点x坐标><目标中心点y坐标><目标的宽带><目标的高度>,其中目标的坐标信息均已归一化处理。
3.如权利要求1所述的基于YOLO模型的古契约文书文字识别方法,其特征在于:所述步骤3中所述YOLO目标检测模型为采用可变形卷积CSP模块替换
...【技术特征摘要】
1.一种基于yolo模型的古契约文书文字识别方法,其特征在于包括以下步骤:
2.如权利要求1所述的基于yolo模型的古契约文书文字识别方法,其特征在于:所述步骤1中yolo格式标签文件,以“.txt”为文件扩展名,且单个标签信息为<类别信息><目标中心点x坐标><目标中心点y坐标><目标的宽带><目标的高度>,其中目标的坐标信息均已归一化处理。
3.如权利要求1所述的基于yolo模型的古契约文书文字识别方法,其特征在于:所述步骤3中所述yolo目标检测...
【专利技术属性】
技术研发人员:陈莉,何前宝,郝星星,张瑞帮,马亮,韩志周,
申请(专利权)人:西北大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。