当前位置: 首页 > 专利查询>湖南大学专利>正文

基于主动学习与迁移学习的字体类别视觉检测方法和系统技术方案

技术编号:40577762 阅读:19 留言:0更新日期:2024-03-06 17:19
本发明专利技术公开了基于主动学习与迁移学习的字体类别视觉检测方法和系统,获取三种场景下的数据集,对数据集进行预处理并划分;基于迁移学习,利用预训练模型的对三种场景下的测试集中的字体图像进行分析并且得到相应的预测结果;采用主动学习策略,计算对应场景下的预测结果的置信度和准确率,当对应场景的准确率小于该场景的预设的准确率阈值时,选择该场景下置信度大于该场景下预设的置信度阈值但是标记错误的样本进行人工标注后,放入该场景的训练集中进行模型再训练,直至该场景的准确率大于或等于该场景的预设的准确率阈值;重复上述过程,直至三种场景的准确率均大于或等于对应场景的预设的准确率阈值。提高模型的扩展、泛化能力和准确性。

【技术实现步骤摘要】

本专利技术属于计算机视觉,特别是涉及基于主动学习与迁移学习的字体类别视觉检测方法和系统


技术介绍

1、在数字化时代,字体作为信息传递的主要形式之一,广泛应用于文本处理、广告设计等众多领域。尽管字体识别在数字化时代具有广泛的应用前景和实际价值,但相关的研究并不多,并且由于不同字体类型之间存在细微差别和变体,以及字体图像中存在噪声和干扰,字体识别任务面临着挑战。

2、目前主要的字体识别方法有三种,一种是使用传统的基于特征提取和机器学习方法。有学者利用了gabor滤波器进行纹理分析,提取全局特征用于汉字字体识别。有学者利用支持向量机(svm)构建了一个多分类svm汉字字体识别器。有学者采用了经验模式分解(emd)方法,通过提取汉字字体的高频能量和平均灰度特征对字体进行分类。此外还有其他研究人员通过小波分解、局部线性嵌入(lle)等方式获取特征进行字体识别。第二种是基于深度学习的图像分类方法,有学者使用vgg-16模型进行字体识别,使得对标准字体库中的图像识别准确率达到了99.7%。有学者提出了一种具有可插拔模块的字体识别器,能够隐藏最具区别性的字体本文档来自技高网...

【技术保护点】

1.基于主动学习与迁移学习的字体类别视觉检测方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,S100中对数据集进行预处理包括:

3.根据权利要求2所述的方法,其特征在于,S110具体为:

4.根据权利要求3所述的方法,其特征在于,S120具体为:

5.根据权利要求4所述的方法,其特征在于,S130中对拍摄图像采用透视变换进行文档矫正,具体为:

6.根据权利要求5中所述的方法,其特征在于,S100中将预处理后的数据集进行划分,得到三种场景下的训练集、验证集和测试集,包括:p>

7.根据权...

【技术特征摘要】

1.基于主动学习与迁移学习的字体类别视觉检测方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,s100中对数据集进行预处理包括:

3.根据权利要求2所述的方法,其特征在于,s110具体为:

4.根据权利要求3所述的方法,其特征在于,s120具体为:

5.根据权利要求4所述的方法,其特征在于,s130中对拍摄图像采用透视变换进行文档矫正,具体为:

6.根据权利要求5中所述的方法,其特征在于,s100中将预处理后的数据集进行划分,得到三种场景下的训练集、验证集和测试集,包括:

7.根据权利要求6所述...

【专利技术属性】
技术研发人员:朱青秦木华周显恩王耀南肖丁寅周新城王新成谭昕马俊杰
申请(专利权)人:湖南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1