【技术实现步骤摘要】
本专利技术涉及计算机应用与人工智能,具体涉及一种基于对比学习的光学字符识别方法和系统。
技术介绍
1、目前,光学字符识别方法(ocr)基本采用深度学习中分类任务的框架,传统的方法是将可识别的汉字限制在一个字库范围内,使用深度神经网络提取文字特征,再通过分类器得到该文字特征在字库上的概率分布,通过概率大小判别文字类别,在中文识别应用场景中,文字类别数通常在4000到10000之间,文字类别数过多则会导致训练收敛困难、增加推理耗时等问题。
2、在识别场景中的常用字符往往只有几百个,这不仅会导致大部分文字的训练样本只有几十个甚至几个,而且还会导致数据分布严重长尾的问题,当字库中文字数量较大时会增加训练和推理的成本,加上受到数据长尾分布影响严重,对于不常见文字的识别往往会有较差的识别效果,除此之外,这种光学字符识别方法(ocr)方法也无法处理不在字库中的文字。
技术实现思路
1、本专利技术针对上述现有技术中一个或多个技术缺陷,提出了如下技术方案。
2、基于本专利技术的第一方
...【技术保护点】
1.一种基于对比学习的光学字符识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,S2中所述通过神经网络提取文本图片的深度特征并基于自注意力机制提取每个字符对应的特征,是使用基于Attention+RNN的文字识别结构提取单个文字特征,具体包括:
3.根据权利要求2所述的方法,其特征在于,S204中所述计算所述第t个文字的隐含层特征和深度特征具体包括:
4.根据权利要求1所述的方法,其特征在于,S5中所述找出第t个文字对应的底库文字具体包括:
5.一种基于对比学习的光学字符识别系统,其特征在于,包括:
6.根...
【技术特征摘要】
1.一种基于对比学习的光学字符识别方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,s2中所述通过神经网络提取文本图片的深度特征并基于自注意力机制提取每个字符对应的特征,是使用基于attention+rnn的文字识别结构提取单个文字特征,具体包括:
3.根据权利要求2所述的方法,其特征在于,s204中所述计算所述第t个文字的隐含层特征和深度特征具体包括:
4.根据权利要求1所述的方法,其特征在于,s5中所述找出第t个文字对应的底库文字具体包括:
5.一种基于对比学习的光学字符识别系统,其特征在于,包括:
6.根据权利要求5所述的系统...
【专利技术属性】
技术研发人员:王文烨,魏超,陈子沣,陈毓靖,林文楷,张泽洋,
申请(专利权)人:厦门市美亚柏科信息安全研究所有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。