【技术实现步骤摘要】
一种卡片式文件图像识别方法和装置
[0001]本专利技术涉及信息处理
,特别地涉及一种卡片式文件图像识别方法和装置。
技术介绍
[0002]名片是一种方便传递联系方式的个人信息载体,在日常商务活动、社交活动中起着重要的作用。在名片交换后,人们通常需要将名片中的一些重要信息数字化,即将接收到的纸制名片转化为电子名片或名片数据保存在手机、电脑中。另有一些应用场景,名片所有人需要将自己的纸制名片转成电子式名片,而后可以对名片上的内容进行编辑。还有一些应用场景,在采集个人数据时,可以通过采集个人名片上的数据,再根据具体的场景加以利用。
[0003]目前,大部分的名片识别方法采用光学字符识别(Optical CharacterRecognition,简称OCR)技术,所述的OCR技术是指对具有文本信息的图像文件进行分析、识别而获取文字及版面信息的过程。主要包括图像预处理、文字检测和文本识别等步骤。其中,所述图像预处理通常是针对图像的成像问题进行修正。常见的预处理过程包括几何变换(透视、扭曲、旋转等)、畸变矫正、去除模糊、图像增强和光线矫正等。文字检测即检测文本所在位置、范围及其布局。通常也包括版面分析和文字行检测等,主要解决的问题是文字在图像中的位置及范围。文本识别是在文本检测的基础上,对文本内容进行识别,将文本图像信息转化为文本信息。文字识别可以采用模板匹配的方式进行分类以识别出单个字,或者采用深度学习模型,引入上下文信息以提高识别的准确率。
[0004]根据应用场景,所述OCR技术分为识别特定场景的专 ...
【技术保护点】
【技术特征摘要】
1.一种卡片式文件图像识别方法,其中包括:对目标卡片式文件图像进行文字识别,以得到文件字符集合,其中,所述字符包括文字、数字、标点符号和特殊符号中的一种或多种;对目标卡片式文件图像进行图像处理,至少得到每个字符的图像特征;对所述文件字符集合中的字符按语义进行抽取,至少根据语义特征和字符的图像特征对文件字符集合中的字符进行合并和/或拆分以得到多个类别的字段内容;以及生成包括所述多个类别字段内容的文件识别文本。2.根据权利要求1所述的卡片式文件图像识别方法,其中当所述目标卡片式文件为名片时,对所述目标卡片式文件图像进行图像处理时进一步包括:识别第一字符前的图像区域;响应于在第一字符前识别到标志图像,建立所述第一字符与所述标志图像的对应关系;提取所述标志图像的图像特征以确定与其对应的类别;以及在根据语义特征和字符的图像特征对文件字符集合中的字符进行合并和/或拆分时,根据第一字符所在字符集的语义特征和对应的标志图像确定所述第一字符所在字符集的类别。3.根据权利要求1所述的卡片式文件图像识别方法,其中当所述目标卡片式文件为名片或具有标准参数项的证件时,在对所述文件字符集合中的字符按语义进行抽取时进一步包括:对所述文件字符集合中的字符按语义进行预分割以得到多个分词集合;根据语义特征和字符的图像特征识别所述多个分词集合中的标志字符,其中所述标志字符至少包括代表类别的文字;以及响应于识别到标志字符,在根据语义特征和字符的图像特征对文件字符集合中的字符进行合并和/或拆分时,将标志字符后与其语义相符的字符集确定为所述标志字符代表的类别。4.根据权利要求1所述的卡片式文件图像识别方法,其中还进一步包括:将待识别的卡片式文件图像矫正为正向的目标卡片式文件图像。5.根据权利要求4所述的卡片式文件图像识别方法,其中进一步包括:从原始待识别的卡片式文件图像中获取有效图像区域;识别所述有效图像区域的至少四个顶点;将所述至少四个顶点映射到一个正向卡片式文件的四个顶点,从而得到映射矩阵,其中,所述正向卡片式文件与所述原始待识别的卡片式文件为同一规格文件;以及根据所述映射矩阵对所述待识别的卡片式文件图像的有效图像区域进行图像透视变换,以得到正向目标卡片式文件图像。6.根据权利要求4所述的卡片式文件图像识别方法,其中进一步包括:从原始待识别的卡片式文件图像中获取有效图像区域;在所述有效图像区域中预测出预置位置的关键点;获取与原始待识别的卡片式文件类型相同的标准正向图像中的对应标准关键点;根据标准关键点及预测的关键点构造变换矩阵;以及
根据所述第一变换矩阵对所述原始待识别的卡片式文件的有效图像区域进行透视变换以获得正向目标卡片式文件图像。7.根据权利要求6所述的卡片式文件图像识别方法,其中所述预置位置的关键点为:包括有效图像区域的顶点、四个边的中点、两个对角线的交点和对角线交点与四个顶点之间的中点中的任意四个以上的第一关键点;和/或任意四个以上的对应标准参数项位置的第二关键点;和/或任意四个以上人物头像所在矩形框上的第三关键点;对应地,所述变换矩阵为根据第一关键点、第二关键点和第三关键点中的任意一种或多种组合及其对应的标准关键点得到的变换矩阵。8.根据权利要求6所述的卡片式文件图像识别方法,其中通过CPN模型预测所述关键点。9.根据权利要求5或6所述的卡片式文件图像识别方法,其中通过采用Yolo模型从原始待识别的卡片式文件图像中检测出有效图像区域。10.根据权利要求1所述的卡片式文件图像识别方法,其中还进一步包括:按照预置格式对所述多个类别字段内容进行排版以生成所述文件识别文本。11...
【专利技术属性】
技术研发人员:吴静垠,俞希林,
申请(专利权)人:前锦网络信息技术上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。