【技术实现步骤摘要】
图像处理方法和装置
[0001]本公开涉及人工智能
,具体为深度学习、图像处理、计算机视觉
,可应用于OCR等场景,具体涉及一种图像处理方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
技术介绍
[0002]人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术以及机器学习/深度学习、大数据处理技术、知识图谱技术等几大方向。
[0003]基于人工智能的图像处理技术,已经渗透到各个领域。其中,基于人工智能的光学字符识别(OCR)技术,通过对图像进行处理,识别图像上的形状,并将所识别的形状翻译成字符。
[0004]在此部分中描述的方法不一定是之前已经设想到或采用的方法。除非另有指明,否则不应假定此部分中描述的任何方法仅因其包括在此部分中就被认为是现有技术。类似 ...
【技术保护点】
【技术特征摘要】
1.一种图像处理方法,包括:获得包括沿第一方向排列的多个字符的目标图像,所述多个字符中的每一个字符来自预设字符集并且在预设标签集中具有相应的标签;获得所述目标图像对应的识别结果集,所述识别结果集中的每一个识别结果包括来自所述预设标签集的按顺序排列的多个标签和该多个标签中的每一个标签的置信度;以及基于所述识别结果集,获得所述目标图像的图像标签,所述图像标签包括来自所述预设标签集的按顺序排列的多个标签。2.根据权利要求1所述的方法,其中,所述获得所述目标图像对应的识别结果集包括:将所述目标图像分别输入至对应于多个分类的多个识别模型,以获得所述识别结果集,其中,所述多个识别模型分别采用所述多个分类中的对应分类的多个训练图像训练而获得的,所述对应分类的多个训练图像中的每一个训练图像包括来自所述预设字符集中的多个字符。3.根据权利要求2所述的方法,其中,所述多个分类包括对应于多个卡证类型的多个卡证分类、分别对应于多个医疗单据类型的多个医疗单据分类和/或分别对应于多个财务单据类型的多个财务单据分类。4.根据权利要求1
‑
3中任一项所述的方法,其中,所述基于所述识别结果集,获得所述目标图像的图像标签包括:响应于所述识别结果集中的第一识别结果所包括的多个标签与第二识别结果所包括的多个标签相同并且与第三识别结果所包括的多个标签不同,获得多个识别结果子集,其中,在所述多个别结果子集中的每一个识别结果子集中,任一识别结果所包括的按顺序排列的多个标签与另一识别结果所包括按顺序排列的多个标签相同;以及基于所述多个识别结果子集,获得所述图像标签。5.根据权利要求4所述的方法,其中,所述基于所述多个识别结果子集,获得所述图像标签包括:响应于所述多个识别结果子集中的第一识别结果子集的标签数量不小于任一识别结果子集的标签数量,将所述第一识别结果子集确定为候选识别结果子集,其中,所述多个识别结果子集中的每一个识别结果子集的标签数量为该识别结果子集所对应的按顺序排列的多个标签的数量;以及基于所述多个识别结果子集中的一个或多个候选识别结果子集,获得所述图像标签。6.根据权利要求5所述的方法,其中,所述基于所述多个识别结果子集中的一个或多个候选识别结果子集,获得所述图像标签包括:针对所述一个或多个候选识别结果子集中的每一个候选识别结果子集,基于该候选识别结果子集的多个识别结果,获得该候选识别结果子集所对应的按顺序排列的多个标签中的每一个标签的统计置信度;以及基于所述一个或多个候选识别结果子集中的每一个候选识别结果子集所对应的按顺序排列的多个标签和该多个标签中的每一个标签的统计置信度,获得所述图像标签。7.根据权利要求6所述的方法,其中,所述基于该候选识别结果子集的多个识别结果,获得该候选识别结果子集所对应的按顺序排列的多个标签中的每一个标签的统计置信度
包括:针对该候选识别结果子集所对应的多个标签中的第一标签,获得所述第一标签在该候选识别结果子集中的多个识别结果中的多个置信度;对所述多个置信度进行矫正,以获得多个矫正置信度;以及基于所述多个矫正置信度,获得所述第一标签的统计置信度。8.根据权利要求7所述的方法,其中,所述对所述多个置信度进行矫正包括:基于所述多个置信度,获得所述多个识别结果对应的多个权重;针对所述多个置信度中的每一个置信度,基于所述多个权重中的与该识别结果相应的权重进行加权,以获得所述第一标签的多个加权置信度;以及基于所述多个加权置信度,获得所述多个矫正置信度。9.根据权利要求6所述的方法,其中,所述分别对所述多个置信度进行矫正包括:针对所述多个置信度中的每一个置信度,响应该置信度不小于预设置信度阈值,将该置信度更新为第一预设值,并且响应于该置信度小于所述预设置信度阈值,将所该置信度更新为第二预设值,所述第二预设值小于第一预设值;以及基于所述多个置信度中的每一个置信度更新后的值,获得所述多个矫正置信度。10.根据权利要求6
‑
9中任一项所述的方法,其中,所述基于所述一个或多个候选识别结果子集中的每一个候选识别结果子集所对应的按顺序排列的多个标签和该多个标签中的每一个标签的统计置信度,获得所述图像标签包括:针对所述一个或多个候选识别结果中的每一个候选识别结果所对应的按顺序排列的多个标签的多个排列位置中每一个排列位置,获得在该排列位置处的位置标签,其中,该位置标签为所述一个或多个候选识别结果在该排列位置处对应的一个或多个标签中的统计置信度最大的标签;以及基于所述多个排列位置对应的多个位置标签,获得所述图像标签。11.根据权利要求1
‑
10中任一项所述的方法,还包括:基于所述目标图像和所述图像标签,训练图像识别模型。12.一种图像处理装置,包括:目标图像获取单元,被配置用于获得包括沿第一方向排列的多个字符的目标图像,所述多个字符中的每一个字符来自预设字符集并且在预设标签集中具有相应的标签;识别结果获取单元,被配置用于获得所述目标图像对应的识别结果集,所述识别结果集中的每一个识别结果包括来自所述预设标签集的按顺序排列的多个标签和该多个标签中的每一个标签的置信度;以及图像标签获取单元,被配置用于基于所述识别结果集,获得所述...
【专利技术属性】
技术研发人员:王鹏,谢群义,钦夏孟,恩孟一,韩福永,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。