基于人工智能的图像识别方法和相关装置制造方法及图纸

技术编号:24997271 阅读:52 留言:0更新日期:2020-07-24 17:59
本申请实施例公开了基于人工智能的图像识别方法和相关装置,该方法针对待识别图像中目标区域识别得到的多个候选字组合以及对应整体识别概率。若第一候选字组合具有识别自信,将第一候选字组合的整体识别概率作为识别可信度,若第二候选字组合不具有识别自信,根据第二候选字组合中多个候选字分别对应的分布比例,调整各自对应的识别概率,并根据调整后的识别概率确定第二候选字组合的识别可信度。由于识别可信度用于确定文本识别结果,针对第一候选字组合的识别可信度确定时可以减少第二候选字组合所需执行的数据处理环节,提高了文本识别的识别效率和降低资源占用。

【技术实现步骤摘要】
基于人工智能的图像识别方法和相关装置
本申请涉及图像处理领域,特别是涉及基于人工智能的图像识别方法和相关装置。
技术介绍
随着人工智能技术的发展,可以通网络模型识别出图像内容中包含的文本,这些图像识别结果可以应用于图像分类、广告识别等。在通过网络模型对图像进行文本识别的过程中,对于确定出的任意一个可能的文字,所进行处理流程都是一致的,也就是说,待识别文本的数量或待识别的图像数量会直接影响网络模型需要处理的数据量。当图像中文本较多或者待识别图像数量较多时,由于需处理的数据量会随着文本数量、图像数量的增加而增加,庞大的数据处理量将导致网络模型在识别过程中会占用大量的处理资源,且识别效率难以提升。
技术实现思路
为了解决上述技术问题,本申请提供了基于人工智能的图像识别方法和相关装置,提高了文本识别的识别效率和降低资源占用。本申请实施例公开了如下技术方案:一方面,本申请实施例提供了一种图像识别方法,所述方法包括:通过对待识别图像中的目标区域中的文本进行字形识别,得到多个候选字组合以及每个候选字组合的整体识别概率;对于满足预设识别概率条件的整体识别概率所对应的第一候选字组合,以所述第一候选字组合的整体识别概率,作为所述第一候选字组合的识别可信度;对于不满足预设识别概率条件的整体识别概率所对应的第二候选字组合,根据预设候选字分布比例对所述第二候选字组合的整体识别概率进行调整,得到所述第二候选字组合的识别可信度;根据所述识别可信度、所述第一候选字组合和所述第二候选字组合,确定所述目标区域的文本识别结果。另一方面,本申请实施例提供了一种图像识别装置,所述装置包括识别单元、第一确定单元和第二确定单元:所述识别单元,用于通过对待识别图像中的目标区域中的文本进行字形识别,得到多个候选字组合以及每个候选字组合的整体识别概率;所述第一确定单元,用于对于满足预设识别概率条件的整体识别概率所对应的第一候选字组合,以所述第一候选字组合的整体识别概率,作为所述第一候选字组合的识别可信度;所述第一确定单元,还用于对于不满足预设识别概率条件的整体识别概率所对应的第二候选字组合,根据预设候选字分布比例对所述第二候选字组合的整体识别概率进行调整,得到所述第二候选字组合的识别可信度;所述第二确定单元,用于所述根据所述识别可信度、所述第一候选字组合和所述第二候选字组合,确定所述目标区域的文本识别结果。另一方面,本申请实施例提供了一种用于图像识别设备,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令执行上述方面所述的方法。另一方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储计算机程序,所述计算机程序用于执行上述方面所述的方法。由上述技术方案可以看出,待识别图像中包括的文本可以在目标区域中,在进行字形识别时,可以得到多个候选字组合,以及每个候选字组合的整体识别概率,该整体识别概率可以体现出候选字组合的整体识别自信程度。通过判断整体识别概率是否满足预设识别概率条件,可以确定出多个候选字组合中哪些具有识别自信的,哪些并不具有。若对第一候选字组合具有识别自信,那么可以直接根据第一候选字组合的整体识别概率确定识别可信度,若对第二候选字组合不具有识别自信,则根据第二候选字组合中多个候选字分别对应的分布比例,调整各自对应的识别概率,并根据调整后的识别概率确定第二候选字组合的识别可信度。由于识别可信度用于从多个候选字组合中确定文本识别结果,而针对第一候选字组合的识别可信度确定时可以减少第二候选字组合所需执行的数据处理环节,提高了文本识别的识别效率和降低资源占用。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的一种图像识别方法的应用场景示意图;图2为本申请实施例提供的一种图像识别方法的流程示意图;图3为本申请实施例提供的另一种图像识别方法的应用场景示意图;图4为本申请实施例提供的另一种图像识别方法的流程示意图;图5为本申请实施例提供的另一种图像识别方法的流程示意图;图6为本申请实施例提供的另一种图像识别方法的流程示意图;图7为本申请实施例提供的另一种图像识别方法的流程示意图;图8为本申请实施例提供的一种图像识别装置的结构示意图;图9为本申请实施例提供的服务器的结构示意图;图10为本申请实施例提供的终端设备的结构示意图。具体实施方式下面结合附图,对本申请的实施例进行描述。本申请实施例提供的图像识别方法是基于人工智能实现的,人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。在本申请实施例中,主要涉及的人工智能软件技术包括上述计算机视觉技术、机器学习/深度学习等方向。例如可以涉及计算机视觉(ComputerVision)中的图像处理(ImageProcessing)、图像语义理解(ImageSemanticUnderstanding,ISU)、视频处理(videoprocessing)、视频语义理解(videosemanticunderstanding,VSU)等。例如可以涉及机器学习(Machinelearning,ML)中的深度学习(DeepLearning),包括各类人工神经网络(ArtificialNeuralNetwork,ANN)。为了便于理解本申请的技术方案,下面结合实际应用场景对本申请实施例提供的图像识别方法进行介绍。本申请提供的图像识别方法可以应用于具有数据处理能力的图像识别设备,如终端设备、服务器。其中,终端设备具体可以为智能手机、计算机、个人数字助理(PersonalDigitalAssistant,PDA)、平板电脑等;服务器具体可以为独立服务器,也可以本文档来自技高网...

【技术保护点】
1.一种图像识别方法,其特征在于,所述方法包括:/n通过对待识别图像中的目标区域中的文本进行字形识别,得到多个候选字组合以及每个候选字组合的整体识别概率;/n对于满足预设识别概率条件的整体识别概率所对应的第一候选字组合,以所述第一候选字组合的整体识别概率,作为所述第一候选字组合的识别可信度;/n对于不满足预设识别概率条件的整体识别概率所对应的第二候选字组合,根据预设候选字分布比例对所述第二候选字组合的整体识别概率进行调整,得到所述第二候选字组合的识别可信度;/n根据所述识别可信度、所述第一候选字组合和所述第二候选字组合,确定所述目标区域的文本识别结果。/n

【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:
通过对待识别图像中的目标区域中的文本进行字形识别,得到多个候选字组合以及每个候选字组合的整体识别概率;
对于满足预设识别概率条件的整体识别概率所对应的第一候选字组合,以所述第一候选字组合的整体识别概率,作为所述第一候选字组合的识别可信度;
对于不满足预设识别概率条件的整体识别概率所对应的第二候选字组合,根据预设候选字分布比例对所述第二候选字组合的整体识别概率进行调整,得到所述第二候选字组合的识别可信度;
根据所述识别可信度、所述第一候选字组合和所述第二候选字组合,确定所述目标区域的文本识别结果。


2.根据权利要求1所述的方法,其特征在于,所述通过对待识别图像中的目标区域中的文本进行字形识别,得到多个候选字组合以及每个候选字组合的整体识别概率,包括:
通过字形识别模型对所述目标区域中文本进行字形识别,确定多个候选字,所述候选字具有对应的识别概率;
根据所述多个候选字以及对应的识别概率,确定多个候选字组合以及每个候选字组合的整体识别概率。


3.根据权利要求2所述的方法,其特征在于,目标候选字为所述第二候选字组合中的一个候选字,所述目标候选字的分布比例为在训练所述字形识别模型所采用训练样本涉及的文字中,所述目标候选字所占的比例。


4.根据权利要求1所述的方法,其特征在于,所述对于满足预设识别概率条件的整体识别概率所对应的第一候选字组合,以所述第一候选字组合的整体识别概率,作为所述第一候选字组合的识别可信度,包括:
在所述多个候选字组合中筛选满足预设识别概率条件的整体识别概率所对应的第一候选字组合,判定所述第一候选字组合为数字组合,以所述数字组合的整体识别概率作为所述数字组合的识别可信度;
所述对于不满足预设识别概率条件的整体识别概率所对应的第二候选字组合,根据预设候选字分布比例对所述第二候选字组合的整体识别概率进行调整,得到所述第二候选字组合的识别可信度,包括:
在所述多个候选字组合中筛选不满足预设识别概率条件的整体识别概率所对应的第二候选字组合,判定所述第二候选字组合为文字组合,根据预设候选字分布比例对所述文字组合的整体识别概率进行调整,得到所述文字组合的识别可信度。


5.根据权利要求1-4任意一项所述的方法,其特征在于,所述方法还包括:
确定所述多个候选字之间的语义连贯性参数;
所述对于满足预设识别概率条件的整体识别概率所对应的第一候选字组合,以所述第一候选字组合的整体识别概率,作为所述第一候选字组合的识别可信度,包括:<...

【专利技术属性】
技术研发人员:康健黄珊
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1