样本标注方法及计算机存储介质技术

技术编号:21892752 阅读:35 留言:0更新日期:2019-08-17 14:50
本发明专利技术提供了一种样本标注方法及计算机存储介质,样本标注方法包括:获取样本图像;对样本图像进行连通域分析和字符类别识别,生成第一检测识别结果,包括用于指示各字符的第一字符位置的信息和第一字符类别的信息;确定是否存在第一神经网络模型和第二神经网络模型;若存在,则通过第一神经网络模型和第二神经网络模型,对样本图像进行字符检测和识别,生成第二检测识别结果,包括各字符的第二字符位置的信息和第二字符类别的信息;比对第一字符位置和第二字符位置,第一字符类别和第二字符类别,根据比对结果确定字符位置标注结果和字符类别标注结果;根据字符位置标注结果和字符类别标注结果,生成样本图像的标注信息。

Sample Labeling Method and Computer Storage Media

【技术实现步骤摘要】
样本标注方法及计算机存储介质
本专利技术涉及计算机
,尤其涉及一种样本标注方法及计算机存储介质。
技术介绍
随着人工智能和机器学习技术的发展,越来越多的领域将机器学习方法嵌入设备,使之具有一定的智能性。随之而来的是对用于机器学习训练的训练样本的需求增长。例如,在训练光学字符检测模型和识别模型时都需要大量的标注样本,标注样本是指在真实样本上标注出用于指示字符位置的字符框和字符类别。现有技术中,在获取真实样本时利用纯手工标注的方法。这种方法因为依赖于人工,所以标注效率低;而且,因为人工标注会有一定的精度损失,例如存在人工失误造成字符位置标注不准确,字符内容标注错误的情况,这使得标注后的样本在进行机器学习训练时的效果不是很好。
技术实现思路
有鉴于此,本专利技术实施例提供一种样本标注方法及计算机存储介质,以解决现有技术中真实样本采用人工标注效率低、标注效果不好的问题。本专利技术实施例提供一种样本标注方法,包括:获取待标注的样本图像;对所述待标注的样本图像进行连通域分析和字符类别识别,并生成第一检测识别结果,其中,所述第一检测识别结果包括用于指示所述待标注的样本图像中的各字符的第一字符位置的信息和第一字符类别的信息;确定是否存在用于检测图像中字符位置的第一神经网络模型和用于对图像中字符进行识别的第二神经网络模型;若存在,则通过所述第一神经网络模型和第二神经网络模型,对所述待标注的样本图像进行字符检测和识别,并生成第二检测识别结果,其中,所述第二检测识别结果包括检测出的所述待标注的样本图像中的各字符的第二字符位置的信息和第二字符类别的信息;分别比对所述第一字符位置和所述第二字符位置,以及,所述第一字符类别和第二字符类别,根据比对结果确定字符位置标注结果和字符类别标注结果;根据所述字符位置标注结果和所述字符类别标注结果,生成所述待标注的样本图像的标注信息。本专利技术实施例还提供一种计算机存储介质,所述计算机存储介质存储有:用于获取待标注的样本图像的指令;用于对所述待标注的样本图像进行连通域分析和字符类别识别,并生成第一检测识别结果,其中,所述第一检测识别结果包括用于指示所述待标注的样本图像中的各字符的第一字符位置的信息和第一字符类别的信息的指令;用于确定是否存在用于检测图像中字符位置的第一神经网络模型和用于对图像中字符进行识别的第二神经网络模型的指令;用于若存在,则通过所述第一神经网络模型和第二神经网络模型,对所述待标注的样本图像进行字符检测和识别,并生成第二检测识别结果,其中,所述第二检测识别结果包括检测出的所述待标注的样本图像中的各字符的第二字符位置的信息和第二字符类别的信息的指令;用于分别比对所述第一字符位置和所述第二字符位置,以及,所述第一字符类别和第二字符类别,根据比对结果确定字符位置标注结果和字符类别标注结果的指令;用于根据所述字符位置标注结果和所述字符类别标注结果,生成所述待标注的样本图像的标注信息的指令。本专利技术实施例提供的一种样本标注方案,分别通过连通域分析和第一神经网络模型对待标注的样本图像的字符位置进行检测,对应生成第一字符位置的信息和第二字符位置的信息,并综合第一字符位置和第二字符位置生成字符位置标注结果,减少了单一的连通域检测或第一神经网络模型检测存在的问题,使字符位置标注结果的字符检测准确度更高。分别通过字符类别识别和第二神经网络模型对各个字符的字符类别进行识别,并生成第一字符类别的信息和第二字符类别的信息,综合第一字符类别的信息和第二字符类别的信息确定字符类别标注结果,同样提升了字符类别识别准确度。通过该样本标注方法可以利用计算设备实现对待标注的样本图像进行自动标注,避免了现有技术中采用人工进行样本标注存在的工作量大、效率低的问题,同时能够避免人工标注存在的精度损失的问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例一提供的一种样本标注方法的流程示意图;图2为本专利技术实施例二提供的一种样本标注方法的流程示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一图1为本专利技术实施例一提供的一种样本标注方法的流程示意图。如图1所示,根据本专利技术的实施例,该样本标注方法包括:S101:获取待标注的样本图像。其中,待标注的样本图像用于后续进行机器学习模型的训练,作为训练样本图像。本专利技术实施例中,训练样本图像为包括字符信息的图像,其中,字符包括但不限于:文字、字母、数字、符号。S102:对待标注的样本图像进行连通域分析和字符类别识别,并生成第一检测识别结果,其中,第一检测识别结果包括用于指示待标注的样本图像中的各字符的第一字符位置的信息和第一字符类别的信息。连通域一般是指图像中具有相同像素值且位置相邻的像素点组成的图像区域。连通域分析是一种将图像中的各个连通区域找出并标记的分析方法。本专利技术实施例中,连通域分析方法可以由本领域技术人员根据实际需求采用任意适当的方式实现,如采用openVC二值图像连通域分析方法等。通过对图像中的像素进行连通域分析,可以确定相邻的像素的颜色是否相同,从而确定字符边界,进而确定各个字符的位置,实现字符分割。在本实施例中,通过对待标注的样本图像进行连通域分析,可以检测出待标注的样本图像中的各个字符,确定各个字符的位置,并生成用于指示各个字符的位置的第一字符位置的信息。其中,第一字符位置的信息可以通过记录字符框的位置坐标的方式指示各个字符的位置。在本实施例中,字符类别识别可以由本领域技术人员根据实际需求采用任意适当的方式实现,如通过OCR识别方式等。通过字符识别,可以识别出待标注的样本图像中的各个字符的类别,并生成第一字符类别的信息。其中,第一字符类别信息可以包括第一字符内容信息,第一字符内容信息用于指示各个字符的内容。第一字符类别信息还可以包括第一类别信息,第一类别信息用于指示各个字符的内容的类别,第一类别信息包括但不限于数字、文字、字母、符号等。结合第一字符位置的信息和第一字符类别的信息可以生成第一检测识别结果。S103:确定是否存在用于检测图像中字符位置的第一神经网络模型和用于对图像中字符进行识别的第二神经网络模型。第一神经网络模型可以是通过机器学习方式训练而成的用于检测图像中的字符位置的神经网络模型。第二神经网络模型可以是通过机器学习方式训练而成的用于识别图像中的字符的神经网络模型。S104:若存在,则通过第一神经网络模型和第二神经网络模型,对待标注的样本图像进行字符检测和识别,并生成第二检测识别结果,其中,第二检测识别结果包括检测出的待标注的样本图像中的各字符的第二字符位置的信息和第二字符类别的信息。若存在训练完成的第一神经网络模型和第二神经网络模型,则通过第一神经网络本文档来自技高网...

【技术保护点】
1.一种样本标注方法,其特征在于,包括:获取待标注的样本图像;对所述待标注的样本图像进行连通域分析和字符类别识别,并生成第一检测识别结果,其中,所述第一检测识别结果包括用于指示所述待标注的样本图像中的各字符的第一字符位置的信息和第一字符类别的信息;确定是否存在用于检测图像中字符位置的第一神经网络模型和用于对图像中字符进行识别的第二神经网络模型;若存在,则通过所述第一神经网络模型和第二神经网络模型,对所述待标注的样本图像进行字符检测和识别,并生成第二检测识别结果,其中,所述第二检测识别结果包括检测出的所述待标注的样本图像中的各字符的第二字符位置的信息和第二字符类别的信息;分别比对所述第一字符位置和所述第二字符位置,以及,所述第一字符类别和第二字符类别,根据比对结果确定字符位置标注结果和字符类别标注结果;根据所述字符位置标注结果和所述字符类别标注结果,生成所述待标注的样本图像的标注信息。

【技术特征摘要】
1.一种样本标注方法,其特征在于,包括:获取待标注的样本图像;对所述待标注的样本图像进行连通域分析和字符类别识别,并生成第一检测识别结果,其中,所述第一检测识别结果包括用于指示所述待标注的样本图像中的各字符的第一字符位置的信息和第一字符类别的信息;确定是否存在用于检测图像中字符位置的第一神经网络模型和用于对图像中字符进行识别的第二神经网络模型;若存在,则通过所述第一神经网络模型和第二神经网络模型,对所述待标注的样本图像进行字符检测和识别,并生成第二检测识别结果,其中,所述第二检测识别结果包括检测出的所述待标注的样本图像中的各字符的第二字符位置的信息和第二字符类别的信息;分别比对所述第一字符位置和所述第二字符位置,以及,所述第一字符类别和第二字符类别,根据比对结果确定字符位置标注结果和字符类别标注结果;根据所述字符位置标注结果和所述字符类别标注结果,生成所述待标注的样本图像的标注信息。2.根据权利要求1所述的方法,其特征在于,在确定是否存在用于检测图像中字符位置的第一神经网络模型和用于对图像中字符进行识别的第二神经网络模型之后,所述方法还包括:若不存在,则根据所述待标注的样本图像中的各字符的第一字符位置的信息和第一字符类别的信息,生成所述待标注的样本图像的标注信息。3.根据权利要求1所述的方法,其特征在于,分别比对所述第一字符位置和所述第二字符位置,以及,所述第一字符类别和第二字符类别,根据比对结果确定字符位置标注结果和字符类别标注结果,包括:根据所述待标注的样本图像中的各字符的第一字符位置的信息确定各字符的第一字符框,根据各字符的第二字符位置的信息确定各字符的第二字符框;比对各字符的所述第一字符框和所述第二字符框,并根据比对结果确定字符位置标注结果,根据所述字符位置标注结果、各字符的所述第一字符类别和第二字符类别,确定各字符的字符类别标注结果。4.根据权利要求3所述的方法,其特征在于,比对各字符的所述第一字符框和所述第二字符框,并根据比对结果确定字符位置标注结果,根据所述字符位置标注结果、各字符的所述第一字符类别和第二字符类别,确定各字符的字符类别标注结果,包括:针对每个字符,判断是否存在与当前字符的所述第一字符框存在重叠、且重叠面积大于预设重叠值的第二字符框,若存在,则将所述第二字符框对应的第二字符位置的信息确定为当前字符的字符位置标注结果,并确定与所述第二字符位置对应的第二字符类别作为候选字符类别;判断所述候选字符类别是否为设定类别;若为设定类别,则确定所述第一字符类别作为字符类别标注结果;若不为设定类别,则将所述候选字符类别确定为字符类别标注结果。5.根据权利要求3所述的方法,其特征在于,比对各字符的所述第一字符框和所述第二字符框,并根据比对结果确定字符位置标注结果,根据所述字符位置标注结果、各字符的所述第一字符类别和第二字符类别,确定各字符的字符类别标注结果,包括:针...

【专利技术属性】
技术研发人员:兴百桥
申请(专利权)人:北京世纪好未来教育科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1