应用于厂区监控场景的铭牌颜色和文本一体化检测方法技术

技术编号:37711201 阅读:11 留言:0更新日期:2023-06-02 00:03
本发明专利技术关于应用于厂区监控场景的铭牌颜色和文本一体化检测方法,涉及自然文字场景识别技术领域。该方法包括获取待测图片,待测图片中包括至少一个铭牌区域;确定与待测图片对应的光源颜色;对待测图片进行颜色校正;得到铭牌颜色信息以及铭牌位置信息;基于铭牌位置信息对铭牌区域进行裁剪,得到铭牌图片;得到与铭牌区域对应的文本内容。在获得具有铭牌区域的待测图片之后,通过铭牌识别模型确定铭牌所在位置,在通过OCR模型对于裁剪得到的铭牌图片进行识别,以得到与铭牌区域对应的文本内容。在此过程中,通过对于图片所在位置光源颜色的识别与调整,使得识别过程可以适配光源颜色不同的情况,进而提高对于铭牌的识别检测效率。率。率。

【技术实现步骤摘要】
应用于厂区监控场景的铭牌颜色和文本一体化检测方法


[0001]本专利技术涉及自然文字场景识别
,特别涉及一种应用于厂区监控场景的铭牌颜色和文本一体化检测方法。

技术介绍

[0002]铭牌颜色代表工作人员进入厂区不同区域的权限,铭牌文字信息记录工作人员身份信息,通过正确的识别制服铭牌颜色和文字信息,可以自动化管理人员出入信息,若有陌生人员闯入可自动化报警,提高厂区门禁管理的自动化程度。
[0003]相关技术当中,通常包括基于射频识别(Radio Frequency Identification,RFID)技术电子铭牌的方法和基于计算机视觉的方法。其中,基于RFID电子铭牌的方法中,通过制作实体电子铭牌的方式,在电子铭牌中配置RFID标签和无线接收单元,RFID模块中存储有待识别的身份信息,发送至远程后台管理系统,以进行陌生人员的身份识别。在基于计算机视觉的方法中,通常采用摄像头采集监控场景当中的图片,并且对于图片进行预处理,并采用光学字符识别技术提取铭牌上的文字信息。
[0004]然而,相关技术中,RFID技术制作电子铭牌的方法,仅在人员主动携带电子铭牌,并放置到读卡器下的情况下才能正确进行识别;基于计算机视觉的识别方法无法适配文本信息扭曲、光线效果较差的情况。因此,相关技术中尚不存在一种高效的对于铭牌进行识别检测的方法。

技术实现思路

[0005]本专利技术的目的在于克服已有技术中存在的不足,从而提供应用于厂区监控场景的铭牌颜色和文本一体化检测方法,以提高对于铭牌的识别检测效率。该方法应用于计算机设备中,该方法包括:
[0006]获取待测图片,待测图片中包括至少一个铭牌区域,铭牌区域中包括至少一块铭牌;
[0007]确定与待测图片对应的光源颜色;
[0008]响应于光源颜色为非白光,对待测图片进行颜色校正;
[0009]将待测图片输入铭牌识别模型中,输出得到铭牌颜色信息以及铭牌位置信息;
[0010]基于铭牌位置信息对铭牌区域进行裁剪,得到铭牌图片;
[0011]将铭牌图片输入光学字符识别(Optical Character Recognition,OCR)模型,输出得到与铭牌区域对应的文本内容。
[0012]在一个可选的实施例中,响应于光源颜色为非白光,对待测图片进行颜色校正,包括:
[0013]响应于光源颜色为非白光,确定待测图片中的最亮点;
[0014]基于最亮点,对待测图片进行白平衡校正。
[0015]在一个可选的实施例中,获取待测图片,包括:
[0016]获取与待测图片对应的视频数据;
[0017]对视频数据进行剪辑,得到待测图片。
[0018]在一个可选的实施例中,铭牌识别模型为基于YOLOV5以及SENet注意力机制的人工智能模型。
[0019]在一个可选的实施例中,其特征在于,该方法还包括:
[0020]建立初始铭牌识别模型,初始铭牌识别模型与铭牌识别模型的结构对应;
[0021]获取数张样本待测图片,样本待测图片中对应有样本铭牌颜色信息以及样本铭牌位置信息;
[0022]通过样本待测图片对初始铭牌识别模型进行训练,得到铭牌识别模型。
[0023]在一个可选的实施例中,其特征在于,OCR模型中包括连续的文本检测模块、方向校正模块以及文本识别模块。
[0024]在一个可选的实施例中,其特征在于,文本检测模块基于DBNet文本检测算法。
[0025]在一个可选的实施例中,方向校正模块选取轻量神经网络作为文本方向分类模型。
[0026]在一个可选的实施例中,文本识别模块实现为基于CRNN算法的神经网络模型。
[0027]在一个可选的实施例中,该方法还包括:
[0028]将铭牌颜色信息、铭牌位置信息以及文本内容进行存储。
[0029]本专利技术提供的技术方案带来的有益效果至少包括:
[0030]在获得具有铭牌区域的待测图片之后,通过铭牌识别模型确定铭牌所在位置,在通过OCR模型对于裁剪得到的铭牌图片进行识别,以得到与铭牌区域对应的文本内容。在此过程中,通过对于图片所在位置光源颜色的识别与调整,使得识别过程可以适配光源颜色不同的情况,进而提高对于铭牌的识别检测效率。
附图说明
[0031]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0032]图1示出了本申请一个示例性实施例提供的一种应用于厂区监控场景的铭牌颜色和文本一体化检测方法的流程示意图。
[0033]图2示出了本申请一个示例性实施例提供的另一种应用于厂区监控场景的铭牌颜色和文本一体化检测方法的流程示意图。
[0034]图3示出了本申请一个示例性实施例提供的一种OCR模型的结构示意图。
具体实施方式
[0035]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术实施方式作进一步地详细描述。
[0036]图1示出了本申请一个示例性实施例提供的一种应用于厂区监控场景的铭牌颜色和文本一体化检测方法的流程示意图,以该方法应用于计算机设备中为例进行说明,该方
法包括:
[0037]步骤101,获取待测图片。
[0038]在本申请实施例中,待测图片中包括至少一个铭牌区域,铭牌区域中包括至少一块铭牌。在本申请实施例中,铭牌中包括厂区监控场景内员工的身份信息。
[0039]步骤102,确定与待测图片对应的光源颜色。
[0040]在该过程中,计算机设备确定待测图片在拍摄时的背景颜色。
[0041]步骤103,响应于光源颜色为非白光,对待测图片进行颜色校正。
[0042]在本申请实施例中,未防止白光外的光源颜色对于光源识别结果的影响,在本申请实施例中,当光源颜色为非白光时,计算机设备将光源颜色调整为白光。
[0043]步骤104,将待测图片输入铭牌识别模型中,输出得到铭牌颜色信息以及铭牌位置信息。
[0044]需要说明的是,本申请实施例中,铭牌识别模型为基于机器学习的人工智能模型。在将待测图片输入铭牌识别模型后,将以文本化形式输出得到铭牌颜色信息以及铭牌位置信息,其中,铭牌颜色信息用于指示铭牌的颜色,铭牌位置信息用于指示铭牌在待测图片中所在的位置。
[0045]步骤105,基于铭牌位置信息对铭牌区域进行裁剪,得到铭牌图片。
[0046]步骤106,将铭牌图片输入OCR模型,输出得到与铭牌区域对应的文本内容。
[0047]在本申请实施例中,OCR模型为基于神经网络的人工智能模型,OCR模型用于输出得到与铭牌区域对应的文本内容。
[0048]综上所述,本申请实施例提供的方法,在获得具有铭牌区域的待测图片之后,通过铭牌识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用于厂区监控场景的铭牌颜色和文本一体化检测方法,其特征在于,所述方法应用于计算机设备中,所述方法包括:获取待测图片,所述待测图片中包括至少一个铭牌区域,所述铭牌区域中包括至少一块铭牌;确定与所述待测图片对应的光源颜色;响应于所述光源颜色为非白光,对所述待测图片进行颜色校正;将所述待测图片输入铭牌识别模型中,输出得到铭牌颜色信息以及铭牌位置信息;基于所述铭牌位置信息对所述铭牌区域进行裁剪,得到铭牌图片;将所述铭牌图片输入光学字符识别OCR模型,输出得到与所述铭牌区域对应的文本内容。2.根据权利要求1所述的应用于厂区监控场景的铭牌颜色和文本一体化检测方法,其特征在于,所述响应于所述光源颜色为非白光,对所述待测图片进行颜色校正,包括:响应于所述光源颜色为非白光,确定所述待测图片中的最亮点;基于所述最亮点,对所述待测图片进行白平衡校正。3.根据权利要求1所述的应用于厂区监控场景的铭牌颜色和文本一体化检测方法,其特征在于,所述获取待测图片,包括:获取与所述待测图片对应的视频数据;对所述视频数据进行剪辑,得到所述待测图片。4.根据权利要求1所述的应用于厂区监控场景的铭牌颜色和文本一体化检测方法,其特征在于,所述铭牌识别模型为基于YOLOV5以及SENet注意力机制的人工智...

【专利技术属性】
技术研发人员:潘焱梁艳菊鲁斌
申请(专利权)人:无锡物联网创新中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1