网络图像识别处理方法,计算机可读存储介质和移动终端技术

技术编号:23162168 阅读:42 留言:0更新日期:2020-01-21 22:04
本发明专利技术公开了一种用于网络图像识别的处理方法使得可以准确高效地从网络平台上的不可编辑格式的数据中提取出可编辑数据以允许自动批量地对网络平台上的经营主体进行监管的图像识别处理方法,其包括:提取目标数据,旋转对齐该目标数据并进行二值化,识别多个字符串及其在目标数据中的坐标位置,将多个字符串分为第一部分和第二部分,查找属性表将第一部分字符串分为多个预设类别,对第二部分的字符串赋予权重,并将每个预设类别的字符串与第二部分的字符串之中权重最高的一个进行关联。本发明专利技术还公开了计算机可读存储介质和移动终端,可用于以更高效和准确的方式来批量提取和存储用于监管网络经营主体的数据。

Network image recognition processing method, computer readable storage medium and mobile terminal

【技术实现步骤摘要】
网络图像识别处理方法,计算机可读存储介质和移动终端
本申请关于图像处理技术的领域,更具体地关于一种用于网络图像识别的处理方法,以及计算机可读存储介质和移动终端。
技术介绍
在网络监管领域,有关部门经常需要在网络上对经营主体的经营相关信息进行核查。由于网络上经营主体的各项信息经常存在信息录入不准确,信息错误,信息过期,信息为不可编辑格式需要人工辨认等问题以及监管与不同网络系统的兼容性,通常需要人工对经营主体在网络平台上所录入的数据进行抽查记录和判断正确与否,再将其存储到监控系统中进行显示。这显然即耗费人力物力,又在面对大量待分析数据时无能为力(如网络购物网站上本地区的经营主体可能高达上万家)。因此,需要一种能够将网络平台上反映商品、证书、许可证等不可编辑的图片等格式的待监管数据准确地提取出来,并批量以固定格式存储以提高后续监管过程的效率的处理方法,同时需要解决现有OCR技术中所识别出的文字信息如何进行正确分类以确保监管正确性的问题。
技术实现思路
本专利技术的目的在于提供一种用于网络图像识别的处理方法使得可以准确高效地从网络平本文档来自技高网...

【技术保护点】
1.一种用于网络图像识别的处理方法,其特征在于包括如下步骤:/n从目标地址以图像形式提取目标数据;/n通过将所述目标数据的多个预设区域中像素值的分布特征与预先保存的模板对比来旋转所述目标数据;/n将旋转后的所述目标数据二值化;/n从二值化的所述目标数据中识别多个字符串及其在所述目标数据中的坐标位置;/n将所述多个字符串分为第一部分和第二部分,所述第一部分仅包含汉字字符而所述第二部分仅包含字母或数字字符;/n查找预先保存的属性表将所述第一部分字符串分为多个预设类别;/n根据所述第二部分的字符串的坐标位置距离每个预设类别的字符串的坐标位置的位移矢量,长度与所述预设类别的字符串的长度的对比以及字符串...

【技术特征摘要】
1.一种用于网络图像识别的处理方法,其特征在于包括如下步骤:
从目标地址以图像形式提取目标数据;
通过将所述目标数据的多个预设区域中像素值的分布特征与预先保存的模板对比来旋转所述目标数据;
将旋转后的所述目标数据二值化;
从二值化的所述目标数据中识别多个字符串及其在所述目标数据中的坐标位置;
将所述多个字符串分为第一部分和第二部分,所述第一部分仅包含汉字字符而所述第二部分仅包含字母或数字字符;
查找预先保存的属性表将所述第一部分字符串分为多个预设类别;
根据所述第二部分的字符串的坐标位置距离每个预设类别的字符串的坐标位置的位移矢量,长度与所述预设类别的字符串的长度的对比以及字符串之中一个或多个字符的校验和来对所述第二部分的字符串赋予权重,从而将每个预设类别的字符串与所述第二部分的字符串之中权重最高的一个进行关联;以及
存储和显示每个预设类别的字符串以及其所关联的一个第二部分的字符串。


2.权利要求1所述的方法,其特征在于所述权重随着...

【专利技术属性】
技术研发人员:李友宙钟央丹
申请(专利权)人:浙江善政科技有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1