一种基于图片信息聚类的信息批量提取方法技术

技术编号:32752523 阅读:24 留言:0更新日期:2022-03-20 09:02
本发明专利技术公开了一种基于图片信息聚类的信息批量提取方法、系统及计算机可读存储介质,方法包括:从待识别的图像中提取出商品对象和文字对象并分类编号,确定每个对象的坐标系;对得到的不同对象边缘打点并确定所打点的坐标;将相邻的不同类对象利用边缘点进行碰撞计算,若相邻两个不同类对象的边缘点之间的距离小于预设值则将当前两个对象作为组合对象;将组合的对象继续与其他对象进行碰撞计算,若边缘点之间的距离大于当前已组合对象边缘点之间距离的预设倍数,则判定该对象不属于同一组合内对象,继续与其他不同类对象碰撞计算,直到所有对象均组合,输出组合对象。本发明专利技术能够实现复杂背景中关联对象的组合识别并进行信息提取。息提取。息提取。

【技术实现步骤摘要】
一种基于图片信息聚类的信息批量提取方法


[0001]本专利技术涉及互联网大数据智能处理
,更具体地,涉及一种基于图片信息聚类的信息批量提取方法、系统及计算机可读存储介质。

技术介绍

[0002]OCR识别技术框架是互联网公司经常用来识别图文信息的一项重要技术,技术本身是通过扫描仪或相机等光学输入设备获取纸张上的文字、图片信息,利用各种模式识别算法对文字的形态结构进行分析,形成相应的字符特征描述,通过合适的字符匹配方法将图像中的文字转换成文本格式。
[0003]对于大数据分析大量图片,是一项很实用高效的技术,但传统的识别技术往往会只是单条信息的扫描方式,把识别出来的文字当成单独个体,并没有识别组合内容的功能,以块状扫描的方式来处理,这便经常出现识别出来的单独文字无法准确得知描述对象的真实语义情况。
[0004]现有技术公开了一种图像中的对象识别方法及装置,所述方法包括:对待识别图像进行预处理,获得所述待识别图像的二值图像;将所述二值图像切割成多个子区域,并从所述多个子区域中选出第一子区域,所述第一子区域为包含有预设像素点的子区域;基于不同第一子区域在所述二值图像中的距离,对所述第一子区域进行合并得到至少一个第二子区域;识别所述第二子区域中的目标对象。该方案针对的是复杂背景中的对象识别,没有解决关联对象或组合对象的识别问题。

技术实现思路

[0005]本专利技术为克服上述现有的图片信息提取方法没有解决关联对象或组合对象的识别提取的缺陷,提供一种基于图片信息聚类的信息批量提取方法、系统及计算机可读存储介质。
[0006]本专利技术的首要目的是为解决上述技术问题,本专利技术的技术方案如下:本专利技术第一方面提供了一种基于图片信息聚类的信息批量提取方法,包括以下步骤:S1:利用OCR识别方法从待识别的图像中提取出商品对象和文字对象并分类编号,将每张图像中的对象均作为独立对象并确定每个对象的坐标系;S2:对每个图像中所有的商品对象和文字对象边缘打点,所打点记为边缘点,根据每个对象的坐标系确定边缘点的坐标;S3:将相邻的不同类对象利用边缘点进行碰撞计算,若相邻两个不同类对象的边缘点之间的距离小于预设值则将当前两个对象作为组合对象;S4:将组合的两个对象继续分别与其他不同类对象进行碰撞计算,若边缘点之间的距离大于当前已组合对象之间边缘点之间距离的预设倍数,则判定该对象不属于同一组合内对象,继续寻找其他不同类对象进行碰撞计算,直到所有对象均已组合,输出组合对
象。
[0007]进一步的,步骤S1中利用OCR识别方法从左至右,从上至下识别扫描从待识别的图像中提取出商品对象和文字对象。
[0008]进一步的,所述对每个图像中所有的商品对象和文字对象边缘打点具体过程为:确定打点的对象,首先在其左上角、右上角、左下角、右下角的最远距离分别取4个点,将四点连线构造成一个不规则矩形;分别取左上角到右上角、左下角到右下角、左上角到左下角、右上角到右下角的点与点之间的中心,则分别对应确定出上、下、左、右4个点。
[0009]进一步的,所述碰撞计算过程为:将两个对象相邻的点分别记为P1和P2,点P1的坐标记为(x1,y1),点P2的坐标记为(x2,y2),则两个对象在x轴相距的距离记为|x2

x1|。
[0010]进一步的,步骤S4所述预设倍数为大于或等于2。
[0011]进一步的,步骤S4中,在继续寻找其他不同类对象进行碰撞计算时,若没有识别到有效数据,也结束当前流程同时输出已组合的对象。
[0012]进一步的,所述碰撞计算仅在不同类型对象间进行。
[0013]本专利技术第二方面提供了一种基于图片信息聚类的信息批量提取系统,该系统包括:存储器、处理器,所述存储器中包括基于图片信息聚类的信息批量提取方法程序,所述基于图片信息聚类的信息批量提取方法程序被所述处理器执行时实现如下步骤:S1:利用OCR识别方法从待识别的图像中提取出商品对象和文字对象并分类编号,将每张图像中的对象均作为独立对象并确定每个对象的坐标系;S2:对每个图像中所有的商品对象和文字对象边缘打点,所打点记为边缘点,根据每个对象的坐标系确定边缘点的坐标;S3:将相邻的不同类对象利用边缘点进行碰撞计算,若相邻两个不同类对象的边缘点之间的距离小于预设值则将当前两个对象作为组合对象;S4:将组合的两个对象继续分别与其他不同类对象进行碰撞计算,若边缘点之间的距离大于当前已组合对象之间边缘点之间距离的预设倍数,则判定该对象不属于同一组合内对象,继续寻找其他不同类对象进行碰撞计算,直到所有对象均已组合,输出组合对象。
[0014]进一步的,步骤S1中利用OCR识别方法从左至右,从上至下识别扫描从待识别的图像中提取出商品对象和文字对象。
[0015]本专利技术第三方面提供一种计算机可读存储介质,所述计算机可读存储介质中包括一种基于图片信息聚类的信息批量提取方法程序,所述一种基于图片信息聚类的信息批量提取方法程序被处理器执行时,实现所述的一种基于图片信息聚类的信息批量提取方法的步骤。
[0016]与现有技术相比,本专利技术技术方案的有益效果是:本专利技术首先对图片中的不同对象进行识别分类,然后对不同独立对象进行距离计算进而将不同对象进行组合,本专利技术能够实现复杂背景中关联对象的组合识别并进行信息提取。
附图说明
[0017]图1为本专利技术一种基于图片信息聚类的信息批量提取方法流程图。
[0018]图2为本专利技术实施例识别效果图。
[0019]图3为本专利技术实施例不同对象相邻点示意图。
[0020]图4为本专利技术实施例不同对象相邻点匹配示意图。
[0021]图5为本专利技术实施例已组合对象相邻点碰撞计算示意图。
具体实施方式
[0022]为了能够更清楚地理解本专利技术的上述目的、特征和优点,下面结合附图和具体实施方式对本专利技术进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
[0023]在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是,本专利技术还可以采用其他不同于在此描述的其他方式来实施,因此,本专利技术的保护范围并不受下面公开的具体实施例的限制。
[0024]实施例1如图1所示,本专利技术第一方面提供了一种基于图片信息聚类的信息批量提取方法,包括以下步骤:S1:利用OCR识别方法从待识别的图像中提取出商品对象和文字对象并分类编号,将每张图像中的对象均作为独立对象并确定每个对象的坐标系;在一个具体的实施例中,例如在一张商品促销广告详情图,图片中有多个手机图像、多个对应的商品价格,并且图像+文字为上下布局,从左到右排列,如图2所示,手机图像下方带有商品名称、商品价格,这时便需要将他们识别成一个组合,指这段文字名称、价格对应的是这个手机图像。
[0025]首先需从待识别的图像中提取出商品对象和文字对象,可以采用OCR识别方法从左至右,从上至下识别扫描分别提取出商品对象和文字对象,例如商品对象001,文字对象00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图片信息聚类的信息批量提取方法,其特征在于,包括以下步骤:S1:利用OCR识别方法从待识别的图像中提取出商品对象和文字对象并分类编号,将每张图像中的对象均作为独立对象并确定每个对象的坐标系;S2:对每个图像中所有的商品对象和文字对象边缘打点,所打点记为边缘点,根据每个对象的坐标系确定边缘点的坐标;S3:将相邻的不同类对象利用边缘点进行碰撞计算,若相邻两个不同类对象的边缘点之间的距离小于预设值则将当前两个对象作为组合对象;S4:将组合的两个对象继续分别与其他不同类对象进行碰撞计算,若边缘点之间的距离大于当前已组合对象之间边缘点之间距离的预设倍数,则判定该对象不属于同一组合内对象,继续寻找其他不同类对象进行碰撞计算,直到所有对象均已组合,输出组合对象。2.根据权利要求1所述的一种基于图片信息聚类的信息批量提取方法,其特征在于,步骤S1中利用OCR识别方法从左至右,从上至下识别扫描从待识别的图像中提取出商品对象和文字对象。3.根据权利要求1所述的一种基于图片信息聚类的信息批量提取方法,其特征在于,所述对每个图像中所有的商品对象和文字对象边缘打点具体过程为:确定打点的对象,首先在其左上角、右上角、左下角、右下角的最远距离分别取4个点,将四点连线构造成一个不规则矩形;分别取左上角到右上角、左下角到右下角、左上角到左下角、右上角到右下角的点与点之间的中心,则分别对应确定出上、下、左、右4个点。4.根据权利要求1所述的一种基于图片信息聚类的信息批量提取方法,其特征在于,所述碰撞计算过程为:将两个对象相邻的边缘点分别记为P1和P2,点P1的坐标记为(x1,y1),点P2的坐标记为(x2,y2),则两个对象在x轴相距的距离记为|x2

x1|。5.根据权利要求1所述的一种基于图片信息聚类的信息批量提取方法,其特征在于,步骤S4所述预设倍数...

【专利技术属性】
技术研发人员:纪俊光黎慧燕陈学言
申请(专利权)人:广东数源智汇科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1