一种解析房产证照片内容的方法技术

技术编号:17971260 阅读:39 留言:0更新日期:2018-05-16 11:52
本发明专利技术涉及一种解析房产证照片内容的方法。所述的解析房产证照片内容的方法包括以下步骤:1).对不同版本房产证照片进行采集,在数据库建立不同版本房产证模板;2).拍摄待识别房产证照片,识别字段区域,计算模板匹配度,选取最高匹配度的版本作为待识别的房产证的版本;3).根据房产证版本对房产证照片按照模板进行切割,得到每个内容字段所对应的字段图,然后对字段图进行识别。首先通过房产证照片自动识别出证件的版本信息,以此来代替人工根据肉眼以及经验去得出该房产证的版本信息,然后根据房产证的版本,自动获取照片里对应的数据信息,以此来代替人工根据肉眼去读取房产证上面各字段的内容。

【技术实现步骤摘要】
一种解析房产证照片内容的方法
本专利技术属于图像识别领域,更具体的说涉及一种解析房产证照片内容的方法。
技术介绍
随着国家法律法规的日渐完善,社会对于公共安全的要求越来越高,故有关部门在社会民生的多个领域都推行实名制,如上网实名制、开户实名制、手机实名制、房产交易等等。若个人信息的提取单纯靠人工录入及核对,必将导致低下的工作效率和较高的出错率,给业务双方带来严重不便。因此,对证件信息的快速、准确的采集成为一个越来越重要的课题。同时,随着计算机技术与信息技术的发展,图像识别技术获得了越来越广泛的应用。例如医疗诊断中各种医学图片的分析与识别、天气预报中的卫星云图识别、遥感图片识别、指纹识别、脸谱识别等,图像识别技术越来越多地渗透到我们的日常生活中。目前市面上的证件识别软件很多,也大大的提高了工作人员的信息采集效率。然而在传统的房地产行业,并没有任何一款产品能够做到房产证的信息采集,房产证信息的采集还是采用“肉眼识别,手动录入”进行信息的获取;传统的录入方式具有以下缺点:1.效率低下,2.准确率低,3.不方便数据转接。同时,由于房产证件在不同地域具有不同版本的信息,其全国的房产证种类繁多,跟识别带来不便,因此,有必要针对房产证特点,设计出一种能够有效识别解析各版本房产证照片内容的方法。
技术实现思路
针对上述问题,本专利技术为了克服现有方法的缺点,提供了一种解析房产证照片内容的方法,首先通过房产证照片自动识别出证件的版本信息,以此来代替人工根据肉眼以及经验去得出该房产证的版本信息,然后根据房产证的版本,自动获取照片里对应的数据信息,以此来代替人工根据肉眼去读取房产证上面各字段的内容。为达到上述目的,本专利技术提供如下技术方案:一种解析房产证照片内容的方法,所述的解析房产证照片内容的方法包括以下步骤:1).对不同版本房产证照片进行采集,在数据库建立不同版本房产证模板;2).拍摄待识别房产证照片,识别字段区域,计算模板匹配度,选取最高匹配度的版本作为待识别的房产证的版本;3).根据房产证版本对房产证照片按照模板进行切割,得到每个内容字段所对应的字段图,然后对字段图进行识别,对各个字段图所识别出的内容进行汇总。进一步,在步骤1)中,建立版本房产证模板时,记录每个版本房产证的标准宽度,以及每个信息字段的名称、位置、宽高。进一步,在步骤2)中,利用房产证边框自动查找技术识别字段区域,具体步骤为:1)利用Opencv中自适应二值化算法将图片从彩色、灰色照片转换为黑白两色图片;2)利用Opencv中FindContours算法获取图片上所有的轮廓的轮廓集合,枚举所有的点,计算任意两个点的长度,找出最长的长度对应的两个点,记作点1、点2;然后再枚举剩余的点,与点1点2行成的三角形,找出三角形周长最大的点,记作点3;然后再次枚举剩余的点,找出与点3距离最长的点,记作点4,点1、点2、点3、点4构成缩减后的轮廓;3)筛选出正确的轮廓:剔除凹四边形的轮廓,选择凸四边形轮廓,并在四边形的每个边取5个点,共20个点进行底色验证,获取识别字段区域。进一步,在步骤2)中,计算模板匹配度的具体步骤为:a.识别字段区域,根据模板中获取每个信息字段的坐标、宽高,得到该字段区域的四个顶点及四条边上的中点;b.使用8点验证法对模板的每个字段进行验证,确定有效模板信息字段的数量;c.计算模板匹配度,模板匹配度=有效模板信息字段数/模板信息字段数,得到最高匹配度的版本模板。进一步,在步骤3)中,将房产证图片,按照模板进行切割,得到每个内容字段所对应的字段图,采用OCR图像识别技术对字段文字信息进行识别。上述方法在房产证信息识别中的应用,但不限其在潜在应用领域如1、身份证识别;2、银行卡识别;3、户口簿识别;4、通用文字识别等中的具体应用。其中,本申请中所述数据库采用光敏半导体陶瓷动力存储模块,当光照到光敏半导体陶瓷动力模块上时,在光子能量的作用下,光敏材料产生载流子使电导增加,即产生光电导效应。所述光敏半导体陶瓷动力存储模块的原料组份及重量组份配比为:SiO245-50份、CdS1-5份、CdSe2-4份、Ag0.5-1份、氧化镁5-10份、ZrO21-5份、碳化钛1-4份、碳纤维6-9份、氮化硅15-25份、氧化钇3-6份。优选,所述光敏半导体陶瓷动力存储模块的原料组份及重量组份配比为:SiO245份、CdS1份、CdSe2份、Ag0.5份、氧化镁5份、ZrO21份、碳化钛1份、碳纤维6份、氮化硅15份、氧化钇3份。优选,所述光敏半导体陶瓷动力存储模块的原料组份及重量组份配比为:SiO250份、CdS5份、CdSe4份、Ag1份、氧化镁10份、ZrO25份、碳化钛4份、碳纤维9份、氮化硅25份、氧化钇6份。有益效果本专利技术的技术方案具有以下优点,具体表现在:1.本专利技术首先通过房产证照片自动识别出证件的版本信息,以此来代替人工根据肉眼以及经验去得出该房产证的版本信息,然后根据房产证的版本,自动获取照片里对应的数据信息,以此来代替人工根据肉眼去读取房产证上面各字段的内容,保证了房产证数据的采集及时性,准确性。2.本专利技术针对房产证件在不同地域具有不同版本的信息,房产证种类繁多的特点,通过建立模板匹配机制,实现了对不同模板的有效识别,保证识别的准确性。3.本专利技术应用领域广泛,可应用于如房产证信息识别、身份证识别、银行卡识别、户口簿识别,通用文字识别等中的具体应用,实现对上述对证件信息的快速、准确的采集。4、所述光敏半导体陶瓷动力存储模块性能优良,质地均匀,工作温度范围广,转换效率能够达到15-20%。附图说明图1为本专利技术的流程图;图2为本专利技术模板匹配度示意图a;图3为本专利技术模板匹配度示意图b;图4为光敏半导体陶瓷动力存储模块的SEM图。具体实施方式下面将结合本专利技术实施例和附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,一种解析房产证照片内容的方法,包括以下步骤:1)对不同版本房产证照片进行采集,在数据库建立不同版本房产证模板由于全国的房产证种类繁多,所以对不同版本的房产证做了识别的标签----“模板”,房产证模板是一个Json数据,里面记录了这个版本房产证的标准宽度,以及每个信息字段的名称、位置、宽高。2)拍摄待识别房产证照片,识别字段区域,计算模板匹配度,选取最高匹配度的版本作为待识别的房产证的版本a.识别字段区域,利用房产证边框自动查找技术识别字段区域,具体步骤为:1)利用Opencv中自适应二值化算法将图片从彩色、灰色照片转换为黑白两色图片,目的在于可以屏蔽掉一些干扰区域,同时让轮廓更加的清晰;2)利用Opencv中FindContours算法获取图片上所有的轮廓的轮廓集合,枚举所有的点,计算任意两个点的长度,找出最长的长度对应的两个点,记作点1、点2;然后再枚举剩余的点,与点1点2行成的三角形,找出三角形周长最大的点,记作点3;然后再次枚举剩余的点,找出与点3距离最长的点,记作点4,点1、点2、点3、点4构成缩减后的轮廓;3)筛选出正确的轮廓:通过观察以及研本文档来自技高网...
一种解析房产证照片内容的方法

【技术保护点】
一种解析房产证照片内容的方法,其特征在于,所述的解析房产证照片内容的方法包括以下步骤:1).对不同版本房产证照片进行采集,在数据库建立不同版本房产证模板;2).拍摄待识别房产证照片,识别字段区域,计算模板匹配度,选取最高匹配度的版本作为待识别的房产证的版本;3).根据房产证版本对房产证照片按照模板进行切割,得到每个内容字段所对应的字段图,然后对字段图进行识别,对各个字段图所识别出的内容进行汇总。

【技术特征摘要】
1.一种解析房产证照片内容的方法,其特征在于,所述的解析房产证照片内容的方法包括以下步骤:1).对不同版本房产证照片进行采集,在数据库建立不同版本房产证模板;2).拍摄待识别房产证照片,识别字段区域,计算模板匹配度,选取最高匹配度的版本作为待识别的房产证的版本;3).根据房产证版本对房产证照片按照模板进行切割,得到每个内容字段所对应的字段图,然后对字段图进行识别,对各个字段图所识别出的内容进行汇总。2.根据权利要求1所述的一种解析房产证照片内容的方法,其特征在于:在步骤1)中,建立版本房产证模板时,记录每个版本房产证的标准宽度,以及每个信息字段的名称、位置、宽高。3.根据权利要求1所述的一种解析房产证照片内容的方法,其特征在于:在步骤2)中,利用房产证边框自动查找技术识别字段区域,具体步骤为:1)利用Opencv中自适应二值化算法将图片从彩色、灰色照片转换为黑白两色图片;2)利用Opencv中FindContours算法获取图片上所有的轮廓的轮廓集合,枚举所有的点,计算任意两个点的长度,找出最长的长度对应的两个点,记作点1、点2;然后再枚举剩余的点,与点1点2行成的三角形,找出三角形周长最大的点,记作点3;然后再次枚举剩余的点,找出与点3距离最长的点,记作点4,点1、点2、点3、点4构成缩减后的轮廓;3)筛选出正确的...

【专利技术属性】
技术研发人员:俞中宏张佳敏蔡立俊曾智磊张德恩
申请(专利权)人:深圳房讯通信息技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1