基于OCR技术获取车辆仪表盘总行驶里程数的方法及装置制造方法及图纸

技术编号:38229044 阅读:14 留言:0更新日期:2023-07-25 17:58
本发明专利技术公开了一种基于OCR技术获取车辆仪表盘总行驶里程数的方法及装置,包括如下步骤:步骤1、拍摄仪表盘图片,并将图片上传服务器;步骤2、调用OCR技术识别图片中的文字信息和位置信息;步骤3、建立误识别库,并向库中添加较正规则;步骤4、根据误识别库中的较正规则对步骤2中识别出的信息进一步校正,获取仪表盘的高精度文字信息;步骤5、提取仪表盘的高精度文字信息中的关键识别特征,包括位置特征、关键文字特征、数值大小特征、整数特征;步骤6、收集各种车型的仪表盘图片,构成训练集合,根据上述步骤提取关键识别特征,并通过机器学习算法训练识别模型等。本发明专利技术能自动、高效、低成本、准确获取大部分车型的行驶里程总数。准确获取大部分车型的行驶里程总数。准确获取大部分车型的行驶里程总数。

【技术实现步骤摘要】
基于OCR技术获取车辆仪表盘总行驶里程数的方法及装置


[0001]本专利技术涉及图像和数据识别
,特别涉及一种基于OCR技术获取车辆仪表盘总行驶里程数的方法及装置。

技术介绍

[0002]目前获取车辆行驶总里程的方法主要有两种:一种从车辆仪表盘看到总里程数然后手动录入保存,另一种是基于硬件设备自动读取车辆行车电脑上的总里程数。人工手动录入里程数容易录错,而且效率比较低;基于硬件设备读取行车电脑的方法,需要车辆协议支持,市场上车辆总类很多,而且很多协议不公开,不标准,这样硬件设备能读取的车辆类型受到很大的限制,另外硬件设备价格通常比较贵。获取的车辆总里程数可以用于车辆维修保养提醒,统计每趟行程的里程数等车辆管理功能。上述方法中,从车辆仪表盘看到总里程数然后手动录入保存,是一种易错,效率低的方法。基于硬件设备自动读取车辆行车电脑上的总里程数方法受限于车辆协议的限制,所能支持的车型种类有限,无法支持大部分车辆的里程读取,并且费用比较高。
[0003]目前,随着手机摄像功能的普及和分辨率的提高、OCR技术的成熟,可通过OCR技术智能识别车辆仪表盘公里数,虽然这种操作比较简单,但是准确率依然无法得到保证。

技术实现思路

[0004]本专利技术的目的在于提供一种基于OCR技术获取车辆仪表盘总行驶里程数的方法及装置,以克服现有技术中的不足。
[0005]为实现上述目的,本专利技术提供如下技术方案:本专利技术公开了一种基于OCR技术获取车辆仪表盘总行驶里程数的方法,包括如下步骤:步骤1、拍摄仪表盘图片,并将图片上传服务器;步骤2、调用OCR技术识别图片中的文字信息和位置信息;步骤3、建立误识别库,并向库中添加较正规则;步骤4、根据误识别库中的较正规则对步骤2中识别出的信息进一步校正,获取仪表盘的高精度文字信息;步骤5、提取仪表盘的高精度文字信息中的关键识别特征,包括位置特征、关键文字特征、数值大小特征、整数特征;步骤6、收集各种车型的仪表盘图片,构成训练集合,根据上述步骤提取关键识别特征,并通过机器学习算法训练识别模型;步骤7、识别模型根据高精度文字信息中的关键识别特征准确提取行驶总里程数。
[0006]作为优选的,所述步骤3中的校正规则包括:数字1误识别为字母l、数字1与误识别为冒号、数字0误识别为大小写字母O和o、单位km误识别为krm。
[0007]作为优选的,所述误识别库中的校正规则实现动态增加,以适应新的仪表盘图片
和防止误识别。
[0008]作为优选的,根据所述关键识别特征中的位置特征提取行驶总里程数的步骤具体如下:将拍摄的仪表盘图片划分为3
×
3的方格,根据总里程数通常落在第二行第二个方格或者第三行第二个方格,重点提取和识别上述两个方格中的文字信息。
[0009]作为优选的,所述关键识别特征中的关键文字特征包括与总里程关联的正向特征和需要过滤的负向特征,其中正向特征包括位于总里程附近的里程单位:km、文字:总里程、以及英文缩写:ODO;负向特征包括文字:行驶里程、文字:速度、文字:油耗、英文缩写:TRIP、速度单位:km/h、温度单位:℃;重点提取和识别正向特征位置附近的文字信息,过滤负向特征位置附近的文字信息。
[0010]作为优选的,根据所述关键识别特征中的数字大小特征提取行驶总里程数的步骤如下:根据小于100的数值基本为速度、温度、湿度类数据,介于100至1000之间的数值基本为单程里程数,将上述两个大小区间的数值标记为干扰数据,进行提前过滤。
[0011]作为优选的,根据所述关键识别特征中的整数特征提取行驶总里程数的步骤如下:判断提取的数值是否为整数,对于不是整数的数值进行过滤。
[0012]本专利技术公开了一种基于OCR技术获取车辆仪表盘总行驶里程数装置,所述装置包括存储器和一个或多个处理器,所述存储器中存储有可执行代码,所述一个或多个处理器执行所述可执行代码时,用于实现上述基于OCR技术获取车辆仪表盘总行驶里程数的方法。
[0013]本专利技术的有益效果:本专利技术一种基于OCR技术获取车辆仪表盘总行驶里程数的方法及装置,本专利技术能自动、高效、低成本、准确获取大部分车型的行驶里程总数,优点具体如下:1、建立可动态添加较正规则的误识别库,进一步保证OCR技术的精度;2、多种关键识别特征的提取,提高机器学习模型的识别准确性;3、运用机器学习模型并可动态添加基于规则的算法,用大量的仪表盘图片训练模型,支持各种各样的车辆仪表盘图片识别,覆盖大部分车型;4、不需要额外的硬件设备,成本低。
附图说明
[0014]图1是本专利技术实施例的整体流程示意图;图2是本专利技术实施例训练好的识别模型提取总里程数流程图;图3是本专利技术实例1仪表盘原始图片;图4是本专利技术实例1仪表盘OCR识别标底色图片;图5是本专利技术实例2仪表盘原始图片;图6是本专利技术实例2仪表盘OCR识别标底色图片;图7是本专利技术实施例装置示意图。
具体实施方式
[0015]为使本专利技术的目的、技术方案和优点更加清楚明了,下面通过附图及实施例,对本专利技术进行进一步详细说明。但是应该理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限制本专利技术的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避
免不必要地混淆本专利技术的概念。
[0016]本专利技术提供的基于OCR技术智能识别车辆仪表盘公里数的方法,能够自动、高效、低成本获取大部分车型的行驶里程总数。车辆仪表盘有总里程数,然后拍摄的图片角度端正、分辨率不是太低,本方法都能识别出来,准确率在95%以上。要实现车车辆仪表盘通用识别总里程数主要有下面几个难点:1、由于车辆种类很多,每种车的仪表盘样式都不一样,即使同一种车型不同年份,仪表盘也可能差别很大,这给本方案识别所能车型覆盖率带来了非常大的挑战;2、仪表盘上除了总里程数,还有本次行程数,速度、温度、湿度、油耗等很多干扰数据,而且这几个数据特征相似度很高,不太容易区分,给本方案识别的准确度带来很大的挑战,为了分辨出总里程数,需要提取非常好的特征用于筛选出总里程数,去除干扰数据。
[0017]3、高精度OCR识别出来的文字信息也不能保证100%正确,会有一定的错误率,在各种各样的仪表盘就会显得比较明显。
[0018]为了解决上面的难点,本专利技术实施例提供一种基于OCR技术获取车辆仪表盘总行驶里程数的方法,如图1所示,具体步骤如下:步骤1、拍摄仪表盘图片,并将图片上传服务器。
[0019]步骤2、调用OCR技术识别图片中的文字信息和位置信息。
[0020]步骤3、建立误识别库,并向库中添加较正规则;本实施例总结了下面几个关键的校正规则:1、数字“1”被误识别成小写字母”l”,比如466141km误识别成46614lkm;2、数字“1”被误识别成冒号“:”,这种情况一般会出现在识别液晶体数字上;3、数字“0”被误识别成大小写字母“O”、“o”;4、“km”被误识别成“krm”。
[0021]建立上述这样的误识别库,然后进行纠正,这样误识本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于OCR技术获取车辆仪表盘总行驶里程数的方法,其特征在于:包括如下步骤:步骤1、拍摄仪表盘图片,并将图片上传服务器;步骤2、调用OCR技术识别图片中的文字信息和位置信息;步骤3、建立误识别库,并向库中添加较正规则;步骤4、根据误识别库中的较正规则对步骤2中识别出的信息进一步校正,获取仪表盘的高精度文字信息;步骤5、提取仪表盘的高精度文字信息中的关键识别特征,关键识别特征包括位置特征、关键文字特征、数值大小特征、整数特征;步骤6、收集各种车型的仪表盘图片,构成训练集合,根据上述步骤提取关键识别特征,并通过机器学习算法训练识别模型;步骤7、识别模型根据高精度文字信息中的关键识别特征准确提取行驶总里程数。2.如权利要求1所述的基于OCR技术获取车辆仪表盘总行驶里程数的方法,其特征在于:所述步骤3中的校正规则包括:数字1误识别为字母l、数字1与误识别为冒号、数字0误识别为大小写字母O和o、单位km误识别为krm。3.如权利要求1所述的基于OCR技术获取车辆仪表盘总行驶里程数的方法,其特征在于:所述误识别库中的校正规则实现动态增加,以适应新的仪表盘图片和防止误识别。4.如权利要求1所述的基于OCR技术获取车辆仪表盘总行驶里程数的方法,其特征在于:根据所述关键识别特征中的位置特征提取行驶总里程数的步骤具体如下:将拍摄的仪表盘图片划分为3
×
3的方格,根据总里程数通常落在第二行第二个方格或者第三行第二个方格,重点...

【专利技术属性】
技术研发人员:汪艺杰泮波汤译祥揭振宇王鹏程
申请(专利权)人:杭州圆点科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1