基于计算机视觉图像识别的数据智能采集方法技术

技术编号：20329636 阅读：394 留言：0更新日期：2019-02-13 06:03

本发明专利技术公开基于计算机视觉图像识别的数据智能采集方法，包括：S1、将业务记录内容分类，选取数值类和判断类；S2、设定判断类定义规则，并将其与位置信息保存在数据库中；设定数值类定义规则，并将其与位置信息保存在数据库中；将每个产品的唯一标识符和标识符区域的位置信息保存在数据中；S3、在判断类的标记区域、数值类的标记区域标记结果，在标识符的标记区域内标记标识符；S4、实时图像采集，并记录图像采集时间点；S5、对图像中的业务记录内容和结果进行AI识别；S6、将标记结果转换为业务数据。本发明专利技术颠覆传统行业数据采集的思维模式，增强企业数字化管理能力，赋能传统行业，加快其转型升级，加速人工智能实用化进程。

全部详细技术资料下载

【技术实现步骤摘要】
基于计算机视觉图像识别的数据智能采集方法
本专利技术属于计算机软件领域，具体涉及基于计算机视觉图像识别的数据智能采集方法。
技术介绍
文字识别技术：光学字符识别(OCR)是针对印刷体字符，采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件，并通过识别软件将图像中的文字转换成文本格式，供文字处理软件进一步编辑加工的技术。该项技术主要用于印刷体纸质文档扫描(例如扫描仪或数码相机)识别转化为计算机文字和手写体文字识别，其中手写体文字识别应用于手机、平板和手写板上实时识别。技术缺陷如下：工商、生产制造型企业在生产现场管理过程中存在大量数据需要手工进行记录，不同岗位有固定格式的数据记录纸质文档，采用传统的OCR文字识别的方式自动抓取文字并转化为业务数据方面，存在拒识率、误识率高等问题。由于识别准确率不高，导致该项技术无法在企业生产经营中得到广泛应用，其主要原因如下：第一、相同格式的纸质文档记录工具不同，造成文字线条粗细、颜色不同、字迹深浅都存在差异，造成识别率较低；第二、不同工作人员的书写习惯不一致，导致记录文字规整、潦草程度不一致，造成文字无法识别；第三、针对同一格式的纸质文档，不同人员不同时间点，记录的起始位置不同，传统的文字识别技术无法辨别记录发生变化的时间点和内容，造成无法准确记录业务发生的时间和该时间段记录的业务数据。
技术实现思路
为了解决现有技术存在的上述问题，本专利技术目的在于提供基于计算机视觉图像识别的数据智能采集方法。本专利技术的智能数据采集方法应用于农牧业、工商企业生产现场原始数据的计算机视觉图像识别自动采集，按照业务规则自动抓取图像指定区...

【技术保护点】
1.基于计算机视觉图像识别的数据智能采集方法，其特征在于：包括如下步骤：S1、梳理业务记录内容，将业务记录内容按标识符、数值类、判断类和字符类进行分类，选取数值类和判断类；S2、将判断类的标记区域划分为多个空白格子，定义每个格子所代表的内容，即判断类定义规则，并将其与第一位置信息保存在数据库中；数值类的标记区域划分多个空白格子，依据数值结果范围，设计满足数值的不同量级数字组合方式，并按照量级规则排列在各空白格子内，即数值类定义规则，并将其与第二位置信息保存在数据库中；将每个产品的唯一标识符和标识符区域的第三位置信息保存在数据中；S3、在判断类的标记区域的空白格子标记结果；在数值类的标记区域的数字标记结果；在标识符的标记区域内标记标识符；S4、通过现场固定或者移动的图像采集设备对记录卡进行实时图像采集，并记录图像采集时间点；S5、对图像中的业务记录内容和结果进行AI识别；S6、将标记结果转换为业务数据。

【技术特征摘要】
1.基于计算机视觉图像识别的数据智能采集方法，其特征在于：包括如下步骤：S1、梳理业务记录内容，将业务记录内容按标识符、数值类、判断类和字符类进行分类，选取数值类和判断类；S2、将判断类的标记区域划分为多个空白格子，定义每个格子所代表的内容，即判断类定义规则，并将其与第一位置信息保存在数据库中；数值类的标记区域划分多个空白格子，依据数值结果范围，设计满足数值的不同量级数字组合方式，并按照量级规则排列在各空白格子内，即数值类定义规则，并将其与第二位置信息保存在数据库中；将每个产品的唯一标识符和标识符区域的第三位置信息保存在数据中；S3、在判断类的标记区域的空白格子标记结果；在数值类的标记区域的数字标记结果；在标识符的标记区域内标记标识符；S4、通过现场固定或者移动的图像采集设备对记录卡进行实时图像采集，并记录图像采集时间点；S5、对图像中的业务记录内容和结果进行AI识别；S6、将标记结果转换为业务数据。2.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法，其特征在于：所述标识符包括二维码和条码的一种或两种。3.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法，其特征在于：所述步骤S2中，所述第一位置信息包括判断类的标记区域在记录卡中的位置信息和各空白格子在记录卡中的位置信息；所述第二位置信息包括数值类的标记区域在记录卡中的位置信息和各数字在记录卡中的位置信息；所述第三位置信息包括标识符区域的在记录卡中的位置信息。4.根据权利要求1所述的基于计算机视觉图像识别的数据智能采集方法，其特征在于：所述步骤S3中，在判断类的标记区域标记的方式为涂抹或勾选；在数值...

【专利技术属性】
技术研发人员：张海峰，张勇，
申请(专利权)人：四川正狐智慧科技有限公司，
类型：发明
国别省市：四川,51

全部详细技术资料下载我是这个专利的主人