一种图片样本采集设备及方法技术

技术编号:20005387 阅读:24 留言:0更新日期:2019-01-05 17:52
本发明专利技术公开了一种图片样本采集设备,包括输入输出模块、环境因素自动获取模块、实时样本生成模块、矫正样本生成模块、样本分类器、数据存储模块和数据转发模块,所述环境因素自动获取模块用于自动获取样本的环境因素;所述实时样本生成模块用于实时采集画面样本并存储;所述样本分类器用于对采集的样本进行自动识别分类并检测出错误分类样本;所述矫正样本生成模块用于对被所述样本分类器识别的错误分类样本进行矫正,并将矫正结果保存为矫正样本;所述数据存储模块用于将采集的样本进行存储;所述数据转发模块用于将采集的样本通过网络进行转发。采用该技术方案解决了现有样本采集中样本数量大、占用存储空间大及样本不够多样化等问题。

A Picture Sample Acquisition Equipment and Method

The invention discloses an image sample acquisition device, which comprises an input and output module, an automatic acquisition module of environmental factors, a real-time sample generation module, a correction sample generation module, a sample classifier, a data storage module and a data forwarding module. The automatic acquisition module of environmental factors is used for automatically acquiring environmental factors of samples, and the real-time sample generation module is used for real-time acquisition. Samples are collected and stored; the sample classifier is used to automatically recognize and classify the collected samples and detect the error classification samples; the correction sample generation module is used to correct the error classification samples identified by the sample classifier, and the correction results are saved as the correction samples; the data storage module is used to store the collected samples; The data forwarding module is used to forward the collected samples through the network. The technical scheme solves the problems of large number of samples, large storage space and insufficient diversity of samples in the existing sample collection.

【技术实现步骤摘要】
一种图片样本采集设备及方法
本专利技术涉人工智能领域,特别涉及一种图片样本采集设备及方法。
技术介绍
人工智能(AI:ArtificialIntelligence)时代,得益于深度学习技术、车联网(V2X)技术的发展,基于摄像头的环境感知将应用于智能驾驶、高精度地图、人脸识别等各种应用场景,但是受成像条件和学习样本限制。成像条件指路面状况,天气状况等客观因素;而学习样本是指在深度学习过程中,用于训练的图片样本。基于深度学习技术,摄像头对环境感知的效果很大程度依赖于训练样本是否丰富多样。以行人检测为例,训练样本的采集需要包含各种环境场景因素及各种目标类型:1)环境场景因素包括:季节:春/夏/秋/冬;时间:白天/夜晚/傍晚/黎明;天气:晴/多云/雨/雾/冰雪;场地类别:城市道路/高速公路/乡村/停车场/隧道;光照强度:1级/2级/3级/4级…;2)目标类型包括:行人类型:成人/小孩/老人衣着类型:汉族/壮族/满族/回族等等;衣着颜色:深颜色/浅颜色;行人体型:完整的人/骑车的人/上半身行人/撑伞的行人等等;行人姿态:禁止/行走/跑步等等;可见,如何快速获取到丰富的训练样本,是深度学习需要解决的问题。现阶段,训练样本的获取步骤包括采集视频、视频转换成图片、图片切割出样本;每个过程都需要用专门的工具花费大量的人力、物力和时间,一方面,采集的数据冗余度高,可用性低,另一方面,样本不够多样化,不满足竞争激烈下的快速技术突破需求。现有技术存在的问题如下:1)采集视频时录制的视频数据量大,每秒差不多产生70M左右的视频数据,很耗数据存储资源;视频转换成图片后,图片同样占据很大的存储资源;而且这么大的数据存储需求,由于缺少比较高效的存储控制策略,数据存储的工作很费时间。2)新样本与旧样本冗余度高,造成样本可用性低。3)样本难以做统计与分析,难以评估样本覆盖率,难以对样本采集工作做出专业的评估与计划。4)样本需求量大且场景众多,但采集工作却未普及到各场景当事人,采集的数据不够多样化。
技术实现思路
本专利技术实施例的目的在于提供一种图片样本采集设备及方法,解决了现有样本采集中样本数量大、占用存储空间大及样本不够多样化等问题。本专利技术实施例提供的一种图片样本采集设备,包括输入输出模块、环境因素自动获取模块、实时样本生成模块、矫正样本生成模块、样本分类器、数据存储模块和数据转发模块,所述输入输出模块用于实现设备的输入输出功能;所述环境因素自动获取模块用于自动获取样本的环境因素;所述实时样本生成模块用于实时采集画面样本并存储;所述样本分类器用于对采集的样本进行自动识别分类并检测出错误分类样本;所述矫正样本生成模块用于对被所述样本分类器识别的错误分类样本进行矫正,并将矫正结果保存为矫正样本;所述数据存储模块用于将采集的样本进行存储;所述数据转发模块用于将采集的样本通过网络进行转发。可选地,所述数据存储模块删除实时图片样本中检测没有错误分类的样本,保存检测错误分类的实时样本和对应的矫正样本。可选地,所述图片样本采集设备与云端服务器通讯连接,同步所述云端服务器中的样本分类器。可选地,所述云端服务器包括分类器管理模块、样本管理模块和样本统计与分析模块,所述分类器管理模块用于实现对样本分类器的版本管理及推送各种样本分类器给所述图片样本采集设备;所述样本管理模块用于实现对样本分类存储;所述样本统计与分析模块用于实现对样本进行统计分析。可选地,所述实时样本生成模块还用于将摄像机实时采集的视频图像实时转换为图片,并将图片保存为实时样本。可选地,所述样本分类器对采集的所述图片样本进行分类编码标记,将各层编码值写入文件名,文件中存储当前采集数据的时间和地点。另外,本专利技术还提供了一种图片样本采集方法,包括:Step1:进入监控模式,实时采集和显示视频图像;Step2:判断是否进入实时样本采集模式,是则实时采集视频图像的画面样本并存储;Step3:否则进入矫正样本采集模式,检测出错误目标,并将矫正结果保存为矫正样本;Step4:判断是否退出样本采集模式,如果否则转入step2,如果是则进一步判断是否进入优化存储数据,是则优化存储数据,否则跳转至下一步,其中,所述优化存储数据是遍历实时采集的样本,判断实时采集的样本是否被矫正过,是则更改文件名及样本存储文档,否则删除;Step5:判断是否转发数据,是则转发,否则暂不转发数据;Step6:判断是否进入视频监控模式,是则进入step1,否则退出。可选地,采集实时样本包括采集实时样本参数配置、环境因素自动获取、视频数据采集、按照样本参数配置中的样本参数将视频数据实时转成图片数据并保存。可选地,所述样本参数配置包括:视频转成图片的格式、图片数量、生成图片的时间间隔、图片像素。可选地,采集矫正样本包括:下载最新样本分类器;选择采集实时样本过程中保存的图片;利用最新的样本分类器对选中样本进行识别;针对样本识别的结果,对识别错误分类的样本进行矫正,标注出正确的形状及类别并保存检测的错误分类的实时样本和对应的矫正样本。由上可见,应用本实施例技术方案,由于有选择的采集和保存样本,同时,样本采集时自动获取环境因素对样本做分层分类标记供云端服务器对样本进行分类存储、统计与分析,实现了便捷的样本采集,解决了现有样本采集中样本数量大、样本可用性低、占用存储空间大、数据存储工作繁琐、样本不够多样化和样本难以统计与分析等问题。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术提供的一种图片样本采集设备结构示意图;图2为本专利技术提供的一种图片样本采集方法流程图;图3为本专利技术提供的一种优化存储数据流程图;图4为本专利技术提供的一种采集实时样本流程图;图5为本专利技术提供的一种采集矫正样本流程图;图6为本专利技术提供的一种类别矫正示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例1:本实施例提供一种图片样本采集设备,如图1所示,包括输入输出模块、环境因素自动获取模块、实时样本生成模块、矫正样本生成模块、样本分类器、数据存储模块和数据转发模块。其中,所述输入输出模块用于实现设备的输入输出功能,例如,输入设备工作模式;输出采集的视频图像至显示屏进行显示。所述环境因素自动获取模块用于自动获取样本的环境因素:季节(春/夏/秋/冬)、时间(白天/夜晚/傍晚/黎明)、天气(晴/多云/雨/雾/冰雪)、场地类别(城市道路/高速公路/乡村/停车场/隧道)、光照强度:1级/2级/3级/4级等。所述实时样本生成模块通过前端摄像机采集前端视频图像信号,并将其通过传输线缆将视频图像信号传输至视频显示器,视频显示器实时显示采集的视频图像,将实时采集的视频图像实时转换为图片,并将图片保存为实时样本并存储;所述样本分类器用于对采本文档来自技高网
...

【技术保护点】
1.一种图片样本采集设备,其特征在于,包括输入输出模块、环境因素自动获取模块、实时样本生成模块、矫正样本生成模块、样本分类器、数据存储模块和数据转发模块,所述输入输出模块用于实现设备的输入输出功能;所述环境因素自动获取模块用于自动获取样本的环境因素;所述实时样本生成模块用于实时采集画面样本并存储;所述样本分类器用于对采集的样本进行自动识别分类并检测出错误分类样本;所述矫正样本生成模块用于对被所述样本分类器识别的错误分类样本进行矫正,并将矫正结果保存为矫正样本;所述数据存储模块用于将采集的样本进行存储;所述数据转发模块用于将采集的样本通过网络进行转发。

【技术特征摘要】
1.一种图片样本采集设备,其特征在于,包括输入输出模块、环境因素自动获取模块、实时样本生成模块、矫正样本生成模块、样本分类器、数据存储模块和数据转发模块,所述输入输出模块用于实现设备的输入输出功能;所述环境因素自动获取模块用于自动获取样本的环境因素;所述实时样本生成模块用于实时采集画面样本并存储;所述样本分类器用于对采集的样本进行自动识别分类并检测出错误分类样本;所述矫正样本生成模块用于对被所述样本分类器识别的错误分类样本进行矫正,并将矫正结果保存为矫正样本;所述数据存储模块用于将采集的样本进行存储;所述数据转发模块用于将采集的样本通过网络进行转发。2.如权利要求1所述的一种图片样本采集设备,其特征在于,所述数据存储模块删除实时图片样本中检测没有错误分类的样本,保存检测的错误分类的实时样本和对应的矫正样本。3.如权利要求1或2所述的一种图片样本采集设备,其特征在于,所述图片样本采集设备与云端服务器通讯连接,同步所述云端服务器中的样本分类器。4.如权利要求3所述的一种图片样本采集设备,其特征在于,所述云端服务器包括分类器管理模块、样本管理模块和样本统计与分析模块,所述分类器管理模块用于实现对样本分类器的版本管理及推送各种样本分类器给所述图片样本采集设备;所述样本管理模块用于实现对样本分类存储;所述样本统计与分析模块用于实现对样本进行统计分析。5.如权利要求4所述的一种图片样本采集设备,其特征在于,所述实时样本生成模块还用于将摄像机实时采集的视频图像实时转换为图片,并将图片保存为实时样本。6.如权利要求5所述的一种图片样本采集设备,其特征在于,所...

【专利技术属性】
技术研发人员:易礼艳姜灿
申请(专利权)人:惠州市德赛西威智能交通技术研究院有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1