人脸图像数据采集方法、装置、终端设备及存储介质制造方法及图纸

技术编号:17249409 阅读:27 留言:0更新日期:2018-02-11 07:48
本发明专利技术公开了一种人脸图像数据采集方法、装置、终端设备及存储介质。该人脸图像数据采集方法包括:采用图片爬虫工具从网络中爬取原始图像;采用人脸识别算法对所述原始图像进行识别,获取包含人脸特征的有效图像;采用预设选取框从所述有效图像中截取目标人脸图像。该人脸图像数据采集方法可快速采集到大量的人脸图像。

【技术实现步骤摘要】
人脸图像数据采集方法、装置、终端设备及存储介质
本专利技术涉及图像处理
,尤其涉及一种人脸图像数据采集方法、装置、终端设备及存储介质。
技术介绍
人脸识别技术是基于人的脸部特征信息进行身份识别的一种生物识别技术。人脸识别技术具体是采用摄像机或摄像头采集含有人脸的图像或视频流,采用人脸识别模型自动在图像或视频流中检测人脸,进而对检测到的人脸进行脸部识别的技术。随着人脸识别技术的发展与普及,需采集大量的人脸图像数据来训练人脸识别模型,以提高人脸识别模型识别人脸的准确率。当前人脸图像数据采集过程需耗费大量的人力和物力,成本较高且效率较低。
技术实现思路
本专利技术提供一种人脸图像数据采集方法、装置、终端设备及存储介质,以解决当前人脸图像数据采集过程效率较低的问题。第一方面,本专利技术实施例提供一种人脸图像数据采集方法,包括:采用图片爬虫工具从网络中爬取原始图像;采用人脸识别算法对所述原始图像进行识别,获取包含人脸特征的有效图像;采用预设选取框从所述有效图像中截取目标人脸图像。第二方面,本专利技术实施例提供一种人脸图像数据采集装置,包括:原始图像爬取模块,用于采用图片爬虫工具从网络中爬取原始图像。有效图像识别模块,用于采用人脸识别算法对所述原始图像进行识别,获取包含人脸特征的有效图像。有效图像截取模块,用于采用预设选取框从所述有效图像中截取目标人脸图像。第三方面,本专利技术实施例提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现所述人脸图像数据采集方法的步骤。第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述人脸图像数据采集方法的步骤。本专利技术与现有技术相比具有如下优点:本专利技术实施例所提供的人脸图像数据采集方法、装置、终端设备及存储介质中,通过采用图片爬虫工具从网络中爬取原始图像,可以按照一定的规则自动的从网络中抓取海量的原始图像,数据采集速度快。再采用人脸识别算法对原始图像进行识别以获取包含人脸特征的有效图像,可使没有包含人脸特征的原始图像不作为有效图像,保证采集到的有效图像可应用于人脸识别模型训练,提高人脸识别模型训练的有效性和准确率。再采用预设选取框从有效图像中截取目标人脸图像,以使采集到的目标人脸图像应用在人脸识别模型训练时,可有效提高人脸识别模型的准确率。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例1中人脸图像数据采集方法的一流程图。图2是图1中步骤S10的一具体流程图。图3是图1中步骤S20的一具体流程图。图4是图1中步骤S20的另一具体流程图。图5是图1中步骤S30的一具体流程图。图6是本专利技术实施例2中人脸图像数据采集装置的一原理框图。图7是本专利技术实施例4中终端设备的一原理框图。具体实施方式以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本专利技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本专利技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本专利技术的描述。实施例1图1示出本实施例中人脸图像数据采集方法。该人脸图像数据采集方法可快速从网络中采集到大量的人脸图像数据,以便基于采集到的人脸图像数据进行人脸识别模型训练。如图1所示,该人脸图像数据采集方法包括如下步骤:S10:采用图片爬虫工具从网络中爬取原始图像。其中,图片爬虫工具是一种可自动爬取包含图片的网页的网页地址,并基于爬取到的网页地址进行图片下载的程序。该图片爬虫工具只爬取网络中的图片而不爬取其他数据,针对性较强,有利于提高图像采集效率。原始图像是采用图片爬虫工具从网络中下载到的图像。本实施例中,采用图片爬虫工具可从社交网站、搜索引擎或其他网站下载海量的原始图像,数据量大且获取过程简单方便。具体地,图片爬虫工具包括网络爬虫和图片下载工具,该网络爬虫和图片下载工具可以集成一整体,也可以单独设置。其中,网络爬虫是一种按照一定的规则,自动地抓取互联网信息的程序或者脚本。图片下载工具是一种基于输入的网页地址自动从互联网下载图片的程序或者脚本。本实施例中,图片爬虫工具可采用分布式图片爬虫工具,如python图片爬虫工具,可实现并行抓取原始图像,提高原始图像的爬取效率。其中,python图片爬虫工具集成有网络爬虫和图片下载工具。在一具体实施方式中,如图2所示,步骤S10具体包括如下步骤:S11:采用网络爬虫从网络中爬取原始图像的网页地址。其中,网页地址(Uniform/UniversalResourceLocator,简称URL,又称统一资源定位符)是因特网上标准的资源的地址(Address),该网页地址是原始图像所在网页的网页地址。本实施例中,网络爬虫根据用户设置的爬虫任务自动从互联网上爬取包含原始图像的网页地址,无需人工搜索,有利于提高数据采集效率。进一步地,采用网络爬虫从网络中爬取原始图像的网页地址具体包括如下步骤:首先,在网络爬虫中配置爬虫任务,该爬虫任务包含原始网页地址、分页规则和关键词。其中,原始网页地址是用户自定义的开始执行该爬虫任务的网页地址。分页规则是用户自定义的用于对网页进行分页的规则,可以根据数据实际来源进行设定,其设置过程中可采用固定格式,也可以采用不固定格式。关键词是网络爬虫在爬取网络地址过程中进行搜索的词语。该关键词可以是用户在对历史数据进行聚类后获取到的词语,使得基于该关键词搜索获取到的有效图像的概率较高,如采用关键词为“自拍”,获取到的包含人脸特征的有效图像的概率较高。其次,使网络爬虫执行爬虫任务,从原始网页地址开始基于分页规则和关键词抓取包含原始图像的网页地址。本实施例中,可采用预设搜索策略不断从当前页面上爬取新的网页地址放入待下载消息队列中,直到预设停止条件满足时停止执行爬虫任务。预设搜索策略包括但不限于本实施例中采用的广度优先搜索策略或深度优先搜索策略。S12:将网页地址存储在待下载消息队列中。具体地,将步骤S11中爬取到的每一原始图像的网页地址依据爬取到的时间先后顺序存储在待下载消息队列中,以便在执行步骤S13时,可基于待下载消息队列中的网页地址进行图片下载。待下载消息队列依据先进先入的方式对网页地址进行处理,可使爬取网页地址和基于网页地址下载原始图像异步处理,有利于提高获取原始图像的效率。S13:采用图片下载工具从待下载消息队列中的网页地址对应的网页爬取原始图像。其中,图片下载工具是一种批量下载图片的工具,可根据输入的网页地址自动下载该网页地址对应的页面中所有的图片。该图片下载工具可以集成在图片爬虫工具上,如python图片网络爬虫中集成有图片下载工具;也可以是独立的图片下载工具,如NeoDownloader工具,可快速批量下载图片。本实施例中,待下载消息队列中存储有多个包含原始图像的网页地址,图片下载工具依序从待下载消息队列本文档来自技高网...
人脸图像数据采集方法、装置、终端设备及存储介质

【技术保护点】
一种人脸图像数据采集方法,其特征在于,包括:采用图片爬虫工具从网络中爬取原始图像;采用人脸识别算法对所述原始图像进行识别,获取包含人脸特征的有效图像;采用预设选取框从所述有效图像中截取目标人脸图像。

【技术特征摘要】
1.一种人脸图像数据采集方法,其特征在于,包括:采用图片爬虫工具从网络中爬取原始图像;采用人脸识别算法对所述原始图像进行识别,获取包含人脸特征的有效图像;采用预设选取框从所述有效图像中截取目标人脸图像。2.根据权利要求1所述的人脸图像数据采集方法,其特征在于,所述采用人脸识别算法对所述原始图像进行识别,获取包含人脸特征的有效图像,包括:采用人脸识别算法对所述原始图像进行识别,判断所述原始图像中是否存在五官特征;若所述原始图像中存在五官特征,则获取所述原始图像的五官完整度,判断所述五官完整度是否达到预设完整度;若所述五官完整度达到所述预设完整度,则将所述原始图像作为所述包含人脸特征的有效图像。3.根据权利要求1或2所述的人脸图像数据采集方法,其特征在于,所述采用人脸识别算法对所述原始图像进行识别,获取包含人脸特征的有效图像,包括:采用人脸识别算法对所述原始图像进行识别,判断所述原始图像中是否存在人脸区域;若所述原始图像存在人脸区域,则计算人脸图像占比值,判断所述人脸图像占比值是否大于预设占比值;若所述人脸图像占比值大于所述预设占比值,则将所述原始图像作为所述包含人脸特征的有效图像。4.根据权利要求1所述的人脸图像数据采集方法,其特征在于,所述采用预设选取框从所述有效图像中截取目标人脸图像,包括:采用预设选取框从所述有效图像中截取包含所述人脸特征的初始人脸图像;获取所述初始人脸图像的实际像素值;判断所述实际像素值是否大于预设像素值;若所述实际像素值大于所述预设像素值,则将所述初始人脸图像作为所述目标人脸图像。5.根据权利要求1所述的人脸图像数据采集方法,其特征在于,所述采用图片爬虫工具从网络中爬取原始图像,包括:采用网络爬虫从网络中爬取所述原始图像的网页地址;将所述网页地址存储在待下载消息队列中;采用图片下载工具从所述待下载消息队列中的网页地址对应的网页爬取所述原始图像。6.一种人脸图像数据采集装置,其特征在于,包括:原始图像爬取模块,用于采用图片爬虫工具从网络中爬取原始图像;有效图像识别模块,用于采用人脸识别算法对所述原始图像进行识别,获取包含人脸特征的有效图像;有效图像截取...

【专利技术属性】
技术研发人员:朱志博陈伟杰吴善鹏
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1