一种数据获取方法、装置、终端及存储介质制造方法及图纸

技术编号:21434371 阅读:24 留言:0更新日期:2019-06-22 12:35
本发明专利技术提供了一种数据获取方法、装置、终端及存储介质,该方法包括:采集用户用于身份识别的图片信息和用户操作对应的行为信息;确定图片信息中的视觉特征信息;根据视觉特征信息和行为信息,利用预设的融合策略,生成用于进行风险控制模型训练的特征数据。因此,通过采集用户上传的或者是设备能够采集到的用于身份验证的图片信息,进而生成用户的视觉特征信息,以完善训练风险控制模型所用的特征数据,提高风险控制模型的效果,保证风险控制的有效性。

【技术实现步骤摘要】
一种数据获取方法、装置、终端及存储介质
本专利技术属于数据处理领域,特别是涉及一种数据获取方法、装置、终端及存储介质。
技术介绍
随着科学技术的发展,互联网技术等新兴技术被应用在传统
中,例如传统金融与“互联网+”相结合所产生的互联网金融,其基于大数据、云计算、人工智能等新兴技术,实现资金融通、支付和信息中介等业务的新兴金融业务,例如网络借贷、移动支付、理财以及保险等,为了保证资金安全,风险控制仍作为互联网金融的核心内容。现有技术中,基于大数据的风险控制方法是根据事实数据背景信息和用户的网络行为数据,对用户进行多维度、全方位的刻画,以建立风控模型;但由于基于事实数据背景信息和用户在互联网上留下的痕迹所进行的风险控制不仅在数据维度上所有欠缺,且与传统金融产业的风控相比,还缺少了面对面验证和监测的环节,进而造成对风险控制的隐患,无法保证风险控制的准确性。
技术实现思路
有鉴于此,本专利技术提供一种数据获取方法、装置、终端及存储介质,以便解决现有技术存在的风险控制隐患的问题,并提高风险控制准确性。依据本专利技术实施例的第一方面,提供了一种数据获取方法,该方法可以包括:采集用户用于身份识别的图片信息和用户操作对应的行为信息;确定所述图片信息中的视觉特征信息;根据所述视觉特征信息和所述行为信息,利用预设的融合策略,生成用于进行风险控制模型训练的特征数据。依据本专利技术实施例的第二方面,提供了一种数据获取装置,该装置可以包括:信息采集模块,用于采集用户用于身份识别的图片信息和用户操作对应的行为信息;信息确定模块,用于确定所述图片信息中的视觉特征信息;特征生成模块,用于根据所述视觉特征信息和所述行为信息,利用预设的融合策略,生成用于进行风险控制模型训练的特征数据。依据本专利技术实施例的第三方面,提供了一种计算机可读存储介质,所述计算机可读存储介质上存储计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的数据获取方法的步骤。依据本专利技术实施例的第四方面,提供了一种终端,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如第一方面项所述的数据获取方法的步骤。本专利技术实施例采集用户用于身份识别的图片信息和用户操作对应的行为信息;利用预先确定的深度学习模型,确定所述图片信息中的视觉特征信息;根据所述视觉特征信息和所述行为信息,利用预设的融合策略,生成用于进行风险控制模型训练的特征数据。因此,通过采集用户上传的或者是设备能够采集到的用于身份验证的图片信息,进而生成用户的视觉特征信息,以完善训练风险控制模型所用的特征数据,提高风险控制模型的效果,保证风险控制的有效性。上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。附图说明通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本专利技术的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:图1是本专利技术实施例提供的一种数据获取方法的步骤流程图;图2是本专利技术实施例提供的一种数据获取方法的具体步骤流程图;图3是本专利技术实施例提供的一种数据获取方法的具体步骤流程图;图4是本专利技术实施例提供的一种数据获取方法的具体步骤流程图;图5是本专利技术实施例提供的一种数据获取方法的具体步骤流程图;图6是本专利技术实施例提供的一种数据获取方法的具体步骤流程图;图7是本专利技术实施例提供的一种数据获取方法的具体步骤流程图;图8是本专利技术实施例提供的一种数据获取方法的具体步骤流程图;图9是本专利技术实施例提供的一种数据获取装置的框图;图10是本专利技术实施例提供的一种终端结构的框图。具体实施方式下面将参照附图更详细地描述本专利技术的示例性实施例。虽然附图中显示了本专利技术的示例性实施例,然而应当理解,可以以各种形式实现本专利技术而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本专利技术,并且能够将本专利技术的范围完整的传达给本领域的技术人员。图1是本专利技术实施例提供的一种数据获取方法的步骤流程图,如图1所示,该方法可以包括:步骤101,采集用户用于身份识别的图片信息和用户操作对应的行为信息。在具体应用中,可以根据对不同金融产业平台所提供的服务进行记录,而生成的历史日志进行数据整理分析,获取到对应的图片信息和行为信息,再以进行下面步骤基于图片信息进行的视觉特征信息的提取。其中,图片信息是指用户在某个平台上进行例如身份验证、人脸对比、活体检测、授权认证等操作时,所提供的本人照片或者是证件照片等;行为信息是指用户在某个平台上进行例如验证操作、授权操作等操作时所产生的行为信息,例如包括操作时间,操作频率等。根据历史日志,可以采集到一个用户在多个不同平台下执行多个操作时所生成的数据,以对同一用户的行为信息和图片信息进行数据的归类和比对,进而保证采集到的特征数据的准确度和有效性。需要说明的是,本专利技术所提出的技术方案不仅基于行为信息,例如用户所使用的设备、用户通常进行操作的时间段以及用户进行操作的频率等信息,生成对应的用户行为特征;同时还利用图片信息获取用户的人脸特征以及人像特征,例如是否有纹身、是否为光头以及是否头发染色等等视觉特征信息,通过数据处理后作为风险控制模型的训练特征数据的一部分,进而弥补现有的互联网金融所缺失的面对面验证和监测的操作,进而保证风险控制的效果。步骤102,确定图片信息中的视觉特征信息。示例地,可以通过预先确定的深度学习模型,对图片信息进行特征提取,以确定其中人物的对应视觉特征。其中,视觉特征信息包括人脸特征信息和人像特征信息,人脸特征信息包括微笑的置信度、眼角长度与人脸宽度的比例、嘴角弧度、鼻尖和嘴角角度中的至少一者;人像特征信息包括头发颜色、头发长短、皮肤特征、所佩戴饰物、所穿着衣物特征以及视觉预测年龄中的至少一者。例如是否染发、染发颜色,是否有纹身、有伤疤等皮肤特征,是否佩戴工牌、项链、耳环等饰物等所佩戴饰物以及所穿衣物是否为正装、便装、是否有领子、领子高低(是否露出肩膀)以及衣物颜色是否鲜艳等,并且还可以通过预设识别策略,根据图片信息对图片中人物的年龄进行预测,通过分析软件确定图片中的人物是否佩戴眼镜以及对图片信息中的人物的颜值打分,评价皮肤健康度,黑眼圈严重程度等,均可以作为视觉特征信息。需要说明的是,该深度学习模型是用于进行图片中对应特征的提取,可以采用现有的深度学习模型或者对现有的神经网络模型进行改进,以适用本专利技术所提出的技术方案,具体本专利技术不做限制。此外,为了生成适合于进行风险控制模型训练的特征数据,还可以对上述视觉特征信息进行分类,例如将头发颜色中的是否染发、皮肤特征、所佩戴饰物等作为是非性数据类型,其对应的数据形式为0或1,若根据图片信息确定其中的人物为光头,则对应的头发长短的数据值为0(表示没有头发),相应的若其中的人物头发为原色(黑棕色),对应的头发颜色的数据值为0(并未染色),若其中的人物未佩戴胸牌、项链等饰物,则所佩戴饰物的数据值为0等;对应的微笑的置信度、眼角长度与人脸宽度的比例、嘴角弧度本文档来自技高网...

【技术保护点】
1.一种数据获取方法,其特征在于,所述方法包括:采集用户用于身份识别的图片信息和用户操作对应的行为信息;确定所述图片信息中的视觉特征信息;根据所述视觉特征信息和所述行为信息,利用预设的融合策略,生成用于进行风险控制模型训练的特征数据。

【技术特征摘要】
2019.01.24 CN 20191007009421.一种数据获取方法,其特征在于,所述方法包括:采集用户用于身份识别的图片信息和用户操作对应的行为信息;确定所述图片信息中的视觉特征信息;根据所述视觉特征信息和所述行为信息,利用预设的融合策略,生成用于进行风险控制模型训练的特征数据。2.根据权利要求1所述的方法,其特征在于,所述采集用户用于身份识别的图片信息和用户操作生成的行为信息,包括:在历史日志中提取所述行为信息,所述行为信息包括所述用户操作对应的操作平台信息、操作时间信息、操作设备信息以及操作地点信息中的至少一者,所述操作设备信息包括设备型号、设备品牌以及IP地址中的至少一者;所述操作时间信息包括操作间隔时间、操作时间频率、预设时间间隔内的操作次数中的至少一者,所述历史日志包括多个所述用户操作所生成的多个日志;根据所述历史日志,采集所述图片信息。3.根据权利要求2所述的方法,其特征在于,在所述确定所述图片信息中的视觉特征信息的步骤之前,所述方法还包括:生成与所述历史日志中每个用户对应的身份标识。4.根据权利要求3所述的方法,其特征在于,所述图片信息包括身份识别图片和所述身份识别图片对应的标记信息,所述确定所述图片信息中的视觉特征信息,包括:对所述图片信息中各个用户的身份识别图片进行聚合,以获取每个所述身份标识对应的聚合图片集;利用预设的深度学习模型,对所述聚合图片集中的每个图片进行图像识别,以获取所述每个所述身份标识对应的视觉特征信息;其中,所述视觉特征信息包括人脸特征信息和人像特征信息,所述人脸特征信息包括微笑的置信度、眼角长度与人脸宽度的比例、嘴角弧度、鼻尖和嘴角角度中的至少一者;所述人像特征信息包括头发颜色、头发长短、皮肤特征、所佩戴饰物、所穿着衣物特征以及视觉预测年龄中的至少一者。5.根据权利要求4所述的方法,其特征在于,所述视觉特征信息还包括攻击行为信息,所述确定所述图片信息中的视觉特征信息,还包括:根据所述身份识别图片对应的标记信息,判断所述身份识别图片对应的用户是否存在换脸翻拍行为、屏幕翻拍行为、面具翻拍行为中的至少一者的攻击行为;在存在所述攻击行为的情况下,将第一预设值确定为所述攻击行为信息;在不存在所述攻击行为的情况下,将第二预设值确定为所述攻击行为信息;其中,所述第一预设值不等于所述第二预设值。6.根据权利要求4所述的方法,其特征在于,所述利用预设的深度学习模型,对所述聚合图片集中的每个图片进行图像识别,以获取所述每个身份标识对应的所述视觉特征信息,包括:利用所述深度学习模型,对所述聚合图片集中的每...

【专利技术属性】
技术研发人员:林哲樊聪楼虎彪
申请(专利权)人:北京迈格威科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1