一种基于生物特征的异常检测方法及系统技术方案

技术编号:39302927 阅读:11 留言:0更新日期:2023-11-12 15:53
本发明专利技术涉及一种基于生物特征的异常检测方法及系统,包括如下步骤:S1:基于用户的生物特征作为第一节点,基于用户的生物特征的相似度作为第一边进行级联图的构建;S2:基于级联图作为第二节点,基于用户的社交关系作为第二边进行异构图的构建;S3:基于用户的生物特征对级联图进行异常检测,得到第一异常结果,基于用户的社交关系对异构图进行异常检测,得到第二异常结果,基于第一异常结果和第二异常结果得到团体异常数据。本发明专利技术提供的基于生物特征的异常检测方法及系统,利用了二级图分类任务,从而帮助二级任务(异构图构建)在一级任务(级联图构建)的大类里做子分类的识别,可端到端也可以分段执行,比较灵活,而且泛化性高。而且泛化性高。而且泛化性高。

【技术实现步骤摘要】
一种基于生物特征的异常检测方法及系统


[0001]本专利技术涉及异常检测
,具体涉及一种基于生物特征的异常检测方法及系统。

技术介绍

[0002]团体异常属于异常中的一个子分类,其样本量在任何一家消费信贷公司所能标注出来都不属于最多的那种,因为它的判断分析的手段通常比较单一,比如考虑一些社交属性的聚集性所设计出来的规则,对于直接用参数量大的模型去训练,可能会出现一定的过拟合,对于新的团体特征识别效果不佳。同时另一方面对于生物特征的使用上,在各金融风险领域使用上并不全面,大部分还是集中在单项生物特征的应用上,如指纹、面部、虹膜、视网膜、声纹、DNA、步态、手写、语音,这个多数用于身份验证、识别和鉴别等领域。
[0003]但上述的数据,很多能且只能用在用户授权的单一身份验证场景上,但有一些合法的生物特征类数据如自拍照、面签音视频、催收音频、客服音频、电销音频、用户的页面交互埋点行为等是存在的,目前金融公司都会利用这些数据做特征提取,再通过统计分析的方法,寻找一些规律特性,作为一个规则特征来做拦截,但由于提取的时候,是用各种不同的模型做的提取,如影像的合规性检测、是否戴口罩、行为特征是否有聚集性,可能会用YOLO、Faster R

CNN、OpenPose、Bert、LSTM等,这些信息由于模型的差异被投射到了不同的向量空间,因此需要做特征的融合或者做级联模型设计,又或者是进行多模态学习,使用一种统一的框架来同时处理多模态特征,但这里都有他们的弊端,缺点如下:1、多模态的学习方式,不利于复用以前的CV或者语音模型,而且多模态学习一些专项的特征提取上,效果不如专项模型;2、单纯的级联模型和特征融合的方式,在团体异常方面的识别效果有限,并不能充分挖掘团体聚集相似性的特征。

技术实现思路

[0004]针对现有技术的不足,本专利技术提供了一种基于生物特征的异常检测方法及系统,利用了二级图分类任务,在一级任务里解决了不同类别embedding的融合问题,而且还利用了一级任务所做出来的预测类别,从而帮助二级任务在一级任务的大类里做子分类的识别,可端到端也可以分段执行,比较灵活,而且泛化性高。
[0005]为了实现本专利技术的目的,本专利技术提供一种基于生物特征的异常检测方法,包括如下步骤:S1:基于用户的生物特征作为第一节点,基于用户的生物特征的相似度作为第一边进行级联图的构建;S2:基于级联图作为第二节点,基于用户的社交关系作为第二边进行异构图的构建;S3:基于用户的生物特征对级联图进行异常检测,得到第一异常结果,基于用户的
社交关系对异构图进行异常检测,得到第二异常结果,基于第一异常结果和第二异常结果得到团体异常数据。
[0006]优选的,所述步骤S1中的用户的生物特征包括:用户的生物特征包括:用户的行为、自拍照和声纹特征。
[0007]优选的,所述步骤S1中基于用户的生物特征的相似度作为第一边的具体步骤包括:基于用户的行为、自拍照和声纹特征分别作相似度比对,将相似度的值超过预设值的生物特征作为第一边。
[0008]优选的,所述步骤S1之后还包括:S11:基于共享权重机制对用户的生物特征进行处理,得到带共享系数的生物特征。
[0009]优选的,所述步骤S2中用户的社交关系具体包括:用户的社交关系:活动邀约关系、朋友关系、家属关系。
[0010]优选的,所述步骤S2中的第二节点具体包括:所述第二节点的特征矩阵由带共享系数的生物特征进行构建。
[0011]优选的,本专利技术还提供了一种基于生物特征的异常检测系统,包括:第一生成模块:基于用户的生物特征作为第一节点,基于用户的生物特征的相似度作为第一边进行级联图的构建;第二生成模块:基于级联图作为第二节点,基于用户的社交关系作为第二边进行异构图的构建;输出模块:基于用户的生物特征对级联图进行异常检测,得到第一异常结果,基于用户的社交关系对异构图进行异常检测,得到第二异常结果,基于第一异常结果和第二异常结果得到团体异常数据。
[0012]优选的,还包括:处理模块:基于共享权重机制对用户的生物特征进行处理,得到带共享系数的生物特征。
[0013]优选的,所述第一生成模块具体包括:第一生成模块:基于用户的生物特征作为第一节点,基于用户的行为、自拍照和声纹特征分别作相似度比对,将相似度的值超过预设值的生物特征作为第一边,并进行级联图的构建。
[0014]优选的,所述第一处理模块中用户的社交关系具体包括:用户的社交关系:活动邀约关系、朋友关系、家属关系。
[0015]本专利技术的有益效果为:本专利技术提供的基于生物特征的异常检测方法及系统,利用了二级图分类任务,在一级任务里解决了不同类别embedding的融合问题,而且还利用了一级任务所做出来的预测类别,从而帮助二级任务在一级任务的大类里做子分类的识别,可端到端也可以分段执行,比较灵活,而且泛化性高。需要说明的是,本申请中所有获取信号、信息或数据的动作都是在遵照所在地国家相应的数据保护法规政策的前提下,并获得由相应装置所有者给予授权的情况下进行的。
附图说明
[0016]通过附图中所示的本专利技术优选实施例更具体说明,本专利技术上述及其它目的、特征和优势将变得更加清晰。在全部附图中相同的附图标记指示相同的部分,且并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本的主旨。
[0017]图1为现有技术中一般的金融公司用于的待被做融合的数据源的示意图;图2为本专利技术实施例提供的基于生物特征的异常检测方法及系统的流程示意图;图3为本专利技术实施例提供的若将二级任务做成端到端训练的具体流程示意图。
具体实施方式
[0018]下面结合附图和具体实施例对本专利技术技术方案作进一步的详细描述,以使本领域的技术人员可以更好地理解本专利技术并能予以实施,但所举实施例不作为对本专利技术的限定。
[0019]请参考图2

3,本专利技术实施例提供一种基于生物特征的异常检测方法,包括如下步骤:S01:获取用户的生物特征并存储至数据库中(按照向量数据库的要求,存储不同用户,相同类型的embedding,以一般公司倾向采用的向量数据库milvus为例,同一类型的embedding放在一个集合Collection下。Key为用户的id(VarChar),向量为该类型的embedding(FloatVector)。不同类型需要放在不同的集合Collection下,如声音、人脸,注意这里的embedding必须的保持行数都为1。因为下面会利用到向量数据库的向量相似度比较,这里indexType建议使用Annoy)。
[0020]S1:基于用户的生物特征作为第一节点,基于用户的生物特征的相似度作为第一边进行级联图的构建(把用户进件视作节点F

sub针对用户的行为、自拍照、声纹的embedding,先对所有用户进件粒度的行为embedding、自拍照embedding(是背景和人脸的组合embedding),声纹embedding,分别本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于生物特征的异常检测方法,其特征在于,包括如下步骤:S1:基于用户的生物特征作为第一节点,基于用户的生物特征的相似度作为第一边进行级联图的构建;S2:基于级联图作为第二节点,基于用户的社交关系作为第二边进行异构图的构建;S3:基于用户的生物特征对级联图进行异常检测,得到第一异常结果,基于用户的社交关系对异构图进行异常检测,得到第二异常结果,基于第一异常结果和第二异常结果得到团体异常数据。2.如权利要求1所述的基于生物特征的异常检测方法,其特征在于,所述步骤S1中的用户的生物特征包括:用户的生物特征包括:用户的行为、自拍照和声纹特征。3.如权利要求1所述的基于生物特征的异常检测方法,其特征在于,所述步骤S1中基于用户的生物特征的相似度作为第一边的具体步骤包括:基于用户的行为、自拍照和声纹特征分别作相似度比对,将相似度的值超过预设值的生物特征作为第一边。4.如权利要求1所述的基于生物特征的异常检测方法,其特征在于,所述步骤S1之后还包括:S11:基于共享权重机制对用户的生物特征进行处理,得到带共享系数的生物特征。5.如权利要求1所述的基于生物特征的异常检测方法,其特征在于,所述步骤S2中用户的社交关系具体包括:用户的社交关系:活动邀约关系、朋友关系、家属关系。6.如权利要求1所述的基于生物...

【专利技术属性】
技术研发人员:韩柳步遐
申请(专利权)人:中邮消费金融有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1