本公开的一方面涉及一种异常识别的方法,包括收集用户的信息;将所述用户的信息组织成知识,所述知识包括所述用户与信息、或者信息与信息之间的关系;基于组织出的知识来构建知识图谱,所述知识图谱包括对应于所述用户和每一项信息的信息节点,并且包括对应于相应关系的边;用基于空域的图卷积网络对所述知识图谱进行建模以获得模型;以及训练所述模型基于对所述知识图谱的图卷积计算来判断所述用户是否异常。本公开还涉及其他相关方面。本公开还涉及其他相关方面。本公开还涉及其他相关方面。
【技术实现步骤摘要】
一种异常识别的方法和装置
[0001]本申请一般涉及异常识别,尤其涉及基于知识图谱的异常识别。
技术介绍
[0002]在异常识别和治理的对抗中,往往使用被动收集来的信息来判断用户的黑白(即,用户是否异常)。
[0003]例如,在加强尽职调查(EDD)或称增强型尽职调查时,可以针对高风险客户进行更为深入的尽职调查,以收集更多信息,深入了解客户活动,从而降低风险。
[0004]类似场景下的异常识别通常主要有两个方式,一是使用一些规则来识别收集来的用户信息和已存在用户信息是否存在矛盾之处,二是可以使用一些数学模型来对这些数据进行建模。然而,此类方案或是人工成本过高,或是质量较难以把控。
[0005]因此,本领域中需要改进的异常识别的技术方案。
技术实现思路
[0006]本公开的一方面涉及一种异常识别的方法,包括收集用户的信息;将所述用户的信息组织成知识,所述知识包括所述用户与信息、或者信息与信息之间的关系;基于组织出的知识来构建知识图谱,所述知识图谱包括对应于所述用户的用户节点和对应于每一项信息的信息节点,并且包括对应于相应关系的边;用基于空域的图卷积网络对所述知识图谱进行建模以获得模型;以及训练所述模型基于对所述知识图谱的图卷积计算来识别所述用户是否异常。
[0007]根据一些示例性实施例,其中所述知识包括主体,谓词和客体SPO三元组。
[0008]根据一些示例性实施例,其中所述知识图谱包括以所述用户为主体并以信息为客体的知识、或以信息为主体并以与所述信息有关的进一步信息为客体的知识。
[0009]根据一些示例性实施例,以所述用户为主体并以信息为客体的知识对应于所述模型中与所述用户节点具有一跳距离的邻居节点,并且以信息为主体并以与所述信息有关的进一步信息为客体的知识对应于所述模型中与所述用户节点具有大于一跳距离的节点。
[0010]根据一些示例性实施例,训练所述模型包括已有标注的用户作为所述模型的ground truth来训练所述模型以使得训练后所述知识图谱中的边的权重反映相应关系在所述异常识别中的重要性。
[0011]根据一些示例性实施例,所述信息包括所述用户所属的群体的领域信息以及所述用户个人的已知个体信息。
[0012]根据一些示例性实施例,所述用户所属的群体的领域信息包括用户所属行业或职业等类别的交易特征;并且所述用户个人的已知个体信息包括所述用户的个人交易行为特征。
[0013]根据一些示例性实施例,所述信息还包括新获得的所述用户的补充信息。
[0014]根据一些示例性实施例,所述知识图谱中的每个节点带有自己的特征值或特征向
量。
[0015]根据一些示例性实施例,对所述知识图谱的图卷积计算基于所述用户节点和信息节点子集的所述特征值或特征向量,其中所述信息节点子集基于跳数阈值来确定。
[0016]本公开的其他方面还包括相应的装置、设备以及计算机可读介质等。
附图说明
[0017]图1示出了根据本公开的一方面的示例性用户知识图谱的一部分的示意图。
[0018]图2示出了根据本公开的一方面的示例性用户知识图谱模型的一部分的示意图。
[0019]图3示出了根据本公开的一方面的一般化示例性用户知识图谱模型的神经网络模型的示意图。
[0020]图4示出了根据本公开的一方面的异常识别的方法400的流程图。
具体实施方式
[0021]图(graph)是一种由若干个节点(Node)及连接两个节点的边(Edge)所构成的图形,用于刻画不同结点之间的关系。图(graph)和一般的图像(image)不同,图像属于欧氏空间,节点的邻居数量是固定,而图属于非欧空间,节点的邻居数量不固定。知识图谱就是一种类型的图。
[0022]知识图谱本质上,是一种揭示实体之间关系的语义网络。知识图谱由一条条知识组成,每条知识可以表示为一个SPO三元组(Subject
‑
Predicate
‑
Object),其中主体(Subject)和客体(Object)是图中的节点,谓词(Predicate)即为主体(Subject)节点与客体(Object)之间的有向边。领域知识图谱是指针对某一个具体领域的语义网络。
[0023]知识图谱的构建涉及数据收集、数据梳理和知识图谱构建。例如,在用户的异常识别领域,用户知识图谱可以包括多个部分的数据。
[0024]根据示例性实施例,用户知识图谱的一部分数据可以包括领域知识,具体的含义是用户所属的用户群体的领域知识,例如用户所属行业或职业等类别的交易特征。举例而言,假如用户从事手机充值业务,则手机充值行业一般的交易金额一般是50、100这样的整数。又例如,一般行业、职业不会出现凌晨交易行为,诸如此类。这些就是领域中的群体特征形成关于用户的交易特征的领域知识。领域知识可以不依赖于用户个体,而是反映与该领域中的用户群体的共性。领域知识例如可通过统计或经验等方式来收集。
[0025]根据示例性实施例,用户知识图谱的另一部分可以包括用户个体的知识,例如包括用户个体的用户行为知识,其可包括例如用户个人的一些与交易行为有关系的特征,例如年龄、收入、偏好等等。
[0026]根据示例性实施例,用户知识图谱的又一部分还可以进一步包括补充知识,其包括通过主动与用户沟通的方式收集到的信息,并可以作为上述用户交易行为知识的补充。
[0027]当收集了一个或多个部分的数据之后,可以对所收集到的数据进行梳理。根据示例性实施例,梳理可包括例如对数据进行归类、整理、关联等以将其组织成知识。例如,可将每条知识表示为一个SPO三元组(Subject
‑
Predicate
‑
Object),其中主体(Subject)和客体(Object)的关系由谓词(Predicate)表达。
[0028]当完成对数据的梳理之后,可以基于组织出的知识来构建知识图谱。根据示例性
实施例,可将每条知识中的主体(Subject)和客体(Object)分别作为知识图谱中的节点,并将每条知识中的谓词(Predicate)作为代表主体(Subject)的节点与作为客体(Object)的节点之间的有向边。
[0029]对于单个用户而言,用户知识图谱可以以用户节点为中心向外展开。根据示例性实施例,知识图谱中可以包括一个或多个用户,并且与不同的用户关联的节点之间可以具有关系并由有向边来表示。
[0030]图1示出了根据本公开的一方面的示例性用户知识图谱100的一部分的示意图。如所可见,图1的示例性用户知识图谱100的该部分以用户节点为中心,并且包括领域知识节点、用户交易行为知识节点、和/或补充知识节点等。尽管图1中的示例性用户知识图谱100中仅示出了一个用户节点,但是根据其他示例性实施例,示例性用户知识图谱100中可以包括一个或多个用户节点以及它们各自的领域知识节点、用户交易行为知识节点、和/或补本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种异常识别的方法,包括:收集用户的信息;将所述用户的信息组织成知识,所述知识包括所述用户与信息、或者信息与信息之间的关系;基于组织出的知识来构建知识图谱,所述知识图谱包括对应于所述用户和每一项信息的信息节点,并且包括对应于相应关系的边;用基于空域的图卷积网络对所述知识图谱进行建模以获得模型;以及训练所述模型基于对所述知识图谱的图卷积计算来判断所述用户是否异常。2.如权利要求1所述的方法,其中,所述知识包括主体,谓词和客体SPO三元组。3.如权利要求2所述的方法,其中,所述知识图谱包括以所述用户为主体并以信息为客体的知识、或以信息为主体并以与所述信息有关的进一步信息为客体的知识。4.如权利要求3所述的方法,其中,以所述用户为主体并以信息为客体的知识对应于所述模型中与所述用户对应的节点具有一跳距离的邻居节点,并且以信息为主体并以与所述信息有关的进一步信息为客体的知识对应于所述模型中与所述用户对应的节点具有大于一跳距离的节点。5.如权利要求1所述的方法,其中,训练所述模型包括已有标注的用户作为所述模型的ground truth来训练所述模型以使得训练后所述知识图谱中的边的权重反映相应关系在所述异常识别中的重要性。6.如权利要求1所述的方法,其中,所述信息包括所述用户所属的群体的领域信息以及所述用户个人的已知个体信息。7.如权利要求6所述的方法,其中,所述用户所属的群体的领域信息包括用户所属行业或职业等类别的交易特征;并且所述用户个人的已知个体信息包括所述用户的个人交易行为特征。8.如权利要求6所述的方法,其中,所述信息还包括新获得的所述用户的补充信息。9.如权利要求1所述的方法,其中,所述知识图谱中的每个节点带有自己的特征值或特征向量,其中对所述知识图谱的图卷积计算基于所述用户节点和信息节点子集的所述特征值或特征向量。10.如权利要求9所述的方法,其中,所述信息节点子集基于跳数阈值来确定。11.一种异常识别的设备,包括:用于收集用户的信息的装置;用于将所述用户的信息组织成知识的装置,所述知识包括所述用户与信息、或者信息与信息之间的关系;用于基于组织出的知识来构建知识图谱的装置,所述知识图谱包括对应于所述用户和每一项信息的信息节点,并且包括对应于相应关系的边;用于用基于空域的图卷积网络对所述知识图谱进行建模以获得模型的装置;以及用于训练所述模型基于对所述知识图谱的图卷积计算来判断所述用户是否异常的装置。12.如权利要求11所述的设备,其中,所述知识包括主体,谓词和客体SPO三元组。13.如权利要求...
【专利技术属性】
技术研发人员:舒慧珍,张天翼,刘丹丹,黄超敏,曹琳,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。