一种用户身份识别方法及装置制造方法及图纸

技术编号:25708785 阅读:21 留言:0更新日期:2020-09-23 02:55
本公开实施例公开了一种用户身份识别方法及装置,涉及知识图谱数据处理领域;其中,该方法包括:对知识图谱数据中的节点进行图嵌入式处理,获得节点的低维表征向量;通过预训练过的抽取模型从所述知识图谱数据中抽取节点数据,形成节点矩阵;将所述低维表征向量与所述节点矩阵进行计算结合,生成节点序列数据;将所述节点序列数据输入至预训练过的判决模型,输出用户身份识别结果。

【技术实现步骤摘要】
一种用户身份识别方法及装置
本公开涉及知识图谱数据处理领域,具体涉及一种用户身份识别方法及装置。
技术介绍
金融大数据领域是人工智能技术应用的一个较为成熟的领域,在金融信贷领域,利用知识图谱的方式识别身份进而进行反欺诈识别已经正在实际业务中得到广泛应用。现有技术中,如图1所示,展示了一种比较典型的基于知识图谱的反欺诈系统,结合图数据库,对输入的进项进行关系数据查询,并进行变量计算,将计算结果输入至欺诈模型中;将欺诈模型输出的欺诈结果输入至反欺和风控系统进行后续的数据统计和分析。由图1可以明确得出,知识图谱主要用于建立关系型数据,而拥有身份识别功能的反欺诈模型需要的输入是通过变量计算得到的数值序列,即在变量计算的过程中,虽然变量的设计可以反映图数据中的部分关系特征/拓扑特征,但这些最关键的关系特征在变量计算后已经消失了,即现有技术中的欺诈模型不能很好的利用知识图谱中的关系的特征进行分析和预判,无法得出正确的关于用户身份/欺诈团伙的识别结果。目前,图嵌入(GraphEmbedding,也叫NetworkEmbedding)是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程,能够很好地解决图数据难以高效输入机器学习算法的问题,正成为一个新兴的技术方向。与词嵌入技术类似,图嵌入技术可以将计算机较难处理的图数据(节点和关系)转化成低维稠密向量,从而使得计算机可以将各种算法应用到图数据的挖掘中,进而可以将图嵌入技术应用在金融反欺诈领域中;但是目前仅仅是图嵌入后节点的低维特征,但由于随机游走仍然是在整个图谱数据中进行节点序列选取,因此其仍然没有很好的利用进项在时空范围内短期的拓扑变化,对用户身份的识别仍然无法做到准确的预判,准确性与可靠性低,体验较差。
技术实现思路
针对现有技术中的上述技术问题,本公开实施例提出了一种用户身份识别方法及装置,以解决现有技术中用户身份的识别仍然无法做到准确的预判,准确性与可靠性低,体验较差等问题。本公开实施例的第一方面提供了一种用户身份识别方法,包括:对知识图谱数据中的节点进行图嵌入式处理,获得节点的低维表征向量;通过预训练过的抽取模型从所述知识图谱数据中抽取节点数据,形成节点矩阵;将所述低维表征向量与所述节点矩阵进行计算结合,生成节点序列数据;将所述节点序列数据输入至预训练过的判决模型,输出用户身份识别结果。在一些实施例中,所述抽取模型以知识图谱数据中的至少一个节点为线索,按照预设规则抽取至少一个节点,形成节点矩阵。在一些实施例中,所述抽取模型按照时间、拓扑结构、节点类型和/或各节点连接度中的一个或多个维度设置抽取方法。在一些实施例中,所述判决模型输出的用户身份识别结果包括至少一个节点对应的用户身份识别结果。在一些实施例中,所述方法还包括:所述判决模型输出一个或多个节点标识;根据所述节点标识获取所述用户身份识别结果。在一些实施例中,所述节点矩阵为一维矩阵、二维矩阵或者多维矩阵。在一些实施例中,所述节点序列数据由二维数据或者高维数据组成。本公开实施例的第二方面提供了一种用户身份识别装置,包括:处理模块,用于对知识图谱数据中的节点进行图嵌入式处理,获得节点的低维表征向量;节点矩阵生成模块,用于通过预训练过的抽取模型从所述知识图谱数据中抽取节点数据,形成节点矩阵节点序列数据生成模块,用于将所述低维表征向量与所述节点矩阵进行计算结合,生成节点序列数据;输出模块,用于将所述节点序列数据输入至预训练过的判决模型,输出用户身份识别结果。在一些实施例中,所述抽取模型以知识图谱数据中的至少一个节点为线索,按照预设规则抽取至少一个节点,形成节点矩阵。在一些实施例中,所述判决模型输出的用户身份识别结果包括至少一个节点对应的用户身份识别结果。本公开实施例的第三方面提供了一种电子设备,包括:存储器以及一个或多个处理器;其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现如前述各实施例所述的方法。本公开实施例的第四方面提供了一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现如前述各实施例所述的方法。本公开实施例的第五方面提供了一种计算机程序产品,所述计算机程序产品包括存储在计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,可用来实现如前述各实施例所述的方法。本公开实施例中,通过图嵌入式处理方式获得低维表征向量,通过抽取模型抽取节点数据形成节点矩阵,并将低维表征向量与节点矩阵进行计算结合得到节点序列数据,并将节点序列数据输入至判决模型得到用户身份识别结果;可以更好的利用知识图谱数据中拓扑结构在时间和空间上的变动带来的信息,从而对现实生活中用户身份进行更加准确的识别,大幅度提升了身份识别的准确性和可靠性。附图说明通过参考附图会更加清楚的理解本公开的特征和优点,附图是示意性的而不应理解为对本公开进行任何限制,在附图中:图1是根据本公开的一些实施例所示的一个基于知识图谱的金融反欺诈系统的示例图;图2是根据本公开的一些实施例所示的一种用户身份识别方法的流程示意图;图3是根据本公开的一些实施例所示的一种用户身份识别的示意图;图4是根据本公开的一些实施例所示的一种欺诈团伙识别方法的示意图;图5是根据本公开的一些实施例所示的一种用户身份识别装置的结构框图;图6是根据本公开的一些实施例所示的一种电子设备的结构示意图。具体实施方式在下面的详细描述中,通过示例阐述了本公开的许多具体细节,以便提供对相关披露的透彻理解。然而,对于本领域的普通技术人员来讲,本公开显而易见的可以在没有这些细节的情况下实施。应当理解的是,本公开中使用“系统”、“装置”、“单元”和/或“模块”术语,是用于区分在顺序排列中不同级别的不同部件、元件、部分或组件的一种方法。然而,如果其他表达式可以实现相同的目的,这些术语可以被其他表达式替换。应当理解的是,当设备、单元或模块被称为“在……上”、“连接到”或“耦合到”另一设备、单元或模块时,其可以直接在另一设备、单元或模块上,连接或耦合到或与其他设备、单元或模块通信,或者可以存在中间设备、单元或模块,除非上下文明确提示例外情形。例如,本公开所使用的术语“和/或”包括一个或多个相关所列条目的任何一个和所有组合。本公开所用术语仅为了描述特定实施例,而非限制本公开范围。如本公开说明书和权利要求书中所示,除非上下文明确提示例外情形,“一”、“一个”、“一种”和/或“该”等词并非特指单数,也可包括复数。一般说来,术语“包括”与“包含”仅提示包括已明确标识的特征、整体、步骤、操作、元素和/或组件,而该类表述并不构成一个排它性的罗列,其他特征、整体、步骤、操作、元素和/或组件也可以本文档来自技高网
...

【技术保护点】
1.一种用户身份识别方法,其特征在于,包括:/n对知识图谱数据中的节点进行图嵌入式处理,获得节点的低维表征向量;/n通过预训练过的抽取模型从所述知识图谱数据中抽取节点数据,形成节点矩阵;/n将所述低维表征向量与所述节点矩阵进行计算结合,生成节点序列数据;/n将所述节点序列数据输入至预训练过的判决模型,输出用户身份识别结果。/n

【技术特征摘要】
1.一种用户身份识别方法,其特征在于,包括:
对知识图谱数据中的节点进行图嵌入式处理,获得节点的低维表征向量;
通过预训练过的抽取模型从所述知识图谱数据中抽取节点数据,形成节点矩阵;
将所述低维表征向量与所述节点矩阵进行计算结合,生成节点序列数据;
将所述节点序列数据输入至预训练过的判决模型,输出用户身份识别结果。


2.根据权利要求1所述的方法,其特征在于,所述抽取模型以知识图谱数据中的至少一个节点为线索,按照预设规则抽取至少一个节点,形成节点矩阵。


3.根据权利要求1或2所述的方法,其特征在于,所述抽取模型按照时间、拓扑结构、节点类型和/或各节点连接度中的一个或多个维度设置抽取方法。


4.根据权利要求1所述的方法,其特征在于,所述判决模型输出的用户身份识别结果包括至少一个节点对应的用户身份识别结果。


5.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述判决模型输出一个或多个节点标识;根据所述节点标识获取所述用户身份识别结果。<...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:拉卡拉支付股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1