账号关系识别方法及装置制造方法及图纸

技术编号:27032495 阅读:16 留言:0更新日期:2021-01-12 11:15
本说明书实施例提供一种账号关系识别方法和装置,该方法包括:获取根据账号的属性信息构建的知识图谱,知识图谱包括对应于多个账号的多个节点,属性信息包括若干属性项的信息,对于各属性项,具有相同属性值的两个账号对应的两个节点之间通过连接边相连接;然后,利用预先训练的图嵌入模型,基于知识图谱中各个节点的节点特征和各个连接边的边特征,对知识图谱进行图嵌入处理,得到各个节点对应的嵌入向量;将至少一对节点对应的嵌入向量,输入预先训练的预测模型,获得每对节点对应于同一实体的概率值,一对节点为知识图谱中彼此之间有连接边的两个节点。该方法能够有效甄别对应于同一实体的不同账号,以减少针对同一实体的重复的业务操作。

【技术实现步骤摘要】
账号关系识别方法及装置
本说明书一个或多个实施例涉及人工智能
,尤其涉及账号关系识别方法及装置。
技术介绍
在业务开拓、风控管理等实际应用场景下,店铺等实体是执行业务开拓或风控管理的目标对象之一。同一实体在不同体系中可能具有多个不同的账号,或者同一实体在同一体系中可能具有两个以上不同的账号,例如,同一店铺在第三方支付平台体系中具有两个账号,并且,在银行体系中,作为银行商户,该店铺还具有银行为其生成的一个虚拟账号,以用于通过第三方支付平台与银行进行结算,而该店铺还可能在其他的外卖平台或B2B平台等体系中有其他账号。目前,在同一体系内部执行或者跨平台、跨体系进行联合操作的业务开拓或风控管理方案中,一般以账号作为实体的身份标识,针对同一实体的不同账号可能会重复执行相应的业务操作,例如,在业务开拓场景中向用户推送业务、红包或优惠券时,有可能针对同一店铺的多个账号进行多次重复推送,同一店铺反复接收到同一业务的推送页面或重复领取红包、优惠券;以及,在风控场景中,将同一店铺的多个账号作为不同的实体分别进行风险控制,使得相应的风险管控措施冗余或无效。因此,希望能有改进的方案,能够有效对同一体系或者不同体系中的对应于同一实体的多个账号进行识别。
技术实现思路
本说明书一个或多个实施例描述了一种账号关系识别方法及装置,通过知识图谱表征多个账号与实体之间的关联关系,针对该知识图谱执行图嵌入处理,提取节点特征,通过预测模型预测对应于同一实体的概率值,实现节点与实体对应关系的识别。根据第一方面,提供了一种账号关系识别方法,该方法包括:获取根据账号的属性信息构建的知识图谱,其中,知识图谱包括对应于多个账号的多个节点,属性信息包括若干属性项的信息,对于各属性项,具有相同属性值的两个账号对应的两个节点之间通过连接边相连接;利用预先训练的图嵌入模型,基于知识图谱中各个节点的节点特征和各个连接边的边特征,对知识图谱进行图嵌入处理,得到各个节点对应的嵌入向量;将至少一对节点对应的嵌入向量,输入预先训练的预测模型,获得每对节点对应于同一实体的概率值,一对节点为知识图谱中彼此之间有连接边的两个节点。在一个实施例中,属性信息包括地址类属性项、静态身份类属性项、商户类别属性项和经营特征类属性项中的任意一种或多种。在一个实施例中,实体为商户,地址类属性项包括进货地址信息、付款方LBS汇聚地址信息、收银设备地址信息和地理位置信息中的任意一种或多种;静态身份类属性项,包括商户名称、法人信息、结算银行卡、收件地址中的任意一种或多种;商户类别属性项,包括连锁店、加盟店以及其他指定实体类型中的任意一种或多种;经营特征类属性项,包括单笔交易的金额、交易频率、交易时段、交易对象中的任意一种或多种。在一个实施例中,若干属性项包括,被划分为不同级别的多个属性项;各个连接边具有各自的边类型,任一连接边的边类型,与该连接边所对应的属性项的级别相对应;不同类型的连接边具有不同的边特征。在一个实施例中,不同级别包括,根据属性项所表示的关系强度而划分的强属性项、中等属性项和弱属性项;具有相同的强属性值、中等属性值和弱属性值的两个账号对应的节点之间,分别建立一级连接边、二级连接边、三级连接边,其中一级连接边至三级连接边的边特征的初始值分别为IV1、IV2、IV3,IV1>IV2>IV3。在一个实施例中,基于知识图谱中各个节点的节点特征和各个连接边的边特征,对知识图谱进行图嵌入处理,包括:基于知识图谱提取图结构信息;确定知识图谱中各个节点的节点特征和各条边的边特征;将图结构信息以及各个节点特征和各个边特征输入预先训练得到的图嵌入模型,通过图嵌入模型,对各个节点对应的节点特征进行图嵌入处理。在一个实施例中,通过图嵌入模型,对各个节点对应的节点特征进行图嵌入处理,包括:以知识图谱中的任一节点作为第一节点,确定第一节点的邻居节点集合,以及将邻居节点集合中的各个节点与第一节点之间的连接边作为目标边;根据第一节点和邻居节点集合中各个节点的节点特征以及各条目标边的边特征,进行至少一级的向量嵌入,得到第一节点对应的嵌入向量。在一个实施例中,根据第一节点和邻居节点集合中各个节点的节点特征以及各条目标边的边特征,进行至少一级的向量嵌入,包括:根据第一节点的节点原始特征,确定第一节点的初级嵌入向量;基于初级嵌入向量,以及第一节点的邻居节点集合,执行一级或多级向量聚合,其中,每级向量聚合包括,对邻居节点集合中各个邻居节点的上一级嵌入向量进行邻居聚合,根据该邻居聚合结果,以及第一节点的上一级嵌入向量,确定第一节点的本级嵌入向量。在一个实施例中,图嵌入模型包括编码器和解码器;基于知识图谱,对各个节点对应的节点特征进行图嵌入处理之前,还包括对图嵌入模型进行预先训练,具体包括:将图结构信息以及各个节点特征和各个边特征输入编码器,通过编码器执行图嵌入运算,得到各个节点对应的嵌入向量;从知识图谱中提取出至少一个三元组,输入解码器,三元组包括第一节点,第二节点,以及连接第一节点和第二节点的第一连接边;通过解码器计算该三元组的评价分数,以及根据预设的损失函数,确定当前评价分数对应的损失值;该三元组的评价分数,基于第一节点的嵌入向量与第一连接边的边向量之和,与第二节点的嵌入向量的差值获得;以最小化损失值为目标,更新编码器。在一个实施例中,编码器基于自适应感受路径的图神经网络GeniePath、归纳式学习的图神经网络GraphSage、高斯混合模型GMM中的任意一种实现。在一个实施例中,将至少一对节点对应的嵌入向量,输入预先训练的预测模型之前,还包括:基于知识图谱提取出多个三元组,以三元组中的两个节点作为一对节点;将至少一对节点对应的嵌入向量,输入预先训练的预测模型,获得至少一对节点对应于同一实体的概率值,包括:将各对节点依次输入预先训练的预测模型,分别获得各对节点中的两个节点对应于同一实体的概率值。在一个实施例中,预测模型为XGboost、逻辑回归模型、神经网络模型中的任意一种。在一个实施例中,获得至少一对节点对应于同一实体的概率值之后,还包括:概率值达到预定阈值时,则将该对节点作为对应于同一实体的一对候选节点;基于对应于同一实体的多对候选节点,构建该实体对应的最大连通图;将最大连通子图所包含的多个节点对应的多个账号确定为对应于同一实体。根据第二方面,本说明书实施例还提供一种账号关系识别装置,包括:获取单元,被配置为,获取根据账号的属性信息构建的知识图谱,其中,知识图谱包括对应于多个账号的多个节点,属性信息包括若干属性项的信息,对于各属性项,具有相同属性值的两个账号对应的两个节点之间通过连接边相连接;图嵌入单元,被配置为,利用预先训练的图嵌入模型,基于知识图谱中各个节点的节点特征和各个连接边的边特征,对知识图谱进行图嵌入处理,得到各个节点对应的嵌入向量;预测单元,被配置为将至少一对节点对应本文档来自技高网...

【技术保护点】
1.一种账号关系识别方法,所述方法包括:/n获取根据账号的属性信息构建的知识图谱,其中,所述知识图谱包括对应于多个账号的多个节点,所述属性信息包括若干属性项的信息,对于各属性项,具有相同属性值的两个账号对应的两个节点之间通过连接边相连接;/n利用预先训练的图嵌入模型,基于所述知识图谱中各个节点的节点特征和各个连接边的边特征,对所述知识图谱进行图嵌入处理,得到各个节点对应的嵌入向量;/n将至少一对节点对应的嵌入向量,输入预先训练的预测模型,获得每对节点对应于同一实体的概率值,所述一对节点为所述知识图谱中彼此之间有连接边的两个节点。/n

【技术特征摘要】
1.一种账号关系识别方法,所述方法包括:
获取根据账号的属性信息构建的知识图谱,其中,所述知识图谱包括对应于多个账号的多个节点,所述属性信息包括若干属性项的信息,对于各属性项,具有相同属性值的两个账号对应的两个节点之间通过连接边相连接;
利用预先训练的图嵌入模型,基于所述知识图谱中各个节点的节点特征和各个连接边的边特征,对所述知识图谱进行图嵌入处理,得到各个节点对应的嵌入向量;
将至少一对节点对应的嵌入向量,输入预先训练的预测模型,获得每对节点对应于同一实体的概率值,所述一对节点为所述知识图谱中彼此之间有连接边的两个节点。


2.根据权利要求1所述的方法,其中,所述属性信息包括地址类属性项、静态身份类属性项、商户类别属性项和经营特征类属性项中的任意一种或多种。


3.根据权利要求2所述的方法,其中,所述实体为商户,所述地址类属性项包括进货地址信息、付款方LBS汇聚地址信息、收银设备地址信息和地理位置信息中的任意一种或多种;
所述静态身份类属性项,包括商户名称、法人信息、结算银行卡、收件地址中的任意一种或多种;
所述商户类别属性项,包括连锁店、加盟店以及其他指定实体类型中的任意一种或多种;
所述经营特征类属性项,包括单笔交易的金额、交易频率、交易时段、交易对象中的任意一种或多种。


4.根据权利要求1所述的方法,其中,所述若干属性项包括,被划分为不同级别的多个属性项;
所述各个连接边具有各自的边类型,任一连接边的边类型,与该连接边所对应的属性项的级别相对应;不同类型的连接边具有不同的边特征。


5.根据权利要求4所述的方法,其中,所述不同级别包括,根据属性项所表示的关系强度而划分的强属性项、中等属性项和弱属性项;
具有相同的强属性值、中等属性值和弱属性值的两个账号对应的节点之间,分别建立一级连接边、二级连接边、三级连接边,其中一级连接边至三级连接边的边特征的初始值分别为IV1、IV2、IV3,IV1>IV2>IV3。


6.根据权利要求1所述的方法,其中,基于所述知识图谱中各个节点的节点特征和各个连接边的边特征,对所述知识图谱进行图嵌入处理,包括:
基于所述知识图谱提取图结构信息;
确定所述知识图谱中各个节点的节点特征和各条边的边特征;
将所述图结构信息以及各个节点特征和各个边特征输入预先训练得到的图嵌入模型,通过所述图嵌入模型,对各个节点对应的节点特征进行图嵌入处理。


7.根据权利要求6所述的方法,其中,通过所述图嵌入模型,对各个节点对应的节点特征进行图嵌入处理,包括:
以所述知识图谱中的任一节点作为第一节点,确定所述第一节点的邻居节点集合,以及将所述邻居节点集合中的各个节点与所述第一节点之间的连接边作为目标边;
根据所述第一节点和所述邻居节点集合中各个节点的节点特征以及各条目标边的边特征,进行至少一级的向量嵌入,得到所述第一节点对应的嵌入向量。


8.根据权利要求7所述的方法,其中,根据所述第一节点和所述邻居节点集合中各个节点的节点特征以及各条目标边的边特征,进行至少一级的向量嵌入,包括:
根据所述第一节点的节点原始特征,确定所述第一节点的初级嵌入向量;
基于所述初级嵌入向量,以及所述第一节点的邻居节点集合,执行一级或多级向量聚合,其中,每级向量聚合包括,对所述邻居节点集合中各个邻居节点的上一级嵌入向量进行邻居聚合,根据该邻居聚合结果,以及所述第一节点的上一级嵌入向量,确定所述第一节点的本级嵌入向量。


9.根据权利要求6所述的方法,其中,所述图嵌入模型包括编码器和解码器;
基于所述知识图谱,对各个节点对应的节点特征进行图嵌入处理之前,还包括对所述图嵌入模型进行预先训练,具体包括:
将所述图结构信息以及各个节点特征和各个边特征输入所述编码器,通过所述编码器执行图嵌入运算,得到各个节点对应的嵌入向量;
从所述知识图谱中提取出至少一个三元组,输入所述解码器,所述三元组包括第一节点,第二节点,以及连接所述第一节点和所述第二节点的第一连接边;通过所述解码器计算该三元组的评价分数,以及根据预设的损失函数,确定当前评价分数对应的损失值;该三元组的评价分数,基于所述第一节点的嵌入向量与所述第一连接边的边向量之和,与所述第二节点的嵌入向量的差值获得;
以最小化所述损失值为目标,更新所述编码器。


10.根据权利要求9所述的方法,其中,所述编码器基于自适应感受路径的图神经网络GeniePath、归纳式学习的图神经网络GraphSage、高斯混合模型GMM中的任意一种实现。


11.根据权利要求1所述的方法,其中,将至少一对节点对应的嵌入向量,输入预先训练的预测模型之前,还包括:
基于所述知识图谱提取出多个三元组,以所述三元组中的两个节点作为一对节点;
将至少一对节点对应的嵌入向量,输入预先训练的预测模型,获得所述至少一对节点对应于同一实体的概率值,包括:
将各对节点依次输入预先训练的预测模型,分别获得各对节点中的两个节点对应于同一实体的概率值。


12.根据权利要求1-11中任一项所述的方法,其中,所述预测模型为XGboost、逻辑回归模型、神经网络模型中的任意一种。


13.根据权利要求1所述的方法,其中,获得所述至少一对节点对应于同一实体的概率值之后,还包括:
所述概率值达到预定阈值时,则将该对节点作为对应于同一实体的一对候选节点;
基于对应于所述同一实体的多对候选节点,构建该实体对应的最大连通图;
将所述最大连通子图所包含的多个节点对应的多个账号确定为对应于同一实体。...

【专利技术属性】
技术研发人员:陆健蒋博赟柳燕冯力国
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1