虚拟人身份识别的方法、系统以及计算机可读存储介质技术方案

技术编号:28420577 阅读:28 留言:0更新日期:2021-05-11 18:27
本发明专利技术公开了一种虚拟人身份识别的方法、系统以及计算机可读存储介质,方法包括:获取身份与身份之间的关联数据;基于所述关联数据分析两个身份之间的各个距离要素,所述距离要素包括以下任一或者任意种:两个身份共同出现的总次数、两个身份共同出现的场所的总数量、两个身份共同出现的时间跨度、两个身份的关联数据的来源;根据各个距离要素的分析结果确认各个距离要素的权重,根据权重计算得到两个身份的加权近似距离;对于加权近似距离超出阈值的两个身份判定两个身份之间的关联关系不可用;将可用的关联关系串联起来的每一个身份关系网络视为一个虚拟人的所有身份的合集,如此实现了自动、高效的虚拟人身份识别。

【技术实现步骤摘要】
虚拟人身份识别的方法、系统以及计算机可读存储介质
本专利技术涉及计算机互联网领域,尤其涉及一种虚拟人身份识别的方法、系统以及计算机可读存储介质。
技术介绍
随着互联网大数据技术的快速发展,人们在网络世界中会产生各种类型的账号、虚拟身份、号码,为了弄清大量不同的虚拟身份是否从属于同一个人,需要耗费大量人力和时间。且往往需要用户真实、完善、指向性的数据来辅助,这在实际业务中是比较难以获取的。如何自动识别虚拟身份的归属人,是大数据融合要解决的难点之一。现阶段没有好的的方法可以去判断几个不同类型的虚拟身份是否为同一人所有,多数情况下只能通过人工判断,费时费力,效率极其低下。在申请号为201910168675.X的专利申请中,其公开了一种网络用户身份识别方法,是通过用户在网络上发布的内容信息,挖掘分析用户的虚拟身份描述信息,并结合知识库,建立虚拟身份描述信息与现实身份描述信息的关联关系,进行身份描述信息的相关性分析。其不足在于除了基本关联关系数据,还需要引入更多的身份描述、说明、指向性的数据,但在实际的虚拟身份识别过程中。很难获取用户真实、完善、指向性的身份描述,这也是目前的识别技术的显著缺陷。有鉴于此,为了提升大数据融合分析的效能,寻找一种快速、高效的识别虚拟身份的手段已刻不容缓。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术的上述识别效率低、对原始数据的指向性要求高的缺陷,提供一种快速、高效的虚拟人身份识别的方法、系统以及计算机可读存储介质。本专利技术解决其技术问题所采用的技术方案是:构造一种虚拟人身份识别的方法,用于识别出代表一个虚拟人的所有身份的合集,所述方法包括:获取身份与身份之间的关联数据;基于所述关联数据分析两个身份之间的各个距离要素,所述距离要素包括以下任一或者任意种:两个身份共同出现的总次数、两个身份共同出现的场所的总数量、两个身份共同出现的时间跨度、两个身份的关联数据的来源;根据各个距离要素的分析结果确认各个距离要素的权重,根据权重计算得到两个身份的加权近似距离;对于加权近似距离超出阈值的两个身份判定两个身份之间的关联关系不可用;将可用的关联关系串联起来的每一个身份关系网络视为一个虚拟人的所有身份的合集。在本专利技术所述方法中,还包括:在获取身份与身份之间的关联数据时,转化得到关联关系图,在所述关联关系图中,每一个节点代表一个身份,两个节点之间的连线代表该两个节点代表的两个身份之间存在关联数据;在判定两个身份之间的关联关系不可用时,将关联关系图中的该两个身份之间的连线删除。在本专利技术所述方法中,各个距离要素的分析结果与权重之间的关系是:两个身份共同出现的总次数越多,则对应的权重越小;两个身份共同出现的场所的总数量越多,则对应的权重越小;两个身份共同出现的时间跨度越长,则对应的权重越小;两个身份的关联数据的来源的级别越高,则对应的权重越小。在本专利技术所述方法中,所述的两个身份共同出现的时间跨度越长由最近共同出现的时间减去首次共同出现的时间得到。本专利技术另一方面还构造了一种虚拟人身份识别的系统,用于识别出代表一个虚拟人的所有身份的合集,所述系统包括:数据获取模块,用于获取身份与身份之间的关联数据;距离要素分析模块,用于基于所述关联数据分析两个身份之间的各个距离要素,所述距离要素包括以下任一或者任意种:两个身份共同出现的总次数、两个身份共同出现的场所的总数量、两个身份共同出现的时间跨度、两个身份的关联数据的来源;距离确定模块,用于根据各个距离要素的分析结果确认各个距离要素的权重,根据权重计算得到两个身份的加权近似距离;关联关系可用性判定模块,用于对于加权近似距离超出阈值的两个身份判定两个身份之间的关联关系不可用;关系网络构建模块,用于将可用的关联关系串联起来的多个身份所组成的单个关系网络,视为一个虚拟人的所有身份的合集。在本专利技术所述的系统中,所述系统还包括:图示模块,用于在获取身份与身份之间的关联数据时,转化得到关联关系图,在所述关联关系图中,每一个节点代表一个身份,两个节点之间的连线代表该两个节点代表的两个身份之间存在关联数据;以及在判定两个身份之间的关联关系不可用时,将关联关系图中的该两个身份之间的连线删除。在本专利技术所述的系统中,各个距离要素的分析结果与权重之间的关系是:两个身份共同出现的总次数越多,则对应的权重越小;两个身份共同出现的场所的总数量越多,则对应的权重越小;两个身份共同出现的时间跨度越长,则对应的权重越小;两个身份的关联数据的来源的级别越高,则对应的权重越小。在本专利技术所述的系统中,所述的两个身份共同出现的时间跨度越长由最近共同出现的时间减去首次共同出现的时间得到。本专利技术另一方面还构造了一种虚拟人身份识别的系统,其特征在于,包括处理器和存储器,所述存储器存储有计算机程序,所述计算机程序被处理器执行时实现如前任一项所述的方法的步骤。本专利技术另一方面还构造了一种计算机可读存储介质,其特征在于,存储有计算机程序,所述计算机程序被处理器执行时实现如前任一项所述的方法的步骤。本专利技术的虚拟人身份识别的方法、系统以及计算机可读存储介质,具有以下有益效果:本专利技术可结合从互联网及相关单位获取的身份之间的关联数据,对两个身份之间的关联关系计算近似距离来评估其是否可用,以此对身份进行聚类,将可用的关联关系串联起来的每一个身份关系网络视为一个虚拟人的所有身份的合集,如此实现了自动、高效的虚拟人身份识别。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图:图1是本专利技术虚拟人身份识别的方法的流程图;图2是初始得到的关联关系图;图3是计算了近似距离后的关联关系图;图4是最终的关联关系图;图5是本专利技术虚拟人身份识别的系统的结构示意图。具体实施方式为了便于理解本专利技术,下面将参照相关附图对本专利技术进行更全面的描述。附图中给出了本专利技术的典型实施例。但是,本专利技术可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使对本专利技术的公开内容更加透彻全面。除非另有定义,本文所使用的所有的技术和科学术语与属于本专利技术的
的技术人员通常理解的含义相同。本文中在本专利技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本专利技术。本专利技术总的思路是:利用既有的关联数据,分析两个身份之间的各个距离要素,继而据此确认各个距离要素的权重,根据权重计算得到两个身份的加权近似距离,对于加权近似距离超出阈值的两个身份判定两个身份之间的关联关系不可用,最后将可用的关联本文档来自技高网
...

【技术保护点】
1.一种虚拟人身份识别的方法,用于识别出代表一个虚拟人的所有身份的合集,其特征在于,所述方法包括:/n获取身份与身份之间的关联数据;/n基于所述关联数据分析两个身份之间的各个距离要素,所述距离要素包括以下任一或者任意种:两个身份共同出现的总次数、两个身份共同出现的场所的总数量、两个身份共同出现的时间跨度、两个身份的关联数据的来源;/n根据各个距离要素的分析结果确认各个距离要素的权重,根据权重计算得到两个身份的加权近似距离;/n对于加权近似距离超出阈值的两个身份判定两个身份之间的关联关系不可用;/n将可用的关联关系串联起来的每一个身份关系网络视为一个虚拟人的所有身份的合集。/n

【技术特征摘要】
1.一种虚拟人身份识别的方法,用于识别出代表一个虚拟人的所有身份的合集,其特征在于,所述方法包括:
获取身份与身份之间的关联数据;
基于所述关联数据分析两个身份之间的各个距离要素,所述距离要素包括以下任一或者任意种:两个身份共同出现的总次数、两个身份共同出现的场所的总数量、两个身份共同出现的时间跨度、两个身份的关联数据的来源;
根据各个距离要素的分析结果确认各个距离要素的权重,根据权重计算得到两个身份的加权近似距离;
对于加权近似距离超出阈值的两个身份判定两个身份之间的关联关系不可用;
将可用的关联关系串联起来的每一个身份关系网络视为一个虚拟人的所有身份的合集。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在获取身份与身份之间的关联数据时,转化得到关联关系图,在所述关联关系图中,每一个节点代表一个身份,两个节点之间的连线代表该两个节点代表的两个身份之间存在关联数据;
在判定两个身份之间的关联关系不可用时,将关联关系图中的该两个身份之间的连线删除。


3.根据权利要求1所述的方法,其特征在于,各个距离要素的分析结果与权重之间的关系是:
两个身份共同出现的总次数越多,则对应的权重越小;
两个身份共同出现的场所的总数量越多,则对应的权重越小;
两个身份共同出现的时间跨度越长,则对应的权重越小;
两个身份的关联数据的来源的级别越高,则对应的权重越小。


4.根据权利要求1所述的方法,其特征在于,所述的两个身份共同出现的时间跨度越长由最近共同出现的时间减去首次共同出现的时间得到。


5.一种虚拟人身份识别的系统,用于识别出代表一个虚拟人的所有身份的合集,其特征在于,所述系统包括:
数据获取模块,用于获取身份与身份之间的关联数据;
距离要素分析模块,用于基于所述关联数据分析两个身份之间的各个距...

【专利技术属性】
技术研发人员:藏巨翔翁长文李斌辉马啸尘沈智杰景晓军
申请(专利权)人:任子行网络技术股份有限公司深圳市任子行科技开发有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1