目标对象识别方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:23349248 阅读:20 留言:0更新日期:2020-02-15 05:55
本申请是关于一种目标对象识别方法、装置、计算机设备及存储介质,涉及网络安全技术领域。该方法包括:对网络关系图中的各个节点的PageRank值进行初始化;按照随机游走算法迭代计算,获得网络关系图中的各个节点与种子节点集合之间的相似值;根据各个节点与种子节点集合之间的相似值,从各个节点中识别出与至少一个种子节点具有相同节点类型的目标节点;将目标节点对应的网络对象确定为目标对象。本方案只需要在网络关系图中预先指定少量特定类型的种子节点,即可以通过迭代计算筛选出与种子节点相同类型的目标节点,并将目标节点对应的网络对象识别为目标对象,提高网络对象识别的准确性。

Target object recognition method, device, computer equipment and storage medium

【技术实现步骤摘要】
目标对象识别方法、装置、计算机设备及存储介质
本申请涉及网络安全
,特别涉及一种目标对象识别方法、装置、计算机设备及存储介质。
技术介绍
在网络技术的不断发展,网络安全技术也越来越得到重视。其中,如何识别网络中可能的恶意用户(或者恶意用户使用的设备)是网络安全技术中的重要研究方向。在相关技术中,通常训练机器学习模型来识别网络中的恶意用户或设备。例如,开发人员预先搜集已标注的恶意用户的特征信息,比如,恶意用户的用户属性、网络社区属性等等,然后根据恶意用户的特征信息训练机器学习模型;在识别阶段,将待识别用户的特征信息输入训练好的机器学习模型,由机器学习模型输出该待识别用户是否为恶意用户的识别结果。然而,相关技术中机器学习模型的识别准确性取决于训练数据的规模,而网络中恶意用户或设备的数量稀少,很难采集到足够数量的训练数据,导致训练出的机器学习模型准确性较低,对于恶意用户或设备的识别效果较差。
技术实现思路
本申请实施例提供了一种目标对象识别方法、装置、计算机设备及存储介质,可以提高从网络中识别出恶意用户或恶意设备等目标对象的准确性,该技术方案如下:一方面,提供了一种目标对象识别方法,所述方法包括:获取网络关系图,所述网络关系图由节点和节点之间的边构成;所述网络关系图中的每个节点对应一个网络对象;对所述网络关系图中的各个节点的佩奇排名PageRank值进行初始化;所述网络关系图中包含至少一个种子节点;按照随机游走算法迭代计算,获得所述网络关系图中的各个节点与种子节点集合之间的相似值;所述种子节点集合中包含所述至少一个种子节点;当所述各个节点与种子节点集合之间的相似值收敛时,根据所述各个节点与所述种子节点集合之间的相似值,从所述各个节点中识别出与所述至少一个种子节点具有相同节点类型的目标节点;将所述目标节点对应的网络对象确定为目标对象。一方面,提供了一种目标对象识别装置,该装置包括:图获取模块,用于获取网络关系图,所述网络关系图由节点和节点之间的边构成;所述网络关系图中的每个节点对应一个网络对象;初始化模块,用于对所述网络关系图中的各个节点的佩奇排名PageRank值进行初始化;所述网络关系图中包含至少一个种子节点;迭代计算模块,用于按照随机游走算法迭代计算,获得所述网络关系图中的各个节点与种子节点集合之间的相似值;所述种子节点集合中包含所述至少一个种子节点;节点识别模块,用于当所述各个节点与种子节点集合之间的相似值收敛时,根据所述各个节点与所述种子节点集合之间的相似值,从所述各个节点中识别出与所述至少一个种子节点具有相同节点类型的目标节点;对象确定模块,用于将所述目标节点对应的网络对象确定为目标对象。在一种可能的实现方式中,所述随机游走算法包括:从所述至少一个种子节点中的每个节点开始,以d的概率向当前节点指向的下一个节点游走,并以1-d的概率跳转回所述种子节点集合中的任意一个节点;其中,0<d<1。在一种可能的实现方式中,所述随机游走算法还包括:若当前节点是所述网络关系图中的终止节点,则以d的概率跳转回所述种子节点集合中的任意一个节点。在一种可能的实现方式中,所述迭代计算模块,用于,在每一次迭代计算过程中,对于所述网络关系图中的第一节点,以下述公式计算所述第一节点与所述种子节点集合之间的相似值:其中,所述第一节点是非种子节点中的任意一个节点,所述非种子节点是所述各个节点中,除所述种子节点集合之外的节点;PPR(t)是所述节点t在本次迭代计算之前与所述种子节点集合之间的相似值;PPRs(t)为本次迭代计算获得的,节点t与所述种子节点集合之间的相似值;d为游走概率,N为指向所述节点t的节点个数,Nout(i)表示节点i的所有出边的条数,Nin(t)表示所有指向节点t的节点。在一种可能的实现方式中,所述迭代计算模块,用于,在每一次迭代计算过程中,对于所述网络关系图中的第二节点,以下述公式计算所述第二节点与所述种子节点集合之间的相似值:其中,所述第二节点是所述种子节点集合中的任意一个节点,PPR(t)是所述各个节点在本次迭代计算之前与所述种子节点集合之间的相似值;PPRs(t)为本次迭代计算获得的,节点t与所述种子节点集合之间的相似值;d为游走概率,N为指向所述节点t的节点个数,Nout(i)表示节点i的所有出边的条数,Nin(t)表示所有指向节点t的节点;Ns表示所述种子节点集合包含的节点个数,D表示由终止节点组成的集合;PPRe表示所述终止节点e在本次迭代计算之前与所述种子节点集合之间的相似值。在一种可能的实现方式中,所述迭代计算模块,用于,在每一次迭代计算过程中,通过spark引擎从参数服务器拉取所述各个节点在本次迭代之前与所述种子节点集合之间的相似值;通过所述spark引擎,根据所述各个节点在本次迭代之前与所述种子节点集合之间的相似值进行计算,得到本次迭代计算获得的,所述各个节点与所述种子节点集合之间的相似值。在一种可能的实现方式中,所述装置还包括:参数更新模块,用于在每一次迭代计算后,将本次迭代计算获得的,所述各个节点与所述种子节点集合之间的相似值更新至所述参数服务器。在一种可能的实现方式中,所述节点识别模块,用于,将所述各个节点中的非种子节点中,与所述种子节点集合之间的相似值大于相似度阈值的节点确定为所述目标节点。在一种可能的实现方式中,所述装置还包括:阈值确定模块,用于在所述节点识别模块将所述各个节点中的非种子节点中,与所述种子节点集合之间的相似值大于相似度阈值的节点确定为所述目标节点之前,根据所述各个节点与种子节点集合之间的相似值,确定所述相似度阈值。在一种可能的实现方式中,所述网络关系图中的各个节点为用户节点,所述网络关系图中的边表示两个节点对应的用户之间存在资金往来;或者,所述网络关系图中的各个节点包括用户节点和终端节点,所述网络关系图中的边表示用户节点对应的用户与终端节点对应的终端之间存在登录关系。一方面,提供了一种计算机设备,该计算机设备包含处理器和存储器,存储器中存储由至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述目标对象识别方法。一方面,提供了一种计算机可读存储介质,该存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行以实现上述目标对象识别方法。本申请提供的技术方案可以包括以下有益效果:通过构建包含至少一个种子节点的网络关系图,并按照随机游走的方式计算网络中各个节点分别与种子节点之间的相似性,只需要在网络关系图中预先指定少量特定类型的种子节点,即可以通过迭代计算筛选出与种子节点相同类型的目标节点,并将目标节点对应的网络对象识别为目本文档来自技高网...

【技术保护点】
1.一种目标对象识别方法,其特征在于,所述方法包括:/n获取网络关系图,所述网络关系图由节点和节点之间的边构成;所述网络关系图中的每个节点对应一个网络对象;/n对所述网络关系图中的各个节点的佩奇排名PageRank值进行初始化;所述网络关系图中包含至少一个种子节点;/n按照随机游走算法迭代计算,获得所述网络关系图中的各个节点与种子节点集合之间的相似值;所述种子节点集合中包含所述至少一个种子节点;/n当所述各个节点与种子节点集合之间的相似值收敛时,根据所述各个节点与所述种子节点集合之间的相似值,从所述各个节点中识别出与所述至少一个种子节点具有相同节点类型的目标节点;/n将所述目标节点对应的网络对象确定为目标对象。/n

【技术特征摘要】
1.一种目标对象识别方法,其特征在于,所述方法包括:
获取网络关系图,所述网络关系图由节点和节点之间的边构成;所述网络关系图中的每个节点对应一个网络对象;
对所述网络关系图中的各个节点的佩奇排名PageRank值进行初始化;所述网络关系图中包含至少一个种子节点;
按照随机游走算法迭代计算,获得所述网络关系图中的各个节点与种子节点集合之间的相似值;所述种子节点集合中包含所述至少一个种子节点;
当所述各个节点与种子节点集合之间的相似值收敛时,根据所述各个节点与所述种子节点集合之间的相似值,从所述各个节点中识别出与所述至少一个种子节点具有相同节点类型的目标节点;
将所述目标节点对应的网络对象确定为目标对象。


2.根据权利要求1所述的方法,其特征在于,所述随机游走算法包括:
从所述至少一个种子节点中的每个节点开始,以d的概率向当前节点指向的下一个节点游走,并以1-d的概率跳转回所述种子节点集合中的任意一个节点;
其中,0<d<1。


3.根据权利要求2所述的方法,其特征在于,所述随机游走算法还包括:
若当前节点是所述网络关系图中的终止节点,则以d的概率跳转回所述种子节点集合中的任意一个节点。


4.根据权利要求3所述的方法,其特征在于,所述按照随机游走算法,获得计算所述网络关系图中的各个节点与种子节点集合之间的相似值,包括:
在每一次迭代计算过程中,对于所述网络关系图中的第一节点,以下述公式计算所述第一节点与所述种子节点集合之间的相似值:



其中,所述第一节点是非种子节点中的任意一个节点,所述非种子节点是所述各个节点中,除所述种子节点集合之外的节点;PPR(t)是所述节点t在本次迭代计算之前与所述种子节点集合之间的相似值;PPRs(t)为本次迭代计算获得的,节点t与所述种子节点集合之间的相似值;d为游走概率,N为指向所述节点t的节点个数,Nout(i)表示节点i的所有出边的条数,Nin(t)表示所有指向节点t的节点。


5.根据权利要求3所述的方法,其特征在于,所述按照随机游走算法计算,获得所述网络关系图中的各个节点与种子节点集合之间的相似值,包括:
在每一次迭代计算过程中,对于所述网络关系图中的第二节点,以下述公式计算所述第二节点与所述种子节点集合之间的相似值:



其中,所述第二节点是所述种子节点集合中的任意一个节点,PPR(t)是所述各个节点在本次迭代计算之前与所述种子节点集合之间的相似值;PPRs(t)为本次迭代计算获得的,节点t与所述种子节点集合之间的相似值;d为游走概率,N为指向所述节点t的节点个数,Nout(i)表示节点i的所有出边的条数,Nin(t)表示所有指向节点t的节点;Ns表示所述种子节点集合包含的节点个数,D表示由终止节点组成的集合;PPRe表示所述终止节点e在本次迭代计算之前与所述种子节点集合之间的相似值。


6.根据权利要求1所述的方法,其特征在于,所述按照随机游走算法迭代计算,获得所述网络关系图中的各个节点与种子节点集合之间的相似值,包括:
在每一次迭代计算过程中,通过spark引擎从参数服务器拉取所述各个节点在本次迭代之前与所述种子节点集合之间的相似值;
通过所述spark引擎,根据所述各个节点在本次迭代之前与所述种子节点集合之间的相似值进行计算...

【专利技术属性】
技术研发人员:石志林郑巧玲应秋芳胡彬梁浩强张杰张纪红刘洪
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1