相似实体搜索方法、装置、计算机设备及可读存储介质制造方法及图纸

技术编号:37153276 阅读:31 留言:0更新日期:2023-04-06 22:11
本发明专利技术提供的相似实体搜索方法、装置、计算机设备及可读存储介质,方法包括:从获取图数据的中提取行为路径集合;从行为路径集合中提取待搜索实体关联的目标行为路径;待搜索实体是行为关联对象、行为或者由至少一个行为关联对象和至少一个行为构成;根据目标行为路径,生成待搜索实体的行为特征向量;基于行为特征向量,确定实体数据库中与待搜索实体之间的相似度满足预设条件的目标实体。本发明专利技术方案中的待搜索实体可以是行为关联对象、行为或者是由至少一个行为关联对象和至少一个行为构成,也就是子图或者整张图,扩大了搜索范围,本发明专利技术实将图结构信息映射到转换为特征向量,利用向量相似度确定相似实体,降低了计算复杂度,提高了搜索效率。提高了搜索效率。提高了搜索效率。

【技术实现步骤摘要】
相似实体搜索方法、装置、计算机设备及可读存储介质


[0001]本申请涉及计算机
,具体涉及一种相似实体搜索方法、装置、计算机设备及可读存储介质。

技术介绍

[0002]图表示技术目前已经广泛应用在相似流程搜索、恶意代码或者异常用户检测等领域,主要搜索方式是先基于流程、代码或者用户的行为模式构建图,然后通过比较图结构之间的相似性确定相似实体,计算复杂度较大,降低了搜索效率。

技术实现思路

[0003]本申请实施例的目的在于提供的相似实体搜索方法、装置、计算机设备及可读存储介质,用于解决现有搜索技术中计算复杂度大、搜索效率低的技术问题,本专利技术技术方案可以这样实现:
[0004]第一方面,本专利技术提供一种相似实体搜索方法,所述方法包括:
[0005]获取图数据,并从所述图数据中提取行为路径集合;
[0006]其中,所述图数据是依据行为关联对象之间的行为关系生成的;所述图数据包括行为节点和行为方向线的属性数据,所述行为节点表征所述行为关联对象;所述行为方向线表征行为;行为路径是根据所述行为关联对象之间本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种相似实体搜索方法,其特征在于,所述方法包括:获取图数据,并从所述图数据中提取行为路径集合;其中,所述图数据是依据行为关联对象之间的行为关系生成的;所述图数据包括行为节点和行为方向线的属性数据,所述行为节点表征所述行为关联对象;所述行为方向线表征行为;行为路径是根据所述行为关联对象之间产生的具有先后顺序的所述行为形成;从所述行为路径集合中提取待搜索实体关联的目标行为路径;其中,所述待搜索实体是所述行为关联对象、所述行为或者由至少一个所述行为关联对象和至少一个所述行为构成;根据所述目标行为路径生成所述待搜索实体的行为特征向量;基于所述行为特征向量,确定实体数据库中与所述待搜索实体之间的相似度满足预设条件的目标实体。2.根据权利要求1所述的方法,其特征在于,获取图数据,并从所述图数据中提取行为路径集合,包括:针对任意两个所述行为节点,沿所述行为方向线的方向,提取任意两个所述行为节点之间的全部行为节点和全部行为方向线,组成一条所述行为路径;提取路径长度在预设长度范围内的全部所述行为路径并去重,得到所述行为路径集合。3.根据权利要求1所述的方法,其特征在于,当所述待搜索实体为所述行为关联对象,从所述行为路径集合中提取待搜索实体关联的目标行为路径,包括:从所述行为路径集合中,提取以所述待搜索实体为起点且路径长度小于或等于最大长度阈值的行为路径,作为所述目标行为路径。4.根据权利要求1所述的方法,其特征在于,当所述待搜索实体为所述图数据的子图,从所述行为路径集合中提取待搜索实体关联的目标行为路径,包括:从所述图数据中确定出至少一个目标行为节点和至少一个目标行为方向线;根据所述目标行为节点之间关联的所述目标行为方向线,构建所述子图;在所述子图中,针对任意两个所述目标行为节点,沿所述目标行为方向线的方向,提取任意两个所述目标行为节点之间的全部目标行为节点和全部目标行为方向线,组成一条所述目标行为路径;剔除路径长度不在预设长度范围内的所述目标行为路径并去重,得到所述子图对应的目标行为路径。5.根据权利要求1所述的方法,其特征在于,当所述待搜索实体为所述行为,从所述行为路径集合中提取待搜索实体关联的目标行为路径,包括:确定所述待搜索实体关联的两个目标行为节点,并从所述行为路径集合中,提取以每个所述目标行为节点为起点且路径长度小于或等于最大长度阈值与预设值之差的行为路径,作为所述目标行为路径。6.根据权利要求1所述的方法,其特征在于,根据所述目标行为路径生成所述待搜索实体的行为特征向量,包括:根据预设长度范围提取每条所述目标行为路径包含的全部子路径;将每条所述子路径中的每个路径节点转换成行为属性字符串序列;
其中,所述路径节点为所述行为关联对象和所述行为方向线;所述行为属性字符串序列中的每个所述行为属性字符串由所述路径节点对应的属性名称、属性值和位置序号组成;将每条所述子路径对应的行为属性字符串序列进行向量转换,得到每条所述子路径对应的预设维度的向量;将全部所述向量逐位相加得到所述目标行为路径的行为特征向量。7.根据权利要求6所...

【专利技术属性】
技术研发人员:束博王占一刘昱均万鸣席卓田亮杨舒张晓峰曲君国
申请(专利权)人:奇安信科技集团股份有限公司北京天广汇通科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1