【技术实现步骤摘要】
一种知识图谱异常社区检测方法及装置
本专利技术涉及知识图谱
,尤其是涉及一种知识图谱异常社区检测方法及装置。
技术介绍
构建知识图谱后,挖掘图谱中异常社区是许多应用场景都要面临的问题之一。但是构建的知识图谱往往十分庞大,难以从里面直接提取出有效的特征来获取异常社区。若采用人工设置特征的方式进行分析,有极大的可能会因为人为无法对全局考虑导致得到的异常社区存在偏差。但是大量的异常社区的特征又隐藏于知识图谱中,因此需要一种能够自动挖掘异常社区特征,将异常数据聚集在一起获取异常社区的方法。目前在知识图谱应用领域,现有的方法是分析异常数据周围的邻居节点,即若知识图谱中出现异常数据,则其周围的信息有极大的概率组成异常社区。然而这种方法对知识图谱内数据的标签量有十分严格的要求,若标签量较少则很难挖掘出异常社区。因此单纯标识知识图谱中异常数据节点附近的数据为异常社区具有很大的局限性,若加入大量新的节点后,可能会导致输出的结果之间差异性较大。另外一种分析异常社区的方法则是通过节点之间的跳数,以此为节点之间的距离,生成一个 ...
【技术保护点】
1.一种知识图谱异常社区检测方法,其特征在于,包括以下步骤:/n步骤一,根据应用场景及数据集,构建异质知识图谱;/n步骤二,从所述异质知识图谱提取一个仅有实体的同质网络;/n步骤三,对所述同质网络中的每一连通子图,使用网络嵌入技术获得各连通子图的节点距离向量;/n步骤四,基于所述节点距离向量对各连通子图进行聚类,生成社区;/n步骤五,根据每个社区内异常标签数据和正常标签数据的比例判断对应社区是否为异常社区。/n
【技术特征摘要】
1.一种知识图谱异常社区检测方法,其特征在于,包括以下步骤:
步骤一,根据应用场景及数据集,构建异质知识图谱;
步骤二,从所述异质知识图谱提取一个仅有实体的同质网络;
步骤三,对所述同质网络中的每一连通子图,使用网络嵌入技术获得各连通子图的节点距离向量;
步骤四,基于所述节点距离向量对各连通子图进行聚类,生成社区;
步骤五,根据每个社区内异常标签数据和正常标签数据的比例判断对应社区是否为异常社区。
2.根据权利要求1所述的知识图谱异常社区检测方法,其特征在于,所述步骤一中,根据应用场景获得数据集的有效特征,基于所述有效特征获得构建知识图谱所需的实体和关系,获得所述异质知识图谱。
3.根据权利要求1所述的知识图谱异常社区检测方法,其特征在于,所述步骤二中,基于图数据库提取所述同质网络。
4.根据权利要求1所述的知识图谱异常社区检测方法,其特征在于,所述同质网络中,基于两个实体间的关系数量设置对应实体间的边权重。
5.根据权利要求1所述的知识图谱异常社区检测方法,其特征在于,所述步骤五中,若异常标签数据和正常标签数据的比例超过设定阈值,则判定该社区为异常社区,反之,则为正常社区;
若社区内无标签数据,则判定该社区为正常社区或者判定该社区为灰色社区。
6.一种知识图谱异常社区检...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。