标识处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:37171673 阅读:8 留言:0更新日期:2023-04-20 22:42
本申请涉及一种标识处理方法、装置、计算机设备和存储介质。所述方法涉及大数据的数据挖掘技术,所述方法包括:获取包括特定类型标识和待识别标识的标识集合;确定标识集合中存在交互关系的任意两个标识之间的交互关系得分;以标识集合中各标识为顶点、交互关系得分为顶点之间的边权重,构建标识关联图谱,各顶点所表示的标识具有初始的特定类型置信度;基于初始的特定类型置信度,迭代地根据表示待识别标识的顶点与邻居顶点之间的边权重和邻居顶点的特定类型置信度,更新顶点所表示的待识别标识对应的特定类型置信度;按照迭代停止后获得的特定类型置信度,从待识别标识中识别出特定类型标识。本申请提出的技术方案,能够提升标识处理的准确率。升标识处理的准确率。升标识处理的准确率。

【技术实现步骤摘要】
标识处理方法、装置、计算机设备和存储介质


[0001]本申请涉及大数据
,特别是涉及一种标识处理方法、装置、计算机设备和存储介质。

技术介绍

[0002]随着计算机技术与互联网技术的飞速发展,用户可以依赖于自身的标识,实现与他人的交互。例如,在即时通信应用中,用户可以通过用户标识与他人社交,还可以与他人实现在线资金往来。近年来,恶意用户的出现,给用户的日常生活带来了极大的损失,对这些用户使用的标识进行挖掘成为各大平台亟需解决的问题。
[0003]相关技术中,基于机器学习的标识挖掘方法,需要使用大量的正负样本才能提升识别准确率,而现实中正负样本很难搜集。在基于标识的行为属性特征的无监督挖掘方法中,只能挖掘指定类型的恶意标识,那些与指定类型的作恶手法存在差异的恶意标识,容易成为落网之鱼,导致识别效果较差。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提升特定类型标识的挖掘的准确率的标识处理方法、装置、计算机设备和存储介质。
[0005]一种标识处理方法,所述方法包括:
[0006]获取标识集合,所述标识集合包括特定类型标识和待识别标识;
[0007]确定所述标识集合中存在交互关系的任意两个标识之间的交互关系得分,所述交互关系得分表征所述两个标识之间的交互程度;
[0008]以所述标识集合中各标识为顶点、所述交互关系得分为顶点之间的边权重,构建标识关联图谱,各所述顶点所表示的标识具有初始的特定类型置信度;
[0009]基于所述初始的特定类型置信度,迭代地根据表示待识别标识的顶点与邻居顶点之间的边权重和所述邻居顶点的特定类型置信度,更新所述顶点所表示的待识别标识对应的特定类型置信度,直至满足迭代停止条件时停止;
[0010]按照迭代停止后获得的特定类型置信度,从所述待识别标识中识别出特定类型标识。
[0011]一种标识处理装置,所述装置包括:
[0012]获取模块,用于获取标识集合,所述标识集合包括特定类型标识和待识别标识;
[0013]交互关系确定模块,用于确定所述标识集合中存在交互关系的任意两个标识之间的交互关系得分,所述交互关系得分表征所述两个标识之间的交互程度;
[0014]图谱构建模块,用于以所述标识集合中各标识为顶点、所述交互关系得分为顶点之间的边权重,构建标识关联图谱,各所述顶点所表示的标识具有初始的特定类型置信度;
[0015]更新模块,用于基于所述初始的特定类型置信度,迭代地根据表示待识别标识的顶点与邻居顶点之间的边权重和所述邻居顶点的特定类型置信度,更新所述顶点所表示的
待识别标识对应的特定类型置信度,直至满足迭代停止条件时停止;
[0016]筛选模块,用于按照迭代停止后获得的特定类型置信度,从所述待识别标识中识别出特定类型标识。
[0017]一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0018]获取标识集合,所述标识集合包括特定类型标识和待识别标识;
[0019]确定所述标识集合中存在交互关系的任意两个标识之间的交互关系得分,所述交互关系得分表征所述两个标识之间的交互程度;
[0020]以所述标识集合中各标识为顶点、所述交互关系得分为顶点之间的边权重,构建标识关联图谱,各所述顶点所表示的标识具有初始的特定类型置信度;
[0021]基于所述初始的特定类型置信度,迭代地根据表示待识别标识的顶点与邻居顶点之间的边权重和所述邻居顶点的特定类型置信度,更新所述顶点所表示的待识别标识对应的特定类型置信度,直至满足迭代停止条件时停止;
[0022]按照迭代停止后获得的特定类型置信度,从所述待识别标识中识别出特定类型标识。
[0023]一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0024]获取标识集合,所述标识集合包括特定类型标识和待识别标识;
[0025]确定所述标识集合中存在交互关系的任意两个标识之间的交互关系得分,所述交互关系得分表征所述两个标识之间的交互程度;
[0026]以所述标识集合中各标识为顶点、所述交互关系得分为顶点之间的边权重,构建标识关联图谱,各所述顶点所表示的标识具有初始的特定类型置信度;
[0027]基于所述初始的特定类型置信度,迭代地根据表示待识别标识的顶点与邻居顶点之间的边权重和所述邻居顶点的特定类型置信度,更新所述顶点所表示的待识别标识对应的特定类型置信度,直至满足迭代停止条件时停止;
[0028]按照迭代停止后获得的特定类型置信度,从所述待识别标识中识别出特定类型标识。
[0029]一种计算机程序,所述计算机程序包括计算机指令,所述计算机指令存储在计算机可读存储介质中,计算机设备的处理器从所述计算机可读存储介质读取所述计算机指令,所述处理器执行所述计算机指令,使得所述计算机设备执行上述标识处理方法的步骤。
[0030]上述标识处理方法、装置、计算机设备和存储介质,获取的标识集合中包括已知的特定类型标识和待识别标识,根据已知特定类型标识与待识别特定类型标识之间的交互关系得分,利用标识表示顶点、标识之间的交互关系得分表示边权重,构建标识关联图谱,继而,基于初始的特定类型置信度以及该标识关联图谱确定与特定类型标识关联的待识别标识的特定类型置信度,能够全面地挖掘出与特定类型标识存在关联的潜在特定类型标识。一方面只需要少量的特定类型标识样本,即可实现从大量的标识中挖掘出潜在特定类型标识,另一方面,根据标识之间的交互关系得分所确定的边权重,能够准确表达出标识之间的交互关系,进一步结合各标识初始的特定类型置信度,进行图传播得出每个待识别标识最终的特定类型置信度,从而挖掘出潜在的特定类型标识,能够提升标识处理的准确率。
附图说明
[0031]图1为一个实施例中标识处理方法的应用环境图;
[0032]图2为一个实施例中标识处理方法的流程示意图;
[0033]图3为一个实施例中影响两个标识之间的交互关系得分的交互特征指标的示意图;
[0034]图4为一个实施例中标识处理方法的流程框架示意图;
[0035]图5为一个实施例中确定待识别标识初始的特定类型置信度的步骤的流程示意图;
[0036]图6为一个实施例中确定待识别标识初始的特定类型置信度的流程示意图;
[0037]图7为一个实施例中构建的标识关联图谱的示意图;
[0038]图8为一个实施例中确定存在交互关系的两个标识之间的交互关系得分的流程示意图;
[0039]图9为一个具体的实施例中标识处理方法的流程示意图;
[0040]图10为一个实施例中根据两个标识之间的标识交互数据与交互特征指标集合,确定交互关系得分的流程示意图;
[0041]图11为一个实施例中标识处理装置的结构框图;
[0042]图12为一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种标识处理方法,其特征在于,所述方法包括:获取标识集合,所述标识集合包括特定类型标识和待识别标识;确定所述标识集合中存在交互关系的任意两个标识之间的交互关系得分,所述交互关系得分表征所述两个标识之间的交互程度;以所述标识集合中各标识为顶点、所述交互关系得分为顶点之间的边权重,构建标识关联图谱,各所述顶点所表示的标识具有初始的特定类型置信度;基于所述初始的特定类型置信度,迭代地根据表示待识别标识的顶点与邻居顶点之间的边权重和所述邻居顶点的特定类型置信度,更新所述顶点所表示的待识别标识对应的特定类型置信度,直至满足迭代停止条件时停止;按照迭代停止后获得的特定类型置信度,从所述待识别标识中识别出特定类型标识。2.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取所述待识别标识的资源转移数据;确定预定的可疑特征指标集合;根据所述资源转移数据与所述可疑特征指标集合,获得所述待识别标识初始的特定类型置信度。3.根据权利要求2所述的方法,其特征在于,所述根据所述资源转移数据与所述可疑特征指标集合,获得所述待识别标识初始的特定类型置信度,包括:遍历所述可疑特征指标集合中的每个可疑特征指标;将所述待识别标识的资源转移数据与遍历的可疑特征指标进行匹配;根据所述待识别标识所匹配的可疑特征指标的数量,确定所述待识别标识初始的特定类型置信度。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:确定所述可疑特征指标集合中可疑特征指标的数量;确定所述标识集合中的特定类型标识;对于每个所述特定类型标识,确定每个所述特定类型标识初始的特定类型置信度为所述数量。5.根据权利要求1所述的方法,其特征在于,所述根据表示待识别标识的顶点与邻居顶点之间的边权重和所述邻居顶点的特定类型置信度,更新所述顶点所表示的待识别标识对应的特定类型置信度,包括:在首次迭代过程中,遍历所述标识关联图谱中表示待识别标识的顶点;确定当前遍历顶点的关联度;确定所述标识关联图谱中所述当前遍历顶点的邻居顶点;根据所述当前遍历顶点的关联度、所述邻居顶点初始的特定类型置信度以及与所述邻居顶点之间的边权重,计算所述当前遍历顶点首次迭代后更新的特定类型置信度。6.根据权利要求1所述的方法,其特征在于,所述确定所述标识集合中存在交互关系的任意两个标识之间的交互关系得分,包括:获取所述标识集合中各标识的属性数据;确定预定的交互特征指标集合;根据各所述标识的属性数据,确定所述标识集合中存在交互关系的任意两个标识之间
的标识交互数据,所述交互关系包括资源关系和社交关系中的至少一种;根据所述任意两个标识之间的标识交互数据与交互特征指标集合,确定所述任意两个标识之间的交互关系得分。7.根据权利要求6所述的方法,其特征在于,所述根据所述任意两个标识之间的标识交互数据与交互特征指标集合,确定所述任意两个标识之间的交互关系得分,包括:确定所述交互特征指标集合中各所述交互特征指标的权重;根据所述两个标识之间的标识交互数据,确定所述两个标识对应各所述交互特征指标对应的得分;按各所述交互特征指标的权重,将所述两个标识对应各所述交互特征指标对应的得分加权求和,得到所述两个标识之间的交互关系得分。8.根据权利要求7所述的方法,其特征在于,所述确定所述交互特征指标集合中各所述交互特征指标的权重,包括:确定所述交互特征指标集合中每个所述交互特征指标的重要度;根据各所述交互特征指标的重要度,计算任意两个交互特征指标对于资源关系的相对重要度,得到第一成对比较矩阵;根据各所述交互特征指标的重要度,计算任意两个交互特征指标对于社交关系的相对重要度,得到第二成对比较矩阵;计算任意两个中间关系对于交互关系的相对重要度,得到第三成对比较矩阵,所述中间关系为所述资源关系或所述社交关系;根据所述第一成对比较矩阵、所述第二成对...

【专利技术属性】
技术研发人员:魏向前
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1