【技术实现步骤摘要】
本专利技术涉及计算机,具体而言,涉及一种标签的映射方法、装置及电子设备。
技术介绍
1、目前,在进行网络安全威胁信息的共享和利用时,容易产生数据冗余、数据歧义、数据失效等问题,为此,在整合多个数据来源的分类标签,通常会先构建一个本地标签库,并进行多源标签到本地标签库中的标签的映射,使得多源数据符合内部统一的标准格式。而多源数据可能来自不同的厂商,各个厂商之间可能存在不同的信息格式标准,如表明恶意组织类别的标签apt_greenbug与标签greenbug描述的是同一组织,只是名称格式不同,但其无法通过完全匹配进行映射。导致多源标签到本地标签库的映射失败。其次,除了格式不同,不同的厂商可能采用近义词描述同一件事物,同样不能通过完全匹配进行映射。此类标签失效问题严重地降低了多源标签的利用效率,使得不同厂商之间的标签库情报难以同步,进一步加大了多源情报聚合的难度,不利于得到精准而完善的网络安全威胁信息。
2、相关技术中,可以通过计算标签字符串数据之间的字符重合率,以基于字符重合率,确定这些标签是否相似,从而完成标签映射,但是仅仅依
...【技术保护点】
1.一种标签的映射方法,其特征在于,包括:
2.根据权利要求1所述的映射方法,其特征在于,基于所述第一相似度集合和预训练模型,对所述待映射标签和所述目标标签集合中的标签进行映射,包括:
3.根据权利要求2所述的映射方法,其特征在于,基于所述预训练模型,对所述待映射标签和所述目标标签集合中的标签进行映射,包括:
4.根据权利要求2所述的映射方法,其特征在于,基于所述第一相似度集合中的最高相似度,判断是否能够将所述待映射标签映射到所述目标标签集合中的标签,得到判断结果,包括:
5.根据权利要求1所述的映射方法,其特征在于,计
...【技术特征摘要】
1.一种标签的映射方法,其特征在于,包括:
2.根据权利要求1所述的映射方法,其特征在于,基于所述第一相似度集合和预训练模型,对所述待映射标签和所述目标标签集合中的标签进行映射,包括:
3.根据权利要求2所述的映射方法,其特征在于,基于所述预训练模型,对所述待映射标签和所述目标标签集合中的标签进行映射,包括:
4.根据权利要求2所述的映射方法,其特征在于,基于所述第一相似度集合中的最高相似度,判断是否能够将所述待映射标签映射到所述目标标签集合中的标签,得到判断结果,包括:
5.根据权利要求1所述的映射方法,其特征在于,计算所述待映射标签与目标标签集合中每个标签之间的相似度,得到第一相似度集合,包括:<...
【专利技术属性】
技术研发人员:赵豪杰,蒋涛,张志祥,李飞,陈健,
申请(专利权)人:山石网科通信技术股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。