标签的映射方法、装置及电子设备制造方法及图纸

技术编号:42336721 阅读:21 留言:0更新日期:2024-08-14 16:12
本发明专利技术公开了一种标签的映射方法、装置及电子设备。涉及计算机技术领域。其中,该方法包括:获取目标对象的待映射标签,其中,待映射标签包括:目标对象在至少一个数据源中的标签;计算待映射标签与目标标签集合中每个标签之间的相似度,得到第一相似度集合;基于第一相似度集合和预训练模型,对待映射标签和目标标签集合中的标签进行映射,其中,预训练模型用于将指定标签转换为表示该指定标签的语义的向量。本发明专利技术解决了相关技术中依据标签的字符之间的重合率,将其他数据源的标签映射到本地,映射效果不佳的技术问题。

【技术实现步骤摘要】

本专利技术涉及计算机,具体而言,涉及一种标签的映射方法、装置及电子设备


技术介绍

1、目前,在进行网络安全威胁信息的共享和利用时,容易产生数据冗余、数据歧义、数据失效等问题,为此,在整合多个数据来源的分类标签,通常会先构建一个本地标签库,并进行多源标签到本地标签库中的标签的映射,使得多源数据符合内部统一的标准格式。而多源数据可能来自不同的厂商,各个厂商之间可能存在不同的信息格式标准,如表明恶意组织类别的标签apt_greenbug与标签greenbug描述的是同一组织,只是名称格式不同,但其无法通过完全匹配进行映射。导致多源标签到本地标签库的映射失败。其次,除了格式不同,不同的厂商可能采用近义词描述同一件事物,同样不能通过完全匹配进行映射。此类标签失效问题严重地降低了多源标签的利用效率,使得不同厂商之间的标签库情报难以同步,进一步加大了多源情报聚合的难度,不利于得到精准而完善的网络安全威胁信息。

2、相关技术中,可以通过计算标签字符串数据之间的字符重合率,以基于字符重合率,确定这些标签是否相似,从而完成标签映射,但是仅仅依据字符重合率进行映射本文档来自技高网...

【技术保护点】

1.一种标签的映射方法,其特征在于,包括:

2.根据权利要求1所述的映射方法,其特征在于,基于所述第一相似度集合和预训练模型,对所述待映射标签和所述目标标签集合中的标签进行映射,包括:

3.根据权利要求2所述的映射方法,其特征在于,基于所述预训练模型,对所述待映射标签和所述目标标签集合中的标签进行映射,包括:

4.根据权利要求2所述的映射方法,其特征在于,基于所述第一相似度集合中的最高相似度,判断是否能够将所述待映射标签映射到所述目标标签集合中的标签,得到判断结果,包括:

5.根据权利要求1所述的映射方法,其特征在于,计算所述待映射标签与目...

【技术特征摘要】

1.一种标签的映射方法,其特征在于,包括:

2.根据权利要求1所述的映射方法,其特征在于,基于所述第一相似度集合和预训练模型,对所述待映射标签和所述目标标签集合中的标签进行映射,包括:

3.根据权利要求2所述的映射方法,其特征在于,基于所述预训练模型,对所述待映射标签和所述目标标签集合中的标签进行映射,包括:

4.根据权利要求2所述的映射方法,其特征在于,基于所述第一相似度集合中的最高相似度,判断是否能够将所述待映射标签映射到所述目标标签集合中的标签,得到判断结果,包括:

5.根据权利要求1所述的映射方法,其特征在于,计算所述待映射标签与目标标签集合中每个标签之间的相似度,得到第一相似度集合,包括:<...

【专利技术属性】
技术研发人员:赵豪杰蒋涛张志祥李飞陈健
申请(专利权)人:山石网科通信技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1