威胁情报分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号：36040818 阅读：22 留言：0更新日期：2022-12-21 10:46

本申请提供一种威胁情报分类方法、装置、电子设备及存储介质。该包括：获取威胁情报文本；利用主题模型对威胁情报文本进行分析，获得主题模型输出的主题语义信息；其中，主题语义信息包括威胁情报文本对应的主题描述和主题词；基于预先构建的威胁情报分类模型分别对威胁情报文本和主题语义信息进行分析，获得威胁情报文本对应的文本上下文语义特征和主题语义信息对应的主题语义特征；基于文本上下文语义特征和主题语义特征获得威胁情报所属的类别。本申请实施例通过融合了主题语义特征和文本上下文语义特征，从而提高了威胁情报分类模型对威胁情报文本进行分类的准确性。模型对威胁情报文本进行分类的准确性。模型对威胁情报文本进行分类的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
威胁情报分类方法、装置、电子设备及存储介质

[0001]本申请涉及网络安全
，具体而言，涉及一种威胁情报分类方法、装置、电子设备及存储介质。

技术介绍

[0002]随着互联网和通讯技术的不断发展，也带来了新的网络安全威胁，安全问题往往都是通过互联网进行传播扩散的。网络攻击的范围也不断的扩大，已经从个人扩散至工业、交通、能源、航天、金融、医疗等各个领域，严重威胁了国家和社会的信息安全。特别是近年来，随着“互联网+”、“智能制造”等新兴业态的快速发展以及物联网概念的提出与实现，网络与信息化以不可阻挡之势渗透到国家生产和生活的方方面面，财产安全、人身安全乃至国家安全的边界已经远远超越地理空间的限制。
[0003]现有的对威胁情报进行分类的方法包括预先获取训练样本，利用训练样本训练获得分类模型，然后利用该分类模型对待分类的威胁情报进行分类。但是，由于同属于威胁情报数据，样本之间差异性较小，利用分类模型对待分类威胁情报进行分类时，容易导致该分类模型区分相似性较高的样本比较困难，从而导致威胁情报的分类准确性较低。

【技术保护点】

【技术特征摘要】
1.一种威胁情报分类方法，其特征在于，包括：获取威胁情报文本；利用主题模型对所述威胁情报文本进行分析，获得所述主题模型输出的主题语义信息；其中，所述主题语义信息包括所述威胁情报文本对应的主题描述和主题词；基于预先构建的威胁情报分类模型分别对所述威胁情报文本和所述主题语义信息进行分析，获得所述威胁情报文本对应的文本上下文语义特征和所述主题语义信息对应的主题语义特征；基于所述文本上下文语义特征和所述主题语义特征获得所述威胁情报所属的类别。2.根据权利要求1所述的方法，其特征在于，所述利用主题模型对所述威胁情报文本进行分析，获得所述主题模型输出的主题语义信息，包括：对所述威胁情报文本进行预处理，获得分词结果；其中，所述预处理包括分词、去除特殊字符和去除停用词；将所述分词结果输入主题模型，获得所述主题模型输出的主题语义信息。3.根据权利要求2所述的方法，其特征在于，所述将所述分词结果输入主题模型，获得所述主题模型输出的主题语义信息，包括：将所述分词结果输入主题模型，获得所述分词结果分别属于各个主题的权重值；将最大权重值的主题对应的主题词作为所述分词结果的主题词；根据最大权重值的主题对应的主题描述和所述分词结果的主题词获得所述主题语义信息。4.根据权利要求1所述的方法，其特征在于，所述威胁情报分类模型包括BERT模型，所述基于预先构建的威胁情报分类模型分别对所述威胁情报文本和所述主题语义信息进行分析，包括：所述BERT模型分别对所述威胁情报文本和所述主题语义信息进行分析。5.根据权利要求1所述的方法，其特征在于，所述威胁情报分类模型包括全连接层；所述基于所述文本上下文语义特征和所述主题语义特征获得所述威胁情报文本所属的类别，包括：将所述文本上下文语义特征和所述主题语义特征进行拼接，获得分类特征；利用所...

【专利技术属性】
技术研发人员：姚剑文，
申请(专利权)人：北京天融信科技有限公司北京天融信软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人