一种IoC自动抽取与挖掘方法与系统技术方案

技术编号：28871797 阅读：19 留言：0更新日期：2021-06-15 23:04

本发明专利技术公开了一种IoC自动抽取与挖掘方法，涉及计算机网络安全领域，包括词嵌入层、序列表示层、全连接层，序列表示层包括双向LSTM网络、注意力机制和上下文特征，基于该方法，本发明专利技术还公开了IoC自动抽取与挖掘系统，包括文本自动获取模块、非结构化文本预处理模块、攻击指标(IoC)提取模块、IoC数据库和IoC短语匹配库。本发明专利技术针对非结构化文本，利用正则匹配和双向长短期记忆网络的组合算法，结合注意力机制和上下文内容特征，进一步提高了IoC提取的准确率和有效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种IoC自动抽取与挖掘方法与系统
本专利技术涉及计算机网络安全领域，尤其涉及一种IoC(攻击指标,IndicatorofCompromise)自动抽取与挖掘方法与系统。
技术介绍
近年来，随着网络技术的快速发展，网络上的安全威胁也在增加。网络安全专家和分析师们通过积极地在公共平台上交换威胁情报来跟进对这些威胁的研究和防范。威胁情报是基于证据的知识，它是围绕着现存的或者即将对资产发生威胁和危害的信息，包括了上下文、机制、指标、含义或者以行动为中心的建议。这种情报可用于告知受害对象，让他们能够针对这样的威胁和危害进行决策。这些威胁情报大多为描述性文本包涵了关键信息(例如，僵尸网络IP，恶意软件的签名等)。这些信息通过文章、博文或是白皮书的形式呈现出来。更进一步，这些信息能够被转化成结构化信息，即攻击指标(IoC，IndicatorofCompromise),参照OpenIoC(OpenIndicatorofCompromise)标准、STIX(StructuredThreatInformationExpression)标准等。这有利于计算机进行分析，并且基于此快速开发出应对威胁的方案。随着计算机应用领域的不断扩大，自然语言处理受到了人们的高度重视。机器翻译、语音识别以及信息检索等应用需求对计算机的自然语言处理能力提出了越来越高的要求。为了使计算机能够处理自然语言，首先需要对自然语言进行建模。自然语言建模方法经历了从基于规则的方法到基于统计方法的转变。在对统计语言模型进行研究的背景下，Google公司在2...

【技术保护点】
1.一种IoC自动抽取与挖掘方法，其特征在于，包括词嵌入层、序列表示层、全连接层；/n所述词嵌入层将输入词语转换为词向量；/n所述序列表示层为双向LSTM结构；/n所述全连接层对所述词嵌入层和所述序列表示层的输出进行综合，输出表示是否为有效IoC。/n

【技术特征摘要】
1.一种IoC自动抽取与挖掘方法，其特征在于，包括词嵌入层、序列表示层、全连接层；
所述词嵌入层将输入词语转换为词向量；
所述序列表示层为双向LSTM结构；
所述全连接层对所述词嵌入层和所述序列表示层的输出进行综合，输出表示是否为有效IoC。

2.如权利要求1所述的IoC自动抽取与挖掘方法，其特征在于，所述词嵌入层采用Word2Vec中的Skip-Gram算法进行训练。

3.如权利要求1所述的IoC自动抽取与挖掘方法，其特征在于，所述序列表示层还包括注意力机制。

4.如权利要求3所述的IoC自动抽取与挖掘方法，其特征在于，所述序列表示层还包括上下文特征。

5.如权利要求4所述的IoC自动抽取与挖掘方法，其特征在于，所述序列表示层在每个句子输入之前，对所述双向LSTM结构中的隐藏层的权值置零。

6.一种采用如权利要求1-5任一项所述方法的IoC自动抽取与挖掘系统，其特征在于，包括文本自动获取模块、非结构化文本预处...

【专利技术属性】
技术研发人员：邹福泰，
申请(专利权)人：天桐苏州网络科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人