The invention discloses a knowledge map construction method and a threat information recommendation method for human reading threat information recommendation. The invention constructs a knowledge map for recommendation of human read threat information by crawling the human read threat information released by the micro blog security big V as the original data, and then abstracts the entity and entity relationship in the knowledge map into a low-dimensional vector representation E; for each human read threat information I
【技术实现步骤摘要】
一种用于人读威胁情报推荐的知识图谱构建方法及威胁情报推荐方法
本专利技术提出一种用于威胁情报推荐的知识图谱的构建方法和一种基于知识图谱和LSTM的威胁情报推荐方法,涉及了一种结合LDA主题模型的去噪实体抽取方法和一种知识感知的LSTM推荐方法。
技术介绍
威胁情报是一种基于证据的知识,包括了情境、机制、指标、隐含和实际可行的建议。威胁情报描述了现存的、或者是即将出现针对资产的威胁或危险,并可以用于通知主体针对相关威胁或危险采取某种响应。根据阅读威胁情报的对象的不同,威胁情报可以分为机读威胁情报和人读威胁情报。人读威胁情报需要提供更多的上下文、背景信息以及分析结果。例如对于一个活跃APT(高级持续威胁)组织的分析报告就是一份典型的人读威胁情报。随着大数据等技术的发展,威胁情报这一术语应运而生,对网络安全保护系统的发展具有里程碑意义。面对严峻的安全形势,安全专家需要通过及时有效地跟踪和分析网络安全威胁的特征、方法和模式,改变传统的安全防御思想,识别和防御网络安全的新威胁。但是,在线内容和服务的爆炸性增长为用户创造了一个压倒性的选择。推荐系统旨在通过从大量数据中过滤出少量内容来满足其个性化兴趣,从而解决信息爆炸问题。传统的协同过滤方法通过学习相关用户的兴趣来预测长尾用户的兴趣,并在各个领域取得了成功。在实际应用中,用户对项目的个人偏好的用户项矩阵通常非常稀疏,导致基于协同过滤方法的推荐性能显著降低。为了解决这些问题,研究人员提出将辅助信息纳入协同过滤,例如社交网络,用户/项目属性,图像和上下文纳入协同过滤。 ...
【技术保护点】
1.一种用于人读威胁情报推荐的知识图谱构建方法,其步骤包括:/n1)对于专家集V中的每一专家v,爬取专家v发布的人读威胁情报,得到人读威胁情报集I;/n2)对于人读威胁情报集I中的每一条人读威胁情报I
【技术特征摘要】
1.一种用于人读威胁情报推荐的知识图谱构建方法,其步骤包括:
1)对于专家集V中的每一专家v,爬取专家v发布的人读威胁情报,得到人读威胁情报集I;
2)对于人读威胁情报集I中的每一条人读威胁情报Ii,使用LDA主题模型建模选择一主题Topici,并保留该主题Topici中词概率大于设定阈值的主题词,形成主题词集Tw;
3)对于人读威胁情报集I中的各条人读威胁情报,获取其中设定的特殊实体,生成特殊实体集E;
4)将主题词集Tw和特殊实体集E作为知识图谱的实体,将每一条人读威胁情报作为一个知识图谱中的一情报实体,将主题词集Tw中的实体与情报实体的关系设置为isTopic、特殊实体集E中的实体与情报实体的关系设置为isTopic;对于知识图谱中的所有实体,如果两个实体为同一对象的不同称谓,则实体间关系为isEqual;若两个实体之间为包含关系,则实体间关系为isIn;若两个实体在攻击链上存在关系,则关系为isBind;
5)根据上述步骤2)、步骤3)和步骤4)中得到的实体以及实体关系,将实体用实体关系相连,得到用于人读威胁情报推荐的知识图谱。
2.如权利要求1所述的方法,其特征在于,步骤1)中,对爬取的人读威胁情报进行过滤,过滤掉没有点击的人读威胁情报,生成人读威胁情报集I。
3.一种用于人读威胁情报推荐的威胁情报推荐方法,其步骤包括:
1)对于专家集V中的每一专家v,爬取专家v发布的人读威胁情报,得到人读威胁情报集I;获取点击过所述人读威胁情报的微博用户ID,生成用户集U;
2)构造用户-项目交互矩阵A;其中,用户-项目交互矩阵A矩阵中每一行代表一条人读威胁情报,每一列代表一名用户,用户-项目交互矩阵A中的元素aij代表用户j与人读威胁情报i交互情况,aij=1代表用户j关注或点击过人读威胁情报i,aij=0代表用户j未关注或点击过人读威胁情报i,aij为空代表用户j未关注过人读威胁情报i,且对该条人读威胁情报的兴趣未知;
3)对于人读威胁情报集I中的每一条人读威胁情报Ii,使用LDA主题模型建模选择一主题Topici,并保留该主题Topici中词概率大于设定阈值的主题词,形成主题词集Tw;
4)对于人读威胁情报集I中的各条人读威胁情报,获取其中设定的特殊实体,生成特殊实体集E;
5)将主题词集Tw和特殊实体集E作为知识图谱的实体,将每一条人读威胁情报作为一个知识图谱中的一情报实体...
【专利技术属性】
技术研发人员:都鸣,姜政伟,江钧,卢志刚,刘宝旭,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。