【技术实现步骤摘要】
一种网络信息安全监测预警方法
[0001]本申请涉及信息安全、网络监测及电子数据取证
,尤其是涉及一种网络信息安全监测预警方法。
技术介绍
[0002]暗网网站是活跃在暗网空间中的一类网站的统称,这类网站无法通过常规浏览器直接搜索访问,需使用特定的软件和服务来配置访问通道。暗网由于其具备的层层加密、无法溯源的特性,虽然在保护用户的隐私方面性能强大,但其开发的隐藏服务网站非常容易滋生以网络为勾联工具的各类违法犯罪。在暗网网站强匿名的前提下,如何有效地进行暗网内容分析并从中获取侦查线索便成了暗网研究的关键。针对暗网内容提取分析技术,国内外的很多学者都开展了深入研究。
[0003]当前的暗网分析研究内容中,大多基于分类、敏感词等对暗网中的敏感事件进行发现或进行暗网的学术性研究,并未考虑到暗网中由于其匿名、人人都可发布、刻意伪装等特性导致在暗网中大量包含虚假信息这一重要特点,而且在暗网中的敏感事件众多,如果不对消息的真实性进行评估和对重要性进行分析,则会导致大量警力资源浪费在虚假信息的侦查上。
技术实现思路
[0004]有鉴于此,本申请的目的在于提供一种网络信息安全监测预警方法,对暗网中网络信息安全,例如,侵犯公民个人信息内容的真实性和重要性进行评估,筛选出真实有效的数据,侦查人员可根据实际情况设定预警分数阈值,确定侦查范围和侦查线索,极大提高了暗网数据分析的实战应用价值;可实现对暗网中侵犯公民个人信息犯罪的无监督监测预警,可以很大程度地节约警力、避免警力浪费在对于不必要信息的检索和侦查;还可实 ...
【技术保护点】
【技术特征摘要】
1.一种网络信息安全监测预警方法,其特征在于,包括:在目标站点中获取待监测类别的网络信息,其中,所述目标站点为暗网中文商城和暗网论坛;在所述待监测类别的网络信息中提取所述网络信息的文本数据,对所述文本数据进行分词和整合处理;基于RoFormer
‑
Sim模型将整合处理后的文本数据生成文本向量,所述文本向量包含文本数据的语义内容;根据所述文本向量对所述暗网中文商城内与所述语义内容相同和/或相似的商品信息进行聚类分析,得到所述待监测类别的网络信息的聚类中心;基于所述聚类中心在所述暗网论坛中的文本数据进行相似度计算,得到文本相似度值;根据所述聚类中心和所述文本相似度值对所述待监测类别的网络信息的安全状况完成评分。2.根据权利要求1所述的网络信息安全监测预警方法,其特征在于,所述方法,还包括:在所述暗网中文商城中获取所述待监测类别的网络信息的交易数据;基于所述交易数据、所述聚类中心和所述文本相似度值对所述待监测类别的网络信息的安全状况完成评分。3.根据权利要求1所述的网络信息安全监测预警方法,其特征在于,所述在目标站点中获取待监测类别的网络信息的步骤,包括:通过Scrapy爬虫框架和Selenium框架对所述目标站点进行捕获、整理,得到所述待监测类别的网络信息。4.根据权利要求1所述的网络信息安全监测预警方法,其特征在于,所述在待监测类别的网络信息中提取所述网络信息的文本数据,对所述文本数据进行分词和整合处理的步骤,包括:在所述待监测类别的网络信息中提取所述网络信息的文本数据;对所述文本数据使用分词工具进行分词;将分词后的文本数据按照预设停用词表去除停用词,所述预设停用词表为结合开源停用词表构建的暗网中文停用词表;将去除停用词后的文本数据整合成句;将完成整合的句连接预设标题,完成对所述文本数据进行分词和整合处理,所述预设标题对应所述待监测类别的网络信息。5.根据权利要求4所述的网络信息安全监测预警方法,其特征在于,所述根据文本向量对所述暗网中文商城内与所述语义内容相同和/或相似的商品信息进行聚类分...
【专利技术属性】
技术研发人员:汤艳君,刘丛睿,王子祎,明泰龙,
申请(专利权)人:中国刑事警察学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。