一种网络空间战略情报分类方法、设备及介质技术

技术编号：33201546 阅读：71 留言：0更新日期：2022-04-24 00:39

本发明专利技术公开了一种网络空间战略情报分类方法、设备及介质，其中方法包括以下步骤：对互联网端采集的网络空间战略情报新闻数据进行分类标记；采用结巴分词加上自定义词典完成专有名词及特殊词语的分词；根据分词后的结果，利用word2vec实现词嵌入模型的生成；对分词后的数据生成词向量；采用textCNN和LSTM网络结构进行模型的训练，通过对模型的参数进行调整找出多个分类效果较好模型；将未标记的数据经过分词和转换成词向量后，输入多个分类模型，依次得到每个模型的输出结果；采用少数服从多数的决策得到最终分类结果；最终分类结果及其使用后修改确定的结果，自动地进行增量学习。本发明专利技术可解决网络空间战略情报语料库的缺失。本发明专利技术可解决网络空间战略情报语料库的缺失。本发明专利技术可解决网络空间战略情报语料库的缺失。

全部详细技术资料下载

【技术实现步骤摘要】
一种网络空间战略情报分类方法、设备及介质

[0001]本专利技术涉及数字数据处理
，尤其涉及一种网络空间战略情报分类方法、设备及介质。

技术介绍

[0002]网络空间战略情报分类是对情报内容快速掌握的重要环节，该技术可以对大批量的战略情报新闻进行类别整理，以较高的精度划分新闻类型，提高使用者快速定位新闻类别以获取有效信息，节省人力资源成本。目前主要有以下两种解决方案：
[0003]1)通过建立网络空间战略情报不同类型的词汇表，通过词汇表匹配确定情报类型。采用这种方式可以直观快速的对网络空间战略情报进行分类，但其局限于网络空间领域不同类型的战略情报词汇具有纵横交叉的关系，无法简单的从词汇表分类模式进行类别判断，容易造成误分类。
[0004]2)通过分类模型进行网络空间战略情报分类，该方法首先需要大量的已标记类型数据，从而通过机器学习、深度学习算法判断数据的类型。该方法的局限性包含两个：首先是缺少网络空间战略情报的语料库，没有足够的已标记数据作为训练分类模型的原始支撑；其次是缺少网络空间战略情报数据的分词词...

【技术保护点】

【技术特征摘要】
1.一种网络空间战略情报分类方法，其特征在于，包括：步骤1：对互联网端采集的网络空间战略情报新闻数据进行分类标记；步骤2：采用jieba分词加上自定义词典完成专有名词及特殊词语的分词；步骤3：根据步骤2中分词后的结果，利用word2vec实现词嵌入模型的生成；步骤4：根据步骤3生成的词嵌入模型，对分词后的数据生成词向量；步骤5：根据步骤4生成的词向量，采用textCNN和LSTM网络结构进行模型的训练，通过对模型的参数进行调整找出多个分类效果较好模型；步骤6：将未标记的网络空间战略情报数据经过分词和转换成词向量后，输入步骤5中的多个分类模型，依次得到每个模型的输出结果；步骤7：根据步骤6中的输出结果，采用少数服从多数的决策得到最终分类结果；步骤8：根据步骤7的最终分类结果及其使用后修改确定的结果，自动地进行增量学习。2.根据权利要求1所述的网络空间战略...

【专利技术属性】
技术研发人员：伍荣，郭海，冯中华，操文成，宋焱淼，盘善海，王天宇，裴华，
申请(专利权)人：中国电子科技集团公司第三十研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人