一种多任务情报线索挖掘方法、设备及产品技术

技术编号:41590216 阅读:15 留言:0更新日期:2024-06-07 00:02
本发明专利技术公开一种多任务情报线索挖掘方法、设备及产品,涉及信息技术领域,该方法包括对开源情报文本进行水平分片;对每个任务中的开源情报文本进行预处理;对开源情报文本进行提取关键短语;对初步候选集中的关键短语进行语义扩充;获取原始的开源情报文本对应的词向量及候选集中关键短语对应的词向量,进行余弦相似度算法计算,得到每个关键短语的基础评分;确定候选集中关键短语的热力值;根据基础评分和热力值确定相应关键短语的综合评分;根据综合评分对候选集中的关键短语进行筛选;对最终短语候选集中关键短语进行聚类;对情报文本线索热点进行情感分析、敏感性分析及线索关联。本发明专利技术能够提高情报线索挖掘的准确性及算法的运行效率。

【技术实现步骤摘要】

本专利技术涉及信息,特别是涉及一种多任务情报线索挖掘方法、设备及产品


技术介绍

1、根据情报专家估计,目前西方国家近九成的情报都是来自开源情报。情报的获取已经进入开源情报时代,并以网络情报为主要表现特征。伴随着互联网上大量情报信息的涌入,挖掘情报背后的线索信息、关联信息就变得尤为重要。长期以来,情报信息是以非结构化文本为主要载体进行存储、处理和传递的。作为一种直接面向特定需求、特定用户的信息提供方式,专题领域情报信息可以为情报人员提供更加准确、全面、专业的情报研究资料。

2、目前针对情报线索挖掘传统的人工处理方式作业速度较慢、处理效率较低,而且会消耗大量的人力资源,使相关情报人员陷入低价值的重复劳动当中。而采用人工智能等方式进行情报线索挖掘,往往受限于非结构化的数据格式以及情报种类,导致最终挖掘的数据并不能完全满足需求,从而导致许多新知识、新信息被湮没。

3、因此,亟需提供一种能够提高情报线索挖掘的准确性以及算法的运行效率的情报线索挖掘方法或系统,进而帮助企业为用户提供更高质量的情报线索。


>技术实现思路本文档来自技高网...

【技术保护点】

1.一种多任务情报线索挖掘方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种多任务情报线索挖掘方法,其特征在于,所述获取开源情报文本,并对开源情报文本进行水平分片,切割成不同的任务,具体包括:

3.根据权利要求1所述的一种多任务情报线索挖掘方法,其特征在于,所述对原始的开源情报文本对应的词向量以及候选集中每个关键短语对应的词向量进行余弦相似度算法计算,得到每个关键短语的基础评分,具体包括:

4.根据权利要求1所述的一种多任务情报线索挖掘方法,其特征在于,所述根据热力加权评分规则确定候选集中每个关键短语的热力值,具体包括:

5.一...

【技术特征摘要】

1.一种多任务情报线索挖掘方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种多任务情报线索挖掘方法,其特征在于,所述获取开源情报文本,并对开源情报文本进行水平分片,切割成不同的任务,具体包括:

3.根据权利要求1所述的一种多任务情报线索挖掘方法,其特征在于,所述对原始的开源情报文本对应的词向量以及候选集中每个关键短语对应的词向量进行余弦相似度算法计算,得到每个关键短语的基础评分,具体包括:

4.根据权利要求1所述的一种多任务情报线索挖掘方法,...

【专利技术属性】
技术研发人员:程渤潘日鑫陈俊亮
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1