围绕特定目标的情报信息获取方法技术

技术编号:26419557 阅读:21 留言:0更新日期:2020-11-20 14:15
本发明专利技术公开了一种围绕特定目标的情报信息获取方法,只需要用户设定所关注的目标实体和初始的种子关系,就可以利用搜索引擎或已有的索引数据,自动对实体关系和目标实体进行扩展,对与目标实体相关联的情报进行收集;然后按照时鲜度、与所关注的目标实体的相关性、路径长度等因素综合进行排序,以抓取情报信息,构建情报集合,并确定目标实体的关系网络,从而获取目标实体关联的各类情报,对情报进行整理和展示,其可以将大量的、未知质量的、低关联性、低价值的信息转换为少量的、易于理解的、高关联性的、高价值的可视化和可操作的情报,以提高获取所需情况的完整性、准确性和高效性,进而为分析调查和决策工作提供帮助。

【技术实现步骤摘要】
围绕特定目标的情报信息获取方法
本专利技术涉及情报分析
,尤其涉及一种围绕特定目标的情报信息获取方法。
技术介绍
情报作为知识经济时代企业保持竞争优势的战略资源和分析与预测行业发展态势、制定科学战略决策的依据,是被公认的除资本、技术、人才之外的企业“第四核心竞争力”。目前大部分信息资源都以网络为载体,从形式到内容都发生了形态升级。数字化的资源在所有信息资源中所占的比重越来越大。数据化的信息资源具有数量庞大、格式繁杂、更新速度快、时效性较强等特点。传统的情报分析方法主要采取人工方式进行,难以在虚拟信息与数据环境空间环境下,快速提取出有用信息并对其进行有效地利用。尤其在情报之间具有复杂的关联关系时,人工分析的方法在效率和准确度上都无法满足目前情报分析的需求。
技术实现思路
针对以上问题,本专利技术提出一种围绕特定目标的情报信息获取方法。为实现本专利技术的目的,提供一种人脉路径生成方法,包括如下步骤:S12,设定所关注的目标实体,以及所述目标实体的种子关系,并设定所述目标实体关联的目标网络资源;S13,将所述目标实体加入到目标集合中,将所述目标实体的种子关系加入关系集合中;S14,采用设定搜索策略对目标集合中的目标实体沿着种子关系进行扩展,得到扩展关系集合;S15,识别所述扩展关系集合中的关系主体,在所述目标网络资源中获取各个关系主体的相关网页集合;S16,从所述相关网页集合中抽取实体和实体关系,根据抽取得到的实体和实体关系分别对所述目标集合及所述关系集合进行扩展,以更新所述目标集合及所述关系集合;S17,针对更新后的目标集合及关系集合,循环执行步骤S14至步骤S16,直至更新后的目标集合及关系集合均达到设定分析要求;S18,根据更新后的目标集合及关系集合抓取所述目标集合的各个情报信息,根据各个情报信息构建情报集合。在一个实施例中,围绕特定目标的情报信息获取方法,其特征在于,还包括:根据更新后的目标集合及关系集合抽取所述目标实体的关系网络。在一个实施例中,所述设定搜索策略包括深度优先策略,广度优先策略,或者可信度优先策略。在一个实施例中,所述根据各个情报信息构建情报集合包括:按照各个情报信息所关联网页的时鲜度、与所述目标实体的相关性或者路径长度进行排序,根据排序结果构建所述目标实体的情报集合。在一个实施例中,所述目标实体包括具有可描述意义的单词或短语,在特定领域内具有特定含义的内容,和/或,特定领域的专有词汇;所述目标实体之间具有属性关系、因果关系、时序关系、反转关系、条件关系和/或上下级事件关系。在一个实施例中,所述种子关系包括由相应领域情报专家给出的与目标实体关联的实体关系,以用于对相应算法进行初始化。在一个实施例中,在步骤S12之前,还包括:S11,进行情报语料收集,以构建语料库;所述从所述相关网页集合中抽取实体和实体关系包括:基于所述语料库,采用设定规则模板和机器学习的方法抽取相关网页集合中的实体和实体关系。具体地,所述根据抽取得到的实体和实体关系分别对所述目标集合及所述关系集合进行扩展包括:根据所抽取实体所关联网页的时鲜度或者与目标实体的关系强度,对抽取得到的实体和实体关系进行排序选择,根据排序选择的结果对所述目标集合及所述关系集合进行扩展。在一个实施例中,所述设定分析要求包括情报数量、搜索深度或者分析粒度。上述围绕特定目标的情报信息获取方法,只需要用户设定所关注的目标实体和初始的种子关系,就可以利用搜索引擎或已有的索引数据,自动对实体关系和目标实体进行扩展,对与目标实体相关联的情报进行收集;然后按照时鲜度、与所关注的目标实体的相关性、路径长度等因素综合进行排序,以抓取情报信息,构建情报集合,并确定目标实体的关系网络,从而获取目标实体关联的各类情报,对情报进行整理和展示,其可以将大量的、未知质量的、低关联性、低价值的信息转换为少量的、易于理解的、高关联性的、高价值的可视化和可操作的情报,以提高获取所需情况的完整性、准确性和高效性,进而为分析调查和决策工作提供帮助。附图说明图1是一个实施例的围绕特定目标的情报信息获取方法流程图;图2是另一个实施例的围绕特定目标的情报信息获取方法流程图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。在一个实施例中,参考图1所示,图1为本实施例的围绕特定目标的情报信息获取方法流程图,包括如下步骤:S12,设定所关注的目标实体,以及所述目标实体的种子关系,并设定所述目标实体关联的目标网络资源。上述步骤中,用户可以根据自身需要获取的情报(情报信息)对应的实体设定目标实体,以及目标实体的种子关系。上述目标网络资源可以包括网上范围,用户还可以设定目标实体关联的各类网页(网上范围)以及目标实体相关的主题类型,以设定目标实体关联的目标网络资源。上述网上范围指从哪些网络资源中获取,比如新浪新闻网页,新浪微博,或者是一些论坛等;主题类型指关注的主题,例如关注目标是某知名人物张三,主题是出席会议或者参加什么活动等等。S13,将所述目标实体加入到目标集合中,将所述目标实体的种子关系加入关系集合中。在一个实施例中,所述目标实体包括具有可描述意义的单词或短语,在特定领域内具有特定含义的内容,和/或,特定领域的专有词汇;所述目标实体之间具有属性关系、因果关系、时序关系、反转关系、条件关系和/或上下级事件关系。本实施例所关注的目标实体是指具有可描述意义的单词或短语,可以是人名、地名、组织机构名、产品名,或者在某个领域内具有一定含义的内容,比如医学领域内疾病、药物、生物体名称,或者该领域涉及到的专有词汇等。目标实体之间的关系(如实体关系)包括但不限于:属性关系、因果关系、时序关系、反转关系、条件关系和上下级事件关系等。在一个实施例中,所述种子关系包括由相应领域情报专家给出的与目标实体关联的实体关系,以用于对相应算法进行初始化。例如当目标实体为某个企业时,种子关系可以为“董事长”。目标实体的相关网页集合或索引数据是用来定义利用种子关系进行扩展时,进行搜索的范围和数据基础。S14,采用设定搜索策略对目标集合中的目标实体沿着种子关系进行扩展,得到扩展关系集合。在一个实施例中,所述设定搜索策略包括深度优先策略,广度优先策略,或者可信度优先策略。本实施例中,对目标集合中的目标实体沿着种本文档来自技高网...

【技术保护点】
1.一种围绕特定目标的情报信息获取方法,其特征在于,包括如下步骤:/nS12,设定所关注的目标实体,以及所述目标实体的种子关系,并设定所述目标实体关联的目标网络资源;/nS13,将所述目标实体加入到目标集合中,将所述目标实体的种子关系加入关系集合中;/nS14,采用设定搜索策略对目标集合中的目标实体沿着种子关系进行扩展,得到扩展关系集合;/nS15,识别所述扩展关系集合中的关系主体,在所述目标网络资源中获取各个关系主体的相关网页集合;/nS16,从所述相关网页集合中抽取实体和实体关系,根据抽取得到的实体和实体关系分别对所述目标集合及所述关系集合进行扩展,以更新所述目标集合及所述关系集合;/nS17,针对更新后的目标集合及关系集合,循环执行步骤S14至步骤S16,直至更新后的目标集合及关系集合均达到设定分析要求;/nS18,根据更新后的目标集合及关系集合抓取所述目标集合的各个情报信息,根据各个情报信息构建情报集合。/n

【技术特征摘要】
1.一种围绕特定目标的情报信息获取方法,其特征在于,包括如下步骤:
S12,设定所关注的目标实体,以及所述目标实体的种子关系,并设定所述目标实体关联的目标网络资源;
S13,将所述目标实体加入到目标集合中,将所述目标实体的种子关系加入关系集合中;
S14,采用设定搜索策略对目标集合中的目标实体沿着种子关系进行扩展,得到扩展关系集合;
S15,识别所述扩展关系集合中的关系主体,在所述目标网络资源中获取各个关系主体的相关网页集合;
S16,从所述相关网页集合中抽取实体和实体关系,根据抽取得到的实体和实体关系分别对所述目标集合及所述关系集合进行扩展,以更新所述目标集合及所述关系集合;
S17,针对更新后的目标集合及关系集合,循环执行步骤S14至步骤S16,直至更新后的目标集合及关系集合均达到设定分析要求;
S18,根据更新后的目标集合及关系集合抓取所述目标集合的各个情报信息,根据各个情报信息构建情报集合。


2.根据权利要求1所述的围绕特定目标的情报信息获取方法,其特征在于,还包括:
根据更新后的目标集合及关系集合抽取所述目标实体的关系网络。


3.根据权利要求1所述的围绕特定目标的情报信息获取方法,其特征在于,所述设定搜索策略包括深度优先策略,广度优先策略,或者可信度优先策略。


4.根据权利要求1所述的围绕特定目标的情报信息获取方法,其特征在于,根据各个情报信息构建情报集合包括:
按照各个情报信息所关联网页的时鲜度、与...

【专利技术属性】
技术研发人员:孟涛李佳静于珑雪
申请(专利权)人:南京网感至察信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1