从公开信息中针对特定目标实体预测其潜在风险的方法技术

技术编号:26419555 阅读:14 留言:0更新日期:2020-11-20 14:15
本发明专利技术公开了一种从公开信息中针对特定目标实体预测其潜在风险的方法,1.定义所关注的目标实体集合T以及实体间的关系类型集合R,定义相关的网上范围;2.对每一个目标实体o,基于实体间的关系和风险经验库进行扩展,得到目标实体o的相关目标集合C;3.对指定负面事件进行搜集和整理,抽取其中的事件要素构成实体集合H;4.基于实体间的关系和风险经验库对H进行扩展,得到集合M;5.计算集合C和集合M的交集,若不为空,则存在从负面事件到目标实体o的路径,即特定目标o存在潜在风险;6.生成从负面事件列表,到目标实体集合中每一个目标的每一条关联路径,基于路径长短、关系类型进行排序,得到与每一个目标最相关的负面事件作为其潜在风险。

【技术实现步骤摘要】
从公开信息中针对特定目标实体预测其潜在风险的方法
本专利技术涉及风险分析和舆情监测
,特别是一种从公开信息中针对特定目标实体预测其潜在风险的方法。
技术介绍
近年来,中国互联网舆论发展迅猛,伴随着传播技术的日新月异,网络舆情事件愈发呈现多发趋势,一件不起眼的小事都很可能会触发“蝴蝶效应”,对相关的人物、机构、地点等产生可能产生巨大的影响。从发展周期来看,舆情事件存在潜伏期、形成期、波动期、消退期等阶段。萌芽时期的潜在风险很容易被人忽视,而一旦进入舆情发酵的“快车道”,就会很快形成铺天盖地之势,令人难以招架。因此需要洞见风险预控和舆情引导的关键点,快速辨别网络舆情的潜在风险。目前对于舆情风险的预测,包括人工搜索和舆情风险分析平台的方式。人工搜索的方式在查找可能存在的风险点很容易产生遗漏,并且难以保证时效性。目前舆情检测平台在进行风险分析时,主要存在以下不足:(1)基于关键词:企业可能有着成千上万的渠道商和终端客户,舆情系统不能把每一个都作为关键词去搜索,然后把不同关键词的结果合并,这会带来信息的爆炸;(2)缺乏特定性:现有的舆情检测平台大多从负面事件出发,采用广度优先的方法,分析负面事件可能影响的对象,而不是针对特定的目标对象分析其可能的风险,因此预测的结果缺乏针对性;(3)分析深度不够:由于现有的舆情风险方法在分析时产生路径爆炸,难以得到较长的影响路径,因此无法进行深度分析。(4)分析结果不够准确:在风险预测中需要经过一定步骤的因果推理和关联分析,例如推理某地的一场大火灾是否影响到某一家企业等,而现有的方法在进行影响扩散时,根据知识图谱或者相似性进行,没有考虑到因果逻辑,因此分析的结果不够准确。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术的不足而提供一种从公开信息中针对特定目标实体预测其潜在风险的方法,本专利技术的潜在分析预警方法能够针对特定目标,通过双向迎面广度优先遍历然后碰撞的上市指定负面事件进行深层次的潜在风险分析,从而有针对性的进行舆情风险预防工作。本专利技术为解决上述技术问题采用以下技术方案:根据本专利技术提出的一种从公开信息中针对特定目标实体预测其潜在风险的方法,包括以下步骤:步骤1、定义所关注的目标实体集合T以及实体间的关系类型集合R,定义与目标实体相关的网上范围;步骤2、对每一个目标实体o∈T,基于实体间的关系和风险经验库进行扩展,得到目标实体o的相关目标集合C;步骤3、对负面事件进行搜集和整理,抽取其中的事件要素构成实体集合H;步骤4、基于实体间的关系和风险经验库对集合H进行扩展,得到集合M;步骤5、计算集合C和集合M的交集,若不为空,则存在从负面事件到目标实体o的路径,即目标实体o存在潜在风险;步骤6、生成从负面事件列表、到目标实体集合中每一个目标实体的每一条关联路径;并基于路径长短、关系类型进行排序,排序排在第一个的作为与每一个目标最相关的负面事件,该负面事件作为其潜在风险。作为本专利技术所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法进一步优化方案,步骤1中,所关注的目标实体是人物、机构、地点;所关注的实体间的关系类型包括人物与人物之间的关系、机构与机构之间的关系、机构与人物之间的关系。作为本专利技术所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法进一步优化方案,步骤2的过程具体是:首先在步骤1中定义的网上范围中获得文本,在文本中根据步骤1所关注的目标实体集合T以及实体间的关系类型集合R进行关系抽取,得到三元组(e1,r1,e2),其中e1∈T,r1∈R,e1为目标实体,r1是关注的某种实体间关系,e2是实体,然后基于风险经验库进行扩展;风险经验库包括风险逻辑规则集合和条件集合,其中风险逻辑规则集合中给出了风险传播时的经验规则;条件集合中给出对关联实体进行限定的方法;对于之前在实体抽取中获得的e2若能满足风险逻辑规则集合和条件集合的约束,则令C=C∪e2,即对C进行了扩展。作为本专利技术所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法进一步优化方案,其中风险逻辑规则集合中给出了风险传播时的经验规则是由一阶逻辑规则组成。作为本专利技术所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法进一步优化方案,其中步骤3中,负面事件的来源是每天的网络热门事件;对负面事件进行搜集,是指基于爬虫技术获取网页的文本信息;对负面事件进行整理,是指负面事件根据严重程度、应用场景进行分类处理。作为本专利技术所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法进一步优化方案,步骤3中,事件要素指事件涉及的人物、机构、地点。作为本专利技术所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法进一步优化方案,步骤4中,基于实体间的关系和风险经验库对集合H中的实体进行扩展的方法与步骤2中的方法相同。作为本专利技术所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法进一步优化方案,步骤6中,生成关联路径的方法是将其中的实体作为路径上的节点,将实体间的关系作为边,生成路径。作为本专利技术所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法进一步优化方案,步骤6中,基于路径长短、关系类型进行排序,是考虑到路径长短、关系类型的权重来进行排序的。本专利技术采用以上技术方案与现有技术相比,具有以下技术效果:本专利技术的潜在分析预警方法能够针对设定的目标,通过双向迎面广度优先遍历然后碰撞的上市指定负面事件进行深层次的潜在风险分析,从而有针对性的进行舆情风险预防工作。附图说明图1为本专利技术的风险分析方法的流程图。图2为本专利技术的分析方法的系统框架图。具体实施方式为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本专利技术进行详细描述。本专利技术涉及潜在风险分析和舆情检测领域的应用,是一种基于风险影响经验库,通过事件抽取、关联分析和因果推理等方法,进行从公开信息中得到每一个目标最相关的负面事件的方法。图1为本专利技术的分析方法的流程图,图2为本专利技术的分析方法的系统框架图;一种从公开信息中针对特定目标实体预测其潜在风险的方法包括:步骤1、定义所关注的目标实体集合T以及实体间的关系类型集合R,定义与目标实体相关的网上范围;步骤2、对每一个目标实体o∈T,基于实体间的关系和风险经验库进行扩展,得到目标实体o的相关目标集合C;步骤3、对负面事件进行搜集和整理,抽取其中的事件要素构成实体集合H;步骤4、基于实体间的关系和风险经验库对集合H进行扩展,得到集合M;步骤5、计算集合C和集合M的交集,若不为空,则存在从负面事件到目标实体o的路径,即目标实体o存在潜在风险;步骤6、生成从负面事件列表、到目标实体集合中每一个目标实体的每一条关联路径;并基于路径长短、关系类型进行排序,排序排在第一个的作为与每一个目标最相关的负面事件,该负面本文档来自技高网
...

【技术保护点】
1.一种从公开信息中针对特定目标实体预测其潜在风险的方法,其特征在于,包括以下步骤:/n步骤1、定义所关注的目标实体集合T以及实体间的关系类型集合R,定义与目标实体相关的网上范围;/n步骤2、对每一个目标实体o∈T,基于实体间的关系和风险经验库进行扩展,得到目标实体o的相关目标集合C;/n步骤3、对负面事件进行搜集和整理,抽取其中的事件要素构成实体集合H;/n步骤4、基于实体间的关系和风险经验库对集合H进行扩展,得到集合M;/n步骤5、计算集合C和集合M的交集,若不为空,则存在从负面事件到目标实体o的路径,即目标实体o存在潜在风险;/n步骤6、生成从负面事件列表、到目标实体集合中每一个目标实体的每一条关联路径;并基于路径长短、关系类型进行排序,排序排在第一个的作为与每一个目标最相关的负面事件,该负面事件作为其潜在风险。/n

【技术特征摘要】
1.一种从公开信息中针对特定目标实体预测其潜在风险的方法,其特征在于,包括以下步骤:
步骤1、定义所关注的目标实体集合T以及实体间的关系类型集合R,定义与目标实体相关的网上范围;
步骤2、对每一个目标实体o∈T,基于实体间的关系和风险经验库进行扩展,得到目标实体o的相关目标集合C;
步骤3、对负面事件进行搜集和整理,抽取其中的事件要素构成实体集合H;
步骤4、基于实体间的关系和风险经验库对集合H进行扩展,得到集合M;
步骤5、计算集合C和集合M的交集,若不为空,则存在从负面事件到目标实体o的路径,即目标实体o存在潜在风险;
步骤6、生成从负面事件列表、到目标实体集合中每一个目标实体的每一条关联路径;并基于路径长短、关系类型进行排序,排序排在第一个的作为与每一个目标最相关的负面事件,该负面事件作为其潜在风险。


2.如权利要求1所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法,其特征在于,步骤1中,所关注的目标实体是人物、机构、地点;所关注的实体间的关系类型包括人物与人物之间的关系、机构与机构之间的关系、机构与人物之间的关系。


3.如权利要求1所述的一种从公开信息中针对特定目标实体预测其潜在风险的方法,其特征在于,步骤2的过程具体是:
首先在步骤1中定义的网上范围中获得文本,在文本中根据步骤1所关注的目标实体集合T以及实体间的关系类型集合R进行关系抽取,得到三元组(e1,r1,e2),其中e1∈T,r1∈R,e1为目标实体,r1是关注的某种实体间关系,e2是实体,然后基于风险经验库进行扩展;风险经验库包括风险逻辑规则集合和条...

【专利技术属性】
技术研发人员:孟涛李佳静于珑雪
申请(专利权)人:南京网感至察信息科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1