经济领域知识图谱事件关系自动抽取的方法和装置制造方法及图纸

技术编号:24169094 阅读:32 留言:0更新日期:2020-05-16 02:22
本申请提供了一种经济领域知识图谱事件关系自动抽取的方法、装置、存储介质和处理器。该方法包括:获取原始数据,原始数据为经济金融领域的数据;根据事件知识图谱基础架构以及原始数据,构建事件知识图谱,事件知识图谱包括主题事件;将主题事件按时间排序;对排序后的主题事件按照预定时间窗口分组为多个事务,至少一个事务包括主题事件;基于事务,采用频繁项集挖掘算法挖掘关联规则;采用机器学习算法确定所挖掘的关联规则的关联关系,关联关系为事件关系。该方法中,通过频繁项集挖掘算法挖掘关联规则,后续采用机器学习算法确定所挖掘的关联规则的关联关系,相比现有技术中的判定方法,该方法可以实现事件关系的快速判定。

【技术实现步骤摘要】
经济领域知识图谱事件关系自动抽取的方法和装置
本申请涉及经济领域,具体而言,涉及一种经济领域知识图谱事件关系自动抽取的方法、装置、存储介质和处理器。
技术介绍
当前知识图谱领域,从应用角度看,静态的实体-关系或实体-属性-值的知识图谱架构,不能满足日益复杂的需求,尤其在经济金融领域。经济金融领域需要及时捕捉外部事件,根据事件之间的因果、順承、反转、条件等关系,进行沙盘推演、事件预警等。现有的静态实体知识图谱模型无法胜任这种要求。事件知识图谱可以建立事件与事件,事件与实体之间复杂的关联关系,并且这种关系以及实体属性、事件属性都可以动态更新和记录。例如,静态实体知识图谱可以回答“美联储降息多少”的问题,事件知识图谱可以回答“美联储降息将会导致什么结果”的问题,显然后者才是真正具有价值的问题。事件知识图谱仍处于发展阶段,在经济领域落地时,仍然需要解决大量技术问题,其中事件与事件之间的关系判定是一个难点问题。事件之间关系的判定可以看作一个分类问题。在整个知识图谱系统中,事件之间的关系种类和个数都是预先设定并且一段时间内相对稳定的,比如順承、转折本文档来自技高网...

【技术保护点】
1.一种经济领域知识图谱事件关系自动抽取的方法,其特征在于,包括:/n获取原始数据,所述原始数据为经济金融领域的数据;/n根据事件知识图谱基础架构以及所述原始数据,构建所述事件知识图谱,所述事件知识图谱包括主题事件;/n将所述主题事件按时间排序;/n对排序后的所述主题事件按照预定时间窗口分组为多个事务,至少一个所述事务包括主题事件;/n基于所述事务,采用频繁项集挖掘算法挖掘关联规则;/n采用机器学习算法确定所挖掘的所述关联规则的关联关系,所述关联关系为事件关系。/n

【技术特征摘要】
1.一种经济领域知识图谱事件关系自动抽取的方法,其特征在于,包括:
获取原始数据,所述原始数据为经济金融领域的数据;
根据事件知识图谱基础架构以及所述原始数据,构建所述事件知识图谱,所述事件知识图谱包括主题事件;
将所述主题事件按时间排序;
对排序后的所述主题事件按照预定时间窗口分组为多个事务,至少一个所述事务包括主题事件;
基于所述事务,采用频繁项集挖掘算法挖掘关联规则;
采用机器学习算法确定所挖掘的所述关联规则的关联关系,所述关联关系为事件关系。


2.根据权利要求1所述的方法,其特征在于,所述主题事件有多个,构建所述事件知识图谱之前,所述方法还包括:
确定元事件、不同的所述主题事件之间的关系、所述主题事件与实体的关系、实体属性以及事件属性;
根据所述元事件、不同的所述主题事件之间的关系、所述主题事件与实体的关系、所述实体属性以及所述事件属性,更新主题事件、所述实体、事件属性值以及实体属性值。


3.根据权利要求1所述的方法,其特征在于,基于所述事务使用频繁项集挖掘算法,挖掘关联规则,包括:
基于所述事务使用频繁项集挖掘算法,确定所述事务的所有频繁项集;
根据所述频繁项集利用频繁项集生成规则,挖掘置信度高的所述关联规则。


4.根据权利要求3所述的方法,其特征在于,所述频繁项集包括第一频繁项集和第二频繁项集,根据所述频繁项集利用频繁项集生成规则,挖掘置信度高的所述关联规则之后,且在采用机器学习算法确定所挖掘的所述关联规则的关联关系,所述关联关系为事件关系之前,所述方法还包括:
确定第一概率和第二概率,所述第一概率为所述第一频繁项集出现的概率,所述第二概率为所述第二频繁项集出现的概率,所述第一频繁项集表示为X,所述第二频繁项集表示为Y;
确定预定规则的置信度,所述预定规则表示为X=>Y;
确定所述预定规则的第一独立性;
确定所述预定规则的第二独立性。


5.根据权利要求4所述的方法,其特征在于,采用机器学习算法确定所挖掘的所述关联规则的关联关系,包括:
将所述第一频繁项集按所述时间排序并组合,确定第一频繁项集集合;
将所述第二频繁项集按所述时间排序并组合,确定第二频繁项集集合;
按照所述预定时间窗口对所述第一频繁项集集合和所述第二频繁项集集合分组,生成所述第一频繁项集集合的多个子集和所述第二频繁项集集合的多个子集;
确定...

【专利技术属性】
技术研发人员:刘粉香贠瑞峰刘彬彬彭翔张炎红陆军
申请(专利权)人:智慧神州北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1