计算机执行的事件风险评估的方法及装置制造方法及图纸

技术编号:21605669 阅读:18 留言:0更新日期:2019-07-13 18:16
本说明书实施例提供一种计算机执行的事件风险评估方法和装置。在上述方法中,首先采用自然语言处理模型,从内容文本库中提取多个样本事件,其中包括,识别第一样本事件及其对应的事件类型,并根据该事件类型,提取第一样本事件的第一事件要素;然后,在与第一样本事件相关联的知识图谱中,获取与所述第一事件要素相关联的第一关联要素;接着,根据所述事件类型,第一事件要素,以及第一关联要素,确定出第一样本事件的事件特征。基于多个样本事件中各个样本事件的事件特征,以及各个样本事件的标定风险值,可以训练得到GBDT模型。于是,可以利用该训练的GBDT模型,对待分析的第二事件的风险值进行评估,还可以对评估的风险值进行特征解释。

The Method and Device of Event Risk Assessment for Computer Execution

【技术实现步骤摘要】
计算机执行的事件风险评估的方法及装置
本说明书一个或多个实施例涉及机器学习领域,尤其涉及利用机器学习对事件风险进行评估的方法和装置。
技术介绍
随着计算机技术的发展,机器学习已经应用到各种各样的
,用于分析、预测各种业务数据。在许多应用场景中,需要对各种业务事件进行分析和预测,特别是预测各类事件的风险度,例如舆情风险度,安全风险度等,以便于提前预警,辅助相关业务人员进行业务准备。因此,希望提供改进的方案,能够有效地对事件风险度进行评估。
技术实现思路
本说明书一个或多个实施例描述了计算机执行的事件风险评估方法和装置,通过扩展事件的要素而构建事件特征,并训练GBDT模型,实现事件风险度的有效评估,并可以对评估的风险值提供相应的特征解释。根据第一方面,提供了一种计算机执行的事件风险评估方法,包括:采用自然语言处理模型,从内容文本库中提取多个样本事件,所述多个样本事件包括第一样本事件,所述提取多个样本事件包括,识别第一样本事件及其对应的第一事件类型,并根据第一事件类型,提取所述第一样本事件的至少一个第一事件要素;在与所述第一样本事件相关联的至少一个领域所对应的至少一个知识图谱中,获取与所述至少一个第一事件要素相关联的至少一个第一关联要素;根据所述第一事件类型,所述至少一个第一事件要素,以及所述至少一个第一关联要素,确定所述第一样本事件的事件特征;根据所述多个样本事件中各个样本事件的事件特征,以及各个样本事件的标定风险值,训练梯度提升决策树GBDT模型,得到训练的GBDT模型;利用所述训练的GBDT模型,对待分析的第二事件进行风险评估。在一个实施例中,通过以下方式提取第一样本事件的至少一个事件要素:确定所述第一事件类型对应的第一模板;利用所述第一模板,从所述内容文本库中提取所述第一样本事件的至少一个第一事件要素。在一个实施例中,至少一个第一事件要素包括以下中的至少一个:事件时间、事件地点、实施主体、事件客体、事实类型、事件等级。根据一种实施方式,通过以下方式获取关联要素:将所述至少一个第一事件要素映射为所述至少一个知识图谱中的第一节点;将所述至少一个知识图谱中与所述第一节点直接连接的节点作为所述至少一个关联要素。在一个实施例中,上述知识图谱可以包括:企业知识图谱,产品知识图谱,人物知识图谱,信息知识图谱,股票知识图谱,基金知识图谱,机构知识图谱。根据一种实施方式,在训练GBDT模型之后,对待分析的第二事件进行风险评估具体包括:获取第二事件的事件类型,以及至少一个第二事件要素;在所述至少一个知识图谱中,获取与所述至少一个第二事件要素相关联的至少一个第二关联要素;根据所述第二事件的事件类型,所述至少一个第二事件要素,以及所述至少一个第二关联要素,确定所述第二事件的事件特征;将所述第二事件的事件特征输入所述训练的GBDT模型,根据模型输出确定所述第二事件的风险值。进一步的,在一个实施例中,通过以下方式获取第二事件要素:从输入文本中识别出所述第二事件以及第二事件类型;根据第二事件类型,从所述输入文本中提取所述至少一个第二事件要素。或者,可以直接接收输入的第二事件,以及所述至少一个第二事件要素。在一个实施例中,训练的GBDT模型包括至少一棵决策树,所述决策树包括枝干节点和叶子节点,每个枝干节点对应一项特征,并具有训练得到的风险分值以及节点权重,其中节点权重基于该枝干节点以及分裂后节点各自的节点损失值确定,所述节点损失值基于落入该节点的样本事件的标定风险值与该节点的风险分值之差而确定。在这样的情况下,对待分析的第二事件进行风险评估还包括:根据所述第二事件的事件特征确定所述第二事件在所述决策树中的决策路径;确定所述决策路径所经过的各个枝干节点,并获取各个枝干节点对应的特征以及节点权重;对于所述第二事件的事件特征中包含的第一特征,根据所述各个枝干节点中对应于该第一特征的至少一个枝干节点的节点权重,确定该第一特征的特征权重,作为该第一特征对于所述风险值的重要性。根据另一种实施方式,训练得到的GBDT模型包括至少一棵决策树,所述决策树包括枝干节点和叶子节点;在得到这样的GBDT模型后,对待分析的第二事件进行风险评估具体包括:获取第二事件的至少一个第二事件要素;根据所述至少一个第二事件要素在所述决策树中对第二事件进行划分,基于划分的停止节点确定所述决策树的子树;确定所述子树中满足预定条件的第一叶子节点,以及从根节点到该第一叶子节点的条件路径;获取所述条件路径中包含的枝干节点所对应的特征组合,将所述特征组合作为所述第二事件在所述预定条件下的影响特征。进一步的,在一个实施例中,决策树中每个叶子节点通过训练得到有风险分值,每个枝干节点对应一项特征,并具有训练得到的风险分值以及节点权重,其中节点权重基于该枝干节点以及分裂后节点各自的节点损失值确定,所述节点损失值基于落入该节点的样本事件的标定风险值与该节点的风险分值之差而确定;相应的,在一个实施例中,对待分析的第二事件进行风险评估还包括以下中的一项或多项:确定所述第一叶子节点对应的第一风险分值,作为所述预定条件下第二事件的风险值;根据所述条件路径中各个枝干节点的节点权重,确定所述特征组合中与所述各个枝干节点对应的各项特征的重要度。根据第二方面,提供一种计算机执行的事件风险评估装置,包括:提取单元,配置为采用自然语言处理模型,从内容文本库中提取多个样本事件,所述多个样本事件包括第一样本事件,所述提取多个样本事件包括,识别第一样本事件及其对应的第一事件类型,并根据第一事件类型,提取所述第一样本事件的至少一个第一事件要素;关联单元,配置为在与所述第一样本事件相关联的至少一个领域所对应的至少一个知识图谱中,获取与所述至少一个第一事件要素相关联的至少一个第一关联要素;特征确定单元,配置为根据所述第一事件类型,所述至少一个第一事件要素,以及所述至少一个第一关联要素,确定所述第一样本事件的事件特征;训练单元,配置为根据所述多个样本事件中各个样本事件的事件特征,以及各个样本事件的标定风险值,训练梯度提升决策树GBDT模型,得到训练的GBDT模型;评估单元,配置为利用所述训练的GBDT模型,对待分析的第二事件进行风险评估。根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。根据本说明书实施例提供的方法和装置,通过在相关领域的知识图谱中对事件要素进行扩展,构建更为全面的事件特征。基于样本事件的事件特征和标定风险值,可以训练得到包含决策树的GBDT模型。利用这样的GBDT模型,不仅可以对未知风险的待评估事件进行风险值的评估,还可以对风险值进行特征解释,如此,在实现定量预测的同时,还可以使得预测结果具有更强的逻辑表达和可解释性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1为本说明本文档来自技高网...

【技术保护点】
1.一种计算机执行的事件风险评估方法,包括:采用自然语言处理模型,从内容文本库中提取多个样本事件,所述多个样本事件包括第一样本事件,所述提取多个样本事件包括,识别第一样本事件及其对应的第一事件类型,并根据第一事件类型,提取所述第一样本事件的至少一个第一事件要素;在与所述第一样本事件相关联的至少一个领域所对应的至少一个知识图谱中,获取与所述至少一个第一事件要素相关联的至少一个第一关联要素;根据所述第一事件类型,所述至少一个第一事件要素,以及所述至少一个第一关联要素,确定所述第一样本事件的事件特征;根据所述多个样本事件中各个样本事件的事件特征,以及各个样本事件的标定风险值,训练梯度提升决策树GBDT模型,得到训练的GBDT模型;利用所述训练的GBDT模型,对待分析的第二事件进行风险评估。

【技术特征摘要】
1.一种计算机执行的事件风险评估方法,包括:采用自然语言处理模型,从内容文本库中提取多个样本事件,所述多个样本事件包括第一样本事件,所述提取多个样本事件包括,识别第一样本事件及其对应的第一事件类型,并根据第一事件类型,提取所述第一样本事件的至少一个第一事件要素;在与所述第一样本事件相关联的至少一个领域所对应的至少一个知识图谱中,获取与所述至少一个第一事件要素相关联的至少一个第一关联要素;根据所述第一事件类型,所述至少一个第一事件要素,以及所述至少一个第一关联要素,确定所述第一样本事件的事件特征;根据所述多个样本事件中各个样本事件的事件特征,以及各个样本事件的标定风险值,训练梯度提升决策树GBDT模型,得到训练的GBDT模型;利用所述训练的GBDT模型,对待分析的第二事件进行风险评估。2.根据权利要求1所述的方法,其中,所述根据第一事件类型,提取所述第一样本事件的至少一个第一事件要素,包括:确定所述第一事件类型对应的第一模板;利用所述第一模板,从所述内容文本库中提取所述第一样本事件的至少一个第一事件要素。3.根据权利要求1或2所述的方法,其中,所述至少一个第一事件要素包括以下中的至少一个:事件时间、事件地点、实施主体、事件客体、事实类型、事件等级。4.根据权利要求1所述的方法,其中,获取与所述至少一个事件要素相关联的至少一个关联要素,包括:将所述至少一个第一事件要素映射为所述至少一个知识图谱中的第一节点;将所述至少一个知识图谱中与所述第一节点直接连接的节点作为所述至少一个第一关联要素。5.根据权利要求1或4所述的方法,其中,所述至少一个知识图谱包括,企业知识图谱,产品知识图谱,人物知识图谱,信息知识图谱,股票知识图谱,基金知识图谱,机构知识图谱。6.根据权利要求1所述的方法,其中,利用所述训练的GBDT模型,对待分析的第二事件进行风险评估,包括:获取第二事件的事件类型,以及至少一个第二事件要素;在所述至少一个知识图谱中,获取与所述至少一个第二事件要素相关联的至少一个第二关联要素;根据所述第二事件的事件类型,所述至少一个第二事件要素,以及所述至少一个第二关联要素,确定所述第二事件的事件特征;将所述第二事件的事件特征输入所述训练的GBDT模型,根据模型输出确定所述第二事件的风险值。7.根据权利要求6所述的方法,其中,获取第二事件的事件类型,以及至少一个第二事件要素,包括:从输入文本中识别出所述第二事件以及第二事件类型;根据第二事件类型,从所述输入文本中提取所述至少一个第二事件要素。8.根据权利要求6所述的方法,其中,获取第二事件的事件类型,以及至少一个第二事件要素,包括:接收输入的第二事件,以及所述至少一个第二事件要素。9.根据权利要求6所述的方法,其中,所述训练的GBDT模型包括至少一棵决策树,所述决策树包括枝干节点和叶子节点,每个枝干节点对应一项特征,并具有训练得到的风险分值以及节点权重,其中节点权重基于该枝干节点以及分裂后节点各自的节点损失值确定,所述节点损失值基于落入该节点的样本事件的标定风险值与该节点的风险分值之差而确定;所述利用所述训练的GBDT模型,对待分析的第二事件进行风险评估,还包括:根据所述第二事件的事件特征确定所述第二事件在所述决策树中的决策路径;确定所述决策路径所经过的各个枝干节点,并获取各个枝干节点对应的特征以及节点权重;对于所述第二事件的事件特征中包含的第一特征,根据所述各个枝干节点中对应于该第一特征的至少一个枝干节点的节点权重,确定该第一特征的特征权重,作为该第一特征对于所述风险值的重要性。10.根据权利要求1所述的方法,其中,所述训练的GBDT模型包括至少一棵决策树,所述决策树包括枝干节点和叶子节点;所述利用所述训练的GBDT模型,对待分析的第二事件进行风险评估,包括:获取第二事件的至少一个第二事件要素;根据所述至少一个第二事件要素,在所述决策树中对第二事件进行划分,基于划分的停止节点确定所述决策树的子树;确定所述子树中满足预定条件的第一叶子节点,以及从根节点到该第一叶子节点的条件路径;获取所述条件路径中包含的枝干节点所对应的特征组合,将所述特征组合作为所述第二事件在所述预定条件下的影响特征。11.根据权利要求10所述的方法,其中,所述决策树中每个叶子节点具有训练得到的风险分值,每个枝干节点对应一项特征,并具有训练得到的风险分值以及节点权重,其中节点权重基于该枝干节点以及分裂后节点各自的节点损失值确定,所述节点损失值基于落入该节点的样本事件的标定风险值与该节点的风险分值之差而确定;所述利用所述训练的GBDT模型,对待分析的第二事件进行风险评估,还包括以下中的一项或多项:确定所述第一叶子节点对应的第一风险分值,作为所述预定条件下第二事件的风险值;根据所述条件路径中各个枝干节点的节点权重,确定所述特征组合中与所述各个枝干节点对应的各项特征的重要度。12.一种计算机执行的事件风险评估装置,包括:提取单元,配置为采用自然语言处理模型,从内容文本库中提取多个样本事件,所述多个样本事件包括第一样本事件,所述提取多个...

【专利技术属性】
技术研发人员:李彬张可尊
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1