基于知识图谱的信息处理方法、装置、设备及存储介质制造方法及图纸

技术编号:28212556 阅读:18 留言:0更新日期:2021-04-24 14:50
本说明书实施例提供了一种基于知识图谱的信息处理方法、装置、设备及存储介质,该方法包括:基于指定数据形成命名实体属性表和命名实体关系表;指定数据包括非结构化数据;根据命名实体属性表和命名实体关系表构建命名实体关系图谱;对命名实体关系图谱进行图表示学习,获得命名实体关系图谱中的风险节点及非风险节点的分布;对风险节点进行综合风险传导预测,获得风险节点的综合风险传导概率值;并对风险节点进行单一风险事件影响分析,以预测单一风险事件对风险源的指定度以内节点的影响程度值;将分布、综合风险传导概率值及影响程度值增加至命名实体关系图谱中。本说明书实施例可以提高命名实体的信息认知能力和风险识别能力。别能力。别能力。

【技术实现步骤摘要】
基于知识图谱的信息处理方法、装置、设备及存储介质


[0001]本说明书涉及数据挖掘
,尤其是涉及一种基于知识图谱的信息处理方法、装置、设备及存储介质。

技术介绍

[0002]数据挖掘是一种决策支持过程,它主要基于人工智能(例如机器学习)、模式识别等技术,高度自动化地分析大量数据,以从中挖掘出潜在的有用的信息和知识。目前数据挖掘已广泛应用于生产控制、市场分析、工程设计、商务管理和科学探索等领域。
[0003]例如,对于企业(如金融机构等)而言,常利用可以用结构数据表述的数据挖掘业务风险(即进行风险预测)。在很多情况下,一些复杂的难以用表结构数据表述清楚的关系信息也可能会对业务风险产生影响。然而,由于这些关系信息难以被发现,在进行风险预测时往往被忽略,从而影响了企业的信息认知能力和风险识别能力。

技术实现思路

[0004]本说明书实施例的目的在于提供一种基于知识图谱的信息处理方法、装置、设备及存储介质,以提高命名实体的信息认知能力和风险识别能力。
[0005]为达到上述目的,一方面,本说明书实施例提供了一种基于知识图谱的信息处理方法,包括:
[0006]基于指定数据形成命名实体属性表和命名实体关系表;所述指定数据包括非结构化数据;
[0007]根据所述命名实体属性表和所述命名实体关系表构建命名实体关系图谱;所述命名实体关系图谱中,节点表示命名实体,边表示命名实体之间的关联关系;
[0008]对所述命名实体关系图谱进行图表示学习,获得所述命名实体关系图谱中的风险节点及非风险节点的分布;
[0009]对所述风险节点进行综合风险传导预测,获得所述风险节点的综合风险传导概率值;并对所述风险节点进行单一风险事件影响分析,以预测所述单一风险事件对风险源的指定度以内节点的影响程度值;
[0010]将所述分布、所述综合风险传导概率值及所述影响程度值增加至所述命名实体关系图谱中。
[0011]在本说明书一实施例中,所述基于指定数据形成命名实体属性表和命名实体关系表,包括:
[0012]从交易数据中提取命名实体的交易关系数据,并剔除所述交易关系数据中的脏数据;
[0013]利用预设的正则表达式及规则,从外部数据中提取命名实体标识信息;所述外部数据包括工商数据、征信数据和舆情数据;
[0014]利用预设的词嵌入模型,分别对所述交易关系数据及所述命名实体标识信息进行
标准化,从而形成标准化的交易关系数据及命名实体标识信息;
[0015]利用预设的深度特征合成算法,将所述标准化的交易关系数据及命名实体标识信息进行特征合成,获得命名实体属性表和命名实体关系表。
[0016]在本说明书一实施例中,所述根据所述命名实体属性表和所述命名实体关系表构建命名实体关系图谱,包括:
[0017]确定基于中文社群标准的本体结构;
[0018]从所述命名实体属性表和所述命名实体关系表中抽取命名实体数据;
[0019]将所述命名实体数据整合至所述本体结构中,获得命名实体关系图谱。
[0020]在本说明书一实施例中,所述对所述命名实体关系图谱进行图表示学习,包括:
[0021]利用预设的图嵌入算法对命名实体关系图谱进行节点嵌入处理,获得节点向量;
[0022]利用预设的降维算法对所述节点向量进行聚类,获得风险节点及非风险节点的分布。
[0023]在本说明书一实施例中,所述对所述风险节点进行综合风险传导预测,包括:
[0024]为命名实体关系图谱中每个节点所连的边赋予权重;
[0025]根据个性化网页排名算法模拟每个风险节点在命名实体关系图谱中的风险传导过程,以预测所述命名实体关系图谱中的风险节点发生风险后,对所述命名实体关系图谱中所有节点的综合风险影响,从而获得每个风险节点在其风险传导趋于稳态分布时的综合风险传导概率值。
[0026]在本说明书一实施例中,所述对所述风险节点进行单一风险事件影响分析,包括:
[0027]根据风险源发生的风险事件的评价指标值及所述风险源的指定度以内节点,构建节点与其关联的风险事件的二维稀疏矩阵;
[0028]根据矩阵分解算法对所述二维稀疏矩阵中的缺失值进行填补预测,从而获得单一风险事件对所述风险源的指定度以内节点的影响程度值。
[0029]在本说明书一实施例中,在所述将所述分布、所述综合风险传导概率值及所述影响程度值增加至所述命名实体关系图谱中之后,还包括:
[0030]将接收到的以自然语言表达的提问文本转换为图查询语句;
[0031]根据所述图查询语句从命名实体关系图谱中查询答案并返回。
[0032]另一方面,本说明书实施例还提供了一种基于知识图谱的信息处理装置,包括:
[0033]属性关系获取模块,用于基于指定数据形成命名实体属性表和命名实体关系表;所述指定数据包括非结构化数据;
[0034]关系图谱构建模块,用于根据所述命名实体属性表和所述命名实体关系表构建命名实体关系图谱;
[0035]图表示学习模块,用于对所述命名实体关系图谱进行图表示学习,获得该图谱中的风险节点及非风险节点的分布;
[0036]风险传导预测模块,用于对所述风险节点进行综合风险传导预测,获得所述风险节点的综合风险传导概率值;并对所述风险节点进行单一风险事件影响分析,以预测所述单一风险事件对风险源的指定度以内节点的影响程度值;
[0037]关系图谱更新模块,用于将所述综合风险传导概率值及所述分布及所述影响程度值增加至所述命名实体关系图谱中。
[0038]另一方面,本说明书实施例还提供了一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时,执行上述方法的指令。
[0039]另一方面,本说明书实施例还提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被计算机设备的处理器运行时,执行上述方法的指令。
[0040]由以上本说明书实施例提供的技术方案可见,在本说明书实施例中,可以基于包含结构化数据、非结构化数据(包括半结构化数据)等在内的指定数据,形成命名实体属性表和命名实体关系表,因此根据命名实体属性表和命名实体关系表构建出的命名实体关系图谱,可以更全面反映命名实体及其相互之间的关联关系,从而提高了命名实体(例如企业)的认识能力。不仅如此,本说明书实施例还可以对命名实体关系图谱进行图表示学习,获得其中的风险节点及非风险节点的分布,在此基础上还可以通过对风险节点进行综合风险传导预测和单一风险事件影响分析,对应获得风险节点的综合风险传导概率值,以及单一风险事件对风险源的指定度以内节点的影响程度值,然后将上述的分布及综合风险传导概率值及影响程度值增加至命名实体关系图谱,从而使得命名实体关系图谱不仅包含了命名实体的属性画像特征和关联关系画像特征,还包含了命名实体的更为全面的风险画像特征,从而提高了命名实体(例如企业)的风险识别能力本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的信息处理方法,其特征在于,包括:基于指定数据形成命名实体属性表和命名实体关系表;所述指定数据包括非结构化数据;根据所述命名实体属性表和所述命名实体关系表构建命名实体关系图谱;所述命名实体关系图谱中,节点表示命名实体,边表示命名实体之间的关联关系;对所述命名实体关系图谱进行图表示学习,获得所述命名实体关系图谱中的风险节点及非风险节点的分布;对所述风险节点进行综合风险传导预测,获得所述风险节点的综合风险传导概率值;并对所述风险节点进行单一风险事件影响分析,以预测所述单一风险事件对风险源的指定度以内节点的影响程度值;将所述分布、所述综合风险传导概率值及所述影响程度值增加至所述命名实体关系图谱中。2.如权利要求1所述的基于知识图谱的信息处理方法,其特征在于,所述基于指定数据形成命名实体属性表和命名实体关系表,包括:从交易数据中提取命名实体的交易关系数据,并剔除所述交易关系数据中的脏数据;利用预设的正则表达式及规则,从外部数据中提取命名实体标识信息;所述外部数据包括工商数据、征信数据和舆情数据;利用预设的词嵌入模型,分别对所述交易关系数据及所述命名实体标识信息进行标准化,从而形成标准化的交易关系数据及命名实体标识信息;利用预设的深度特征合成算法,将所述标准化的交易关系数据及命名实体标识信息进行特征合成,获得命名实体属性表和命名实体关系表。3.如权利要求1所述的基于知识图谱的信息处理方法,其特征在于,所述根据所述命名实体属性表和所述命名实体关系表构建命名实体关系图谱,包括:确定基于中文社群标准的本体结构;从所述命名实体属性表和所述命名实体关系表中抽取命名实体数据;将所述命名实体数据整合至所述本体结构中,获得命名实体关系图谱。4.如权利要求1所述的基于知识图谱的信息处理方法,其特征在于,所述对所述命名实体关系图谱进行图表示学习,包括:利用预设的图嵌入算法对命名实体关系图谱进行节点嵌入处理,获得节点向量;利用预设的降维算法对所述节点向量进行聚类,获得风险节点及非风险节点的分布。5.如权利要求1所述的基于知识图谱的信息处理方法,其特征在于,所述对所述风险节点进行综合风险传导预测,包括:为命名实体关系图谱中每个节点所连的边赋予权重;根据个性化网页...

【专利技术属性】
技术研发人员:冯云青周骏李丽程思睿陈超峰金杨一叶
申请(专利权)人:上海浦东发展银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1