数据处理方法、装置、电子设备及可读存储介质制造方法及图纸

技术编号:32257939 阅读:34 留言:0更新日期:2022-02-12 19:17
本公开实施例中提供了一种数据处理方法、装置、电子设备及可读存储介质,所述方法包括:获取贝叶斯网络的图邻接矩阵W的初始化结果,获取贝叶斯网络的观测数据矩阵X,观测数据矩阵X包括贝叶斯网络中的多个节点的观测结果;基于图邻接矩阵W的初始化结果对图邻接矩阵W进行优化,获取图邻接矩阵W的中间优化结果,当图邻接矩阵W的中间优化结果与观测数据矩阵X之间的匹配程度满足第一预设条件,图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘得到的矩阵S的谱半径上界满足第二预设条件时,将图邻接矩阵W的中间优化结果作为图邻接矩阵W的优化结果;根据图邻接矩阵W的优化结果,确定贝叶斯网络中的边的分布。定贝叶斯网络中的边的分布。定贝叶斯网络中的边的分布。

【技术实现步骤摘要】
数据处理方法、装置、电子设备及可读存储介质


[0001]本公开涉及计算机
,具体涉及一种数据处理方法、装置、电子设备及可读存储介质。

技术介绍

[0002]贝叶斯网络(Bayesian Network,简称BN)模型是一种广泛使用的概率图模型,其使用有向无环图(DAG)的方式来表示观测变量之间的因果关系。BN中的每一个节点都表示一个观测变量,节点之间的边表示节点间存在某种因果关系。
[0003]BN模型广泛用于多变量的归因分析和因素关系分析等场景。例如,用户在网上订机票时,可能涉及多个服务提供方(例如,航空公司、票务代理、机场等)和多个环节(例如,验价、验座、预订、支付校验等),如果有一个或多个服务提供方或环节出现异常,用户将无法正常预订。所以,用户订票结果受服务提供方和订票环节等诸多因素的影响。机票预订系统本身的问题(如机器问题、网络问题、代码问题等)可以直接通过监控埋点发现并进行修复,但是服务提供方或环节的问题相对会更隐蔽些,导致很难及时并准确地定位问题。
[0004]通过引入基于BN模型,可以实现订票结果影响因素的快本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,包括:获取贝叶斯网络的图邻接矩阵W的初始化结果,所述贝叶斯网络包括多个节点,所述多个节点中的第一节点集合中的每个节点表示相应的用户行为或用户行为结果,所述多个节点中的第二节点集合中的每个节点表示与所述用户行为或用户行为结果有关联的要素,所述节点之间的边表示所述边连接的两个节点之间存在因果关系,所述图邻接矩阵W表示所述贝叶斯网络中的边的分布;获取所述贝叶斯网络的观测数据矩阵X,所述观测数据矩阵X包括所述多个节点的观测结果;基于所述图邻接矩阵W的初始化结果对所述图邻接矩阵W进行优化,获取所述图邻接矩阵W的中间优化结果,当所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘得到的矩阵S的谱半径上界满足第二预设条件时,将所述图邻接矩阵W的中间优化结果作为所述图邻接矩阵W的优化结果;根据所述图邻接矩阵W的优化结果,确定所述贝叶斯网络中的边的分布。2.根据权利要求1所述的方法,其中,所述边连接的两个节点属于所述第一节点集合或属于第二节点集合或分别属于所述第一节点集合和所述第二节点集合。3.根据权利要求1所述的方法,其中:所述图邻接矩阵W包括d行d列,d为所述贝叶斯网络中的节点数,W[i,j]≠0表示所述贝叶斯网络中存在所述贝叶斯网络中的节点i到所述贝叶斯网络中的节点j的边,W[i,j]=0则表示图中不存在所述贝叶斯网络中的节点i到所述贝叶斯网络中的节点j的边;所述观测数据矩阵X包括n行d列,所述观测数据矩阵X的每一行表示对所述贝叶斯网络中的所有节点的一次观测结果,X[p,q]表示所述贝叶斯网络中的节点q的第p次观测结果。4.根据权利要求1所述的方法,其中,所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,包括:用于表征所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度的损失函数值小于或等于第一预设阈值。5.根据权利要求1所述的方法,其中,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘得到的矩阵S的谱半径上界满足第二预设条件,包括所述谱半径上界小于或等于第二预设阈值。6.根据权利要求1所述的方法,还包括:令S
(0)
=S;对于0≤k<K,基于矩阵S
(k)
的按行求和结果、矩阵S
(k)
的按列求和结果、矩阵S
(k)
,获取第一向量b
(k)
,基于所述第一向量b
(k)
和所述矩阵S
(k)
,获取矩阵S
(k+1)
;基于矩阵S
(K)
的按行求和结果、矩阵S
(k)
的按列求和结果、矩阵S
(k)
,获取第一向量b
(k)
;基于矩阵S
(K)
对应的第一向量b
(K)
,获取所述矩阵S的谱半径上界。7.根据权利要求6所述的方法,还包括:根据所述图邻接矩阵W的中间优化结果和矩阵S
(K)
,获取所述矩阵S的谱半径上界相对于矩阵S
(K)
的梯度;对于0≤k<K,基于矩阵S
(K)
的按行求和结果和矩阵S
(K)
的按列求和结果,获取第二向量x
(k)
和第三向量y
(k)
,基于所述矩阵S的谱半径上界相对于矩阵S
(k+1)
的梯度、矩阵S
(k)
、第一向量b
(k)
,获取第四向量z
(k)
,基于第一向量b
(k)
、第二向量x
(k)
、第三向量y
(k)
、第四向量z
(k)
、所述图邻接矩阵W的中间优化结果、所述矩阵S的谱半径上界相对于矩阵S
(k+1)
的梯度,获取所述矩阵S的谱半径上界相对于矩阵S
(k)
的梯度;基于所述图邻接矩阵W的中间优化结果和所述矩阵S的谱半径上界相对于矩阵S
(0)
的梯度,获取所述矩阵S的谱半径上界相对于所述图邻接矩阵W的中间优化结果的梯度。8.根据权利要求7所述的方法,其中,所述对所述图邻接矩阵W进行优化,包括根据所述矩阵S的谱半径上界相对于所述图邻接矩阵W的中间优化结果的梯度,对所述图邻接矩阵W进行优化。9.一种数据处理方法,包括:获取贝叶斯网络的图邻接矩阵W的初始化结果,所述贝叶斯网络包括多个节点,所述多个节点中的第一节点集合中的每个节点表示用户订票过程的结果或用户订票过程的子过程的结果,所述多个节点中的第二节点集合中的每个节点表示订票过程中涉及的相应服务提供方或相应环节,所述节点之间的边表示所述边连接的两个节点之间存在因果关系,所述图邻接矩阵W表示所述贝叶斯网络中的边的分布;获取所述贝叶斯网络的观测数据矩阵X,所述观测数据矩阵X包括所述多个节点的观测结果,其中,所述第一节点集合中的节点的观测结果表示所述用户订票过程是否成功或所述用户订票过程的子过程是否成功,所述第二节点集合中的节点的观测结果表示所述用户订票过程或所述用户订票过程的子过程是否涉及了所述节点代表的相应服务提供方或相应环节;基于所述图邻接矩阵W的初始化结果对所述图邻接矩阵W进行优化,获取所述图邻接矩阵W的中间优化结果,当所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘得到的矩阵S的谱半径上界满足第二预设条件时,将所述图邻接矩阵W的中间优化结果作为所述图邻接矩阵W的优化结果;根据所述图邻接矩阵W的优化结果,确定所述贝叶斯网络中的边的分布。10.一种数据处理方法,包括:获取贝叶斯网络的图邻接矩阵W的初始化结果,所述贝叶斯网络包括多个节点,所述多个节点中的第一节点集合中的每个节点表示用户对多个视频中的视频的选择结果,所述多个节点中的第二节点集合中的每个节点表示与所述多个视频中的视频相关的相应信息,所述节点之间的边表示所述边连接的两个节点之间存在因果关系,所述图邻接矩阵W表示所述贝叶斯网络中的边的分布;获取所述贝叶斯网络的观测数据矩阵X,所述观测数据矩阵X包括所述多个节点的观测结果,其中,所述第一节点集合中的节点的观测结果表示所述用户是否选择了所述多个视频中的指定视频,所述第二节点集合中的节点的观测结果表示所述指定视频是否涉及了所述节点代表的相应信息;基于所述图邻接矩阵W的初始化结果对所述图邻接矩阵W进行优化,获取所述图邻接矩阵W的中间优化结果,当所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘
得到的矩阵S的谱半径上界满足第二预设条件时,将所述图邻接矩阵W的中间优化结果作为所述图邻接矩阵W的优化结果;根据所述图邻接矩阵W的优化结果,确定所述贝叶斯网络中的边的分布。11.一种数据处理方法,包括:获取贝叶斯网络的图邻接矩阵W的初始化结果,所述贝叶斯网络包括多个节点,所述多个节点中的第一节点集合中的每个节点表示用户对多个视频中的视频的选择结果,所述多个节点中的第二节点集合中的每个节点表示与所述多个视频中的视频相关的相应信息或与所述多个视频中的视频的至少一个关联视频相关的相应信息,所述节点之间的边表示所述边连接的两个节点之间存在因果关系,所述图邻接矩阵W表示所述贝叶斯网络中的边的分布;获取所述贝叶斯网络的观测数据矩阵X,所述观测数据矩阵X包括所述多个节点的观测结果,其中,所述第一节点集合中的节点的观测结果表示所述用户是否选择了所述多个视频中的指定视频,所述第二节点集合中的节点的观测结果表示所述指定视频是否涉及了所述节点代表的相应信息;基于所述图邻接矩阵W的初始化结果对所述图邻接矩阵W进行优化,获取所述图邻接矩阵W的中间优化结果,当所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘得到的矩阵S的谱半径上界满足第二预设条件时,将所述图邻接矩阵W的中间优化结果作为所述图邻接矩阵W的优化结果;根据所述图邻接矩阵W的优化结果,确定所述贝叶斯网络中的边的分布。12.一种数据处理方法,包括:获取贝叶斯网络的图邻接矩阵W的初始化结果,所述贝叶斯网络包括多个节点,所述多个节点中的第一节点集合中的每个节点表示用户对网页中展示的内容的选择结果,所述多个节点中的第二节点集合中的每个节点表示网页中展示的相应内容,所述节点之间的边表示所述边连接的两个节点之间存在因果关系,所述图邻接矩阵W表示所述贝叶斯网络中的边的分布;获取所述贝叶斯网络的观测数据矩阵X,所述观测数据矩阵X包括所述多个节点的观测结果,其中,所述第一节点集合中的节点的观测结果表示所述用户是否选择了指定网页中的指定内容,所述第二节点集合中的节点的观测结果表示所述指定网页是否涉及了所述节点代表的相应内容;基于所述图邻接矩阵W的初始化结果对所述图邻接矩阵W进行优化,获取所述图邻接矩阵W的中间优化结果,当所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘得到的矩阵S的谱半径上界满足第二预设条件时,将所述图邻接矩阵W的中间优化结果作为所述图邻接矩阵W的优化结果;根据所述图邻接矩阵W的优化结果,确定所述贝叶斯网络中的边的分布。13.一种数据处理方法,包括:获取贝叶斯网络的图邻接矩阵W的初始化结果,所述贝叶斯网络包括多个节点,所述多个节点中的第一节点集合中的每个节点表示用户对网页中展示的内容的选择结果,所述多
个节点中的第二节点集合中的每个节点表示网页中展示的相应内容或所述网页之前的一个或多个网页中展示的相应内容,所述节点之间的边表示所述边连接的两个节点之间存在因果关系,所述图邻接矩阵W表示所述贝叶斯网络中的边的分布;获取所述贝叶斯网络的观测数据矩阵X,所述观测数据矩阵X包括所述多个节点的观测结果,其中,所述第一节点集合中的节点的观测结果表示所述用户是否选择了指定网页中的指定内容,所述第二节点集合中的节点的观测结果表示所述指定网页是否涉及了所述节点代表的相应内容;基于所述图邻接矩阵W的初始化结果对所述图邻接矩阵W进行优化,获取所述图邻接矩阵W的中间优化结果,当所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘得到的矩阵S的谱半径上界满足第二预设条件时,将所述图邻接矩阵W的中间优化结果作为所述图邻接矩阵W的优化结果;根据所述图邻接矩阵W的优化结果,确定所述贝叶斯网络中的边的分布。14.一种数据处理方法,包括:获取贝叶斯网络的图邻接矩阵W的初始化结果,所述贝叶斯网络包括多个节点,所述多个节点中的第一节点集合中的每个节点表示用户对商品的选择结果,所述多个节点中的第二节点集合中的每个节点表示与商品的相应信息或与商品的推荐页面相关的相应信息,所述节点之间的边表示所述边连接的两个节点之间存在因果关系,所述图邻接矩阵W表示所述贝叶斯网络中的边的分布;获取所述贝叶斯网络的观测数据矩阵X,所述观测数据矩阵X包括所述多个节点的观测结果,其中,所述第一节点集合中的节点的观测结果表示所述用户是否选择了指定商品,所述第二节点集合中的节点的观测结果表示所述指定商品是否涉及了所述节点代表的相应信息;基于所述图邻接矩阵W的初始化结果对所述图邻接矩阵W进行优化,获取所述图邻接矩阵W的中间优化结果,当所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘得到的矩阵S的谱半径上界满足第二预设条件时,将所述图邻接矩阵W的中间优化结果作为所述图邻接矩阵W的优化结果;根据所述图邻接矩阵W的优化结果,确定所述贝叶斯网络中的边的分布。15.一种数据处理方法,包括:获取贝叶斯网络的图邻接矩阵W的初始化结果,所述贝叶斯网络包括多个节点,所述多个节点中的第一节点集合中的每个节点表示相应的基因或酶或蛋白质,所述多个节点中的第二节点集合中的每个节点表示相应的药物分子,所述节点之间的边表示所述边连接的两个节点之间存在因果关系,所述图邻接矩阵W表示所述贝叶斯网络中的边的分布;获取所述贝叶斯网络的观测数据矩阵X,所述观测数据矩阵X包括对所述多个节点的观测结果;基于所述图邻接矩阵W的初始化结果对所述图邻接矩阵W进行优化,获取所述图邻接矩阵W的中间优化结果,当所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘
得到的矩阵S的谱半径上界满足第二预设条件时,将所述图邻接矩阵W的中间优化结果作为所述图邻接矩阵W的优化结果;根据所述图邻接矩阵W的优化结果,确定所述贝叶斯网络中的边的分布。16.根据权利要求15所述的方法,其中,所述边连接的两个节点属于所述第一节点集合或属于第二节点集合或分别属于所述第一节点集合和所述第二节点集合。17.根据权利要求15所述的方法,其中:所述第一节点集合中的节点的观测结果表示所述节点代表的相应基因或酶或蛋白质是否受到任一药物分子的影响;所述第二节点集合中的节点的观测结果表示所述节点代表的药物分子是否存在。18.根据权利要求15所述的方法,其中:所述图邻接矩阵W包括d行d列,d为所述贝叶斯网络中的节点数,W[i,j]≠0表示所述贝叶斯网络中存在所述贝叶斯网络中的节点i到所述贝叶斯网络中的节点j的边,W[i,j]=0则表示图中不存在所述贝叶斯网络中的节点i到所述贝叶斯网络中的节点j的边;所述观测数据矩阵X包括n行d列,所述观测数据矩阵X的每一行表示对所述贝叶斯网络中的所有节点的一次观测结果,X[p,q]表示所述贝叶斯网络中的节点q的第p次观测结果。19.根据权利要求15所述的方法,其中,所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度满足第一预设条件,包括:用于表征所述图邻接矩阵W的中间优化结果与所述观测数据矩阵X之间的匹配程度的损失函数值小于或等于第一预设阈值。20.根据权利要求15所述的方法,其中,所述图邻接矩阵W的中间优化结果的矩阵元素按对应位置相乘得到的矩阵S的谱半径上界满足第二预设条件,包括所述谱半径上界小于或等于第二预设阈值。21.根据权利要求15所述的方法,还包括:令S
(0)
=S;对于0≤k<K,基于矩阵S
(k)
的按行求和结果、矩阵S
(k)
的按列求和结果、矩阵S
(k)
,获取第一向量b
(k)
,基于所述第一向量b
(k)
和所述矩阵S
(k)
,获取矩阵S
(k+1)
;基于矩阵S
(K)
的按行求和结果、矩阵S
(k)
的按列求和结果、矩阵S
(k)
,获取第一向量b
(k)
;基于矩阵S
(K)
对应的第一向量b
(K)
,获取所述矩阵S的谱半径上界。22.根据权利要求20所述的方法,还包括:根据所述图邻接矩阵W的中间优化结果和矩阵S
(K)
,获取所述矩阵S的谱半径上界相对于矩阵S
(K)
的梯度;对于0≤k<K,基于矩阵S
(K)
的按行求和结果和矩阵S
(K)
的按列求和结果,获取第二向量x
(k)
和第三向量y
(k)
,基于所述矩阵S的谱半径上界相对于矩阵S
(k+1)
的梯度、矩阵S
(k)
、第一向量b
(k)
,获取第四向量z
(k)
,基于第一向量b
(k)
、第二向量x
(k)
、第三向量y
(k)
、第四向量z

【专利技术属性】
技术研发人员:朱鎔杨晓科普法德勒
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1