信息处理方法及装置制造方法及图纸

技术编号:32671426 阅读:14 留言:0更新日期:2022-03-17 11:25
本公开关于一种信息处理方法及装置,信息处理方法包括:获取实验数据集和观测到的特征数据集,其中,特征数据集包括多个用户账户中的每一用户账户针对于多个变量中的每一变量产生的特征数据,实验数据集是针对于多个用户账户和实验变量进行实验得到的特征数据,实验变量至少包括多个变量,特征数据是用户账户在预定平台的操作信息;根据实验数据集和观测到的特征数据集,得到多个变量之间的因果关系,其中,多个变量之间的因果关系表征不同操作信息之间的关联关系。本公开能够使得相关技术中由于遗漏数据而导致的用户账户的操作信息之间的因果关联关系推断的不准确的问题得到解决。决。决。

【技术实现步骤摘要】
信息处理方法及装置


[0001]本公开涉及数据分析领域,尤其涉及一种信息处理方法及装置。

技术介绍

[0002]对于自变量较多的因果分析,需要了解自变量之间是否存在关系,以及某个变量对因变量是间接影响还是直接影响的关系,这往往涉及到离散搜索的问题,相关技术中,将离散搜索的问题转化成连续搜索的问题,使得生成的因果图满足有向无闭环的条件。但是,这种方法可能会由于遗漏变量的问题导致较大的权重矩阵的估计偏误,使得变量之间的因果关系的推断不准确。例如对于网络平台,是无法观测到部分变量的数据如用户账户的每日空闲时间长度等,在这种情况下,当用户希望在空闲时间观看网络平台的视频时,可能会由于无法观测到用户账户每日空闲时间长度的数据导致网络平台推荐的视频时长过长或过短,不能满足用户的需求。为了更好地满足用户的需求,需要在进行有关于网络平台的数据的因果分析时,解决由于遗漏数据而导致的用户账户的操作信息之间的因果关联关系推断的不准确的问题。

技术实现思路

[0003]本公开提供一种信息处理方法及装置,以至少解决上述相关技术中的问题,也可不解决任何上述问题。本公开的技术方案如下:
[0004]根据本公开实施例的第一方面,提供一种信息处理方法,包括:获取实验数据集和观测到的特征数据集,其中,所述特征数据集包括多个用户账户中的每一用户账户针对于多个变量中的每一变量产生的特征数据,所述实验数据集是针对于所述多个用户账户和实验变量进行实验得到的特征数据,所述实验变量至少包括所述多个变量,所述特征数据是所述用户账户在预定平台的操作信息;根据所述实验数据集和所述观测到的特征数据集,得到所述多个变量之间的因果关系,其中,所述多个变量之间的因果关系表征不同操作信息之间的关联关系。
[0005]可选地,所述根据所述实验数据集和所述观测到的特征数据集,得到所述多个变量之间的因果关系,包括:根据所述观测到的特征数据集得到输入矩阵,以及,根据所述实验数据集得到工具变量矩阵,其中,所述输入矩阵的每一行的元素是同一用户账户针对于所述多个变量中的每一变量产生的特征数据,所述输入矩阵的每一列的元素是所述多个用户账户中的每一用户账户针对于同一变量产生的特征数据,所述工具变量矩阵的每一行的元素是同一用户账户针对于多个实验中的每一实验产生的特征数据,所述工具变量矩阵的每一列的元素是所述多个用户账户中的每一用户账户针对于同一实验产生的特征数据,所述多个实验中的每一实验是针对于所述实验变量中的至少一个变量进行的;根据所述输入矩阵和所述工具变量矩阵,得到权重矩阵,其中,所述权重矩阵表征所述多个变量之间的因果关系。
[0006]可选地,所述根据所述输入矩阵和所述工具变量矩阵,得到权重矩阵,包括:根据
所述输入矩阵和所述工具变量矩阵,对预先定义的目标函数进行优化,得到使得所述预先定义的目标函数的值最小的权重矩阵。
[0007]可选地,在所述根据所述输入矩阵和所述工具变量矩阵,对预先定义的目标函数进行优化,得到使得所述预先定义的目标函数的值最小的权重矩阵之前,还包括:根据预先定义的所述多个变量之间的关系对所述权重矩阵中的元素取值进行限制。
[0008]可选地,所述预先定义的目标函数包括优化项,所述优化项是每一内生变量的优化函数和每一外生变量的优化函数的和值,其中,所述内生变量和所述外生变量是所述多个变量中的变量,所述内生变量与未观测变量相关,所述外生变量与所述未观测变量无关,所述未观测变量对所述多个变量之间的因果关系产生影响且不是所述多个变量中的变量。
[0009]可选地,对于所述输入矩阵的第i列的元素所对应的变量,在所述第i列的元素所对应的变量是内生变量的情况下,所述第i列的元素所对应的变量的优化函数通过下述步骤得到:根据所述输入矩阵的第i列、所述输入矩阵除第i列之外的列以及所述权重矩阵,得到所述输入矩阵的第i列回归所述输入矩阵除第i列之外的列的残差;根据所述残差、所述工具变量矩阵以及所述多个用户账户的用户账户个数,得到加权矩阵;根据所述残差、所述工具变量矩阵以及所述加权矩阵,得到所述第i列的元素所对应的变量的优化函数。
[0010]可选地,对于所述输入矩阵的第i列的元素所对应的变量,在所述第i列的元素所对应的变量是外生变量的情况下,所述第i列的元素所对应的变量的优化函数通过下述步骤得到:根据所述输入矩阵的第i列、所述输入矩阵除第i列之外的列以及所述权重矩阵,得到所述输入矩阵的第i列回归所述输入矩阵除第i列之外的列的残差;根据所述残差,得到所述第i列的元素所对应的变量的优化函数。
[0011]根据本公开实施例的第二方面,提供一种信息处理装置,包括:获取单元,被配置为:获取实验数据集和观测到的特征数据集,其中,所述特征数据集包括多个用户账户中的每一用户账户针对于多个变量中的每一变量产生的特征数据,所述实验数据集是针对于所述多个用户账户和实验变量进行实验得到的特征数据,所述实验变量至少包括所述多个变量,所述特征数据是所述用户账户在预定平台的操作信息;确定单元,被配置为:根据所述实验数据集和所述观测到的特征数据集,得到所述多个变量之间的因果关系,其中,所述多个变量之间的因果关系表征不同操作信息之间的关联关系。
[0012]可选地,确定单元被配置为:根据所述观测到的特征数据集得到输入矩阵,以及,根据所述实验数据集得到工具变量矩阵,其中,所述输入矩阵的每一行的元素是同一用户账户针对于所述多个变量中的每一变量产生的特征数据,所述输入矩阵的每一列的元素是所述多个用户账户中的每一用户账户针对于同一变量产生的特征数据,所述工具变量矩阵的每一行的元素是同一用户账户针对于多个实验中的每一实验产生的特征数据,所述工具变量矩阵的每一列的元素是所述多个用户账户中的每一用户账户针对于同一实验产生的特征数据,所述多个实验中的每一实验是针对于所述实验变量中的至少一个变量进行的;根据所述输入矩阵和所述工具变量矩阵,得到权重矩阵,其中,所述权重矩阵表征所述多个变量之间的因果关系。
[0013]可选地,确定单元被配置为:根据所述输入矩阵和所述工具变量矩阵,对预先定义的目标函数进行优化,得到使得所述预先定义的目标函数的值最小的权重矩阵。
[0014]可选地,还包括调整单元,被配置为:在根据所述输入矩阵和所述工具变量矩阵,
对预先定义的目标函数进行优化,得到使得所述预先定义的目标函数的值最小的权重矩阵之前,根据预先定义的所述多个变量之间的关系对所述权重矩阵中的元素取值进行限制。
[0015]可选地,所述预先定义的目标函数包括优化项,所述优化项是每一内生变量的优化函数和每一外生变量的优化函数的和值,其中,所述内生变量和所述外生变量是所述多个变量中的变量,所述内生变量与未观测变量相关,所述外生变量与所述未观测变量无关,所述未观测变量对所述多个变量之间的因果关系产生影响且不是所述多个变量中的变量。
[0016]可选地,对于所述输入矩阵的第i列的元素所对应的变量,在所述第i列的元素所对应的变量是内生变量的情况下,所述第i列的元素所对应的本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种信息处理方法,其特征在于,包括:获取实验数据集和观测到的特征数据集,其中,所述特征数据集包括多个用户账户中的每一用户账户针对于多个变量中的每一变量产生的特征数据,所述实验数据集是针对于所述多个用户账户和实验变量进行实验得到的特征数据,所述实验变量至少包括所述多个变量,所述特征数据是所述用户账户在预定平台的操作信息;根据所述实验数据集和所述观测到的特征数据集,得到所述多个变量之间的因果关系,其中,所述多个变量之间的因果关系表征不同操作信息之间的关联关系。2.如权利要求1所述的信息处理方法,其特征在于,所述根据所述实验数据集和所述观测到的特征数据集,得到所述多个变量之间的因果关系,包括:根据所述观测到的特征数据集得到输入矩阵,以及,根据所述实验数据集得到工具变量矩阵,其中,所述输入矩阵的每一行的元素是同一用户账户针对于所述多个变量中的每一变量产生的特征数据,所述输入矩阵的每一列的元素是所述多个用户账户中的每一用户账户针对于同一变量产生的特征数据,所述工具变量矩阵的每一行的元素是同一用户账户针对于多个实验中的每一实验产生的特征数据,所述工具变量矩阵的每一列的元素是所述多个用户账户中的每一用户账户针对于同一实验产生的特征数据,所述多个实验中的每一实验是针对于所述实验变量中的至少一个变量进行的;根据所述输入矩阵和所述工具变量矩阵,得到权重矩阵,其中,所述权重矩阵表征所述多个变量之间的因果关系。3.如权利要求2所述的信息处理方法,其特征在于,所述根据所述输入矩阵和所述工具变量矩阵,得到权重矩阵,包括:根据所述输入矩阵和所述工具变量矩阵,对预先定义的目标函数进行优化,得到使得所述预先定义的目标函数的值最小的权重矩阵。4.如权利要求3所述的信息处理方法,其特征在于,在所述根据所述输入矩阵和所述工具变量矩阵,对预先定义的目标函数进行优化,得到使得所述预先定义的目标函数的值最小的权重矩阵之前,还包括:根据预先定义的所述多个变量之间的关系对所述权重矩阵中的元素取值进行限制。5.如权利要求3所述的信息处理方法,其特征在于,所述预先定义的目标函数包括优化项,所述优化项是每一内生变量的优化函数和每一...

【专利技术属性】
技术研发人员:周小羽
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1