一种特征处理方法和相关设备技术

技术编号:23316881 阅读:32 留言:0更新日期:2020-02-11 18:26
本申请实施例公开了一种特征处理方法和相关设备,在获取不同节点发送的原始特征对应的用户标识之后,可以根据用户标识确定相同用户标识集合,并将相同用户标识集合发送至不同节点。若处于第一特征处理模式,且接收到每个节点针对待处理特征在第i轮特征处理后得到的第一子特征,可以将第一子特征对齐,生成针对第i+1轮特征处理的第一同步子特征,并将其发送至不同节点。其中,待处理特征是每个节点从原始特征中确定出的对应于相同用户标识集合中所有用户的特征。由于该方法从始至终均未获得每个节点的原始特征、待处理特征以及处理后的全部子特征,因此保证了不同节点间数据的安全性。

A feature processing method and related equipment

【技术实现步骤摘要】
一种特征处理方法和相关设备
本申请涉及数据处理领域,特别是涉及一种特征处理方法和相关设备。
技术介绍
在一种特征处理模式中,需要将不同节点的特征分解为两个或多个子特征,同时,还需保证不同节点针对该特征分解后得到的其中一个子特征相同。例如:多个组织(节点)具有一些关于共同用户或者共同产品的数据(特征),需要利用非负矩阵分解的方法研究这些组织的数据所对应的用户画像或者产品画像,以进行推荐。又或,多个医院(对应节点)有不同病人对同一个疾病的诊断数据,这些医院之间需要利用这些数据(特征)一起研究,可以采用非负矩阵分解的方法进行分解。出于安全性的考虑,不同节点间不希望对方推断出自身特征,而且,要确保将除自身外的其他全部节点间的特征集合在一起也无法推断出自身特征。然而,通常情况下,需要获知这些节点的特征才能实现上述分解过程。由此将导致节点间的特征发生泄漏,无法保证不同节点间的数据安全。
技术实现思路
为了解决上述技术问题,本申请提供了一种特征处理方法和相关设备,保证了不同节点间数据的安全性。本申请实施例公开了如下本文档来自技高网...

【技术保护点】
1.一种特征处理方法,其特征在于,应用于数据处理设备,所述方法包括:/n获取不同节点发送的原始特征对应的用户标识;/n根据所述用户标识,确定相同用户标识集合,并将所述相同用户标识集合发送至所述不同节点;/n若处于第一特征处理模式,且接收到每个节点针对待处理特征在第i轮特征处理后得到的第一子特征,将所述第一子特征对齐,生成针对第i+1轮特征处理的第一同步子特征,并将所述第一同步子特征发送至不同节点,所述待处理特征是每个节点从原始特征中确定出的对应于所述相同用户标识集合中所有用户的特征。/n

【技术特征摘要】
1.一种特征处理方法,其特征在于,应用于数据处理设备,所述方法包括:
获取不同节点发送的原始特征对应的用户标识;
根据所述用户标识,确定相同用户标识集合,并将所述相同用户标识集合发送至所述不同节点;
若处于第一特征处理模式,且接收到每个节点针对待处理特征在第i轮特征处理后得到的第一子特征,将所述第一子特征对齐,生成针对第i+1轮特征处理的第一同步子特征,并将所述第一同步子特征发送至不同节点,所述待处理特征是每个节点从原始特征中确定出的对应于所述相同用户标识集合中所有用户的特征。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
若处于第二特征处理模式,且接收到一个节点针对待处理特征在第i轮特征处理后得到的第一子特征,根据第i轮特征处理时的第一基准子特征和第一子特征,生成针对第i+1轮特征处理的第一同步子特征,并将所述第一同步子特征发送至所述节点。


3.根据权利要求2所述的方法,其特征在于,所述根据第i轮特征处理时的第一基准子特征和第一子特征,生成针对第i+1轮特征处理的第一同步子特征,包括:
设置第i轮特征处理时的第一基准子特征对应的基准权重和第一子特征对应的第一权重,在第i轮设置的基准权重高于在第i-1轮设置的基准权重;
根据所述第一基准子特征和对应的基准权重,所述第一子特征和对应的第一权重,生成所述第一同步子特征;
根据所述第一同步子特征更新所述第一基准子特征,并将更新后的第一基准子特征作为第i+1轮的第一基准子特征。


4.根据权利要求1所述的方法,其特征在于,若所述待处理特征为矩阵,所述第一子特征是通过对所述待处理特征进行非负矩阵分解得到的子矩阵,所述方法还包括:
向所述每个节点发送针对第i+1轮特征处理的第一参数和/或第二参数,所述第一参数用于生成第一随机矩阵,所述第二参数用于生成第二随机矩阵;其中,所述第一随机矩阵和所述第二随机矩阵的行数小于所述待处理特征的行数,所述第一随机矩阵和所述第二随机矩阵的列数小于所述待处理特征的列数。


5.根据权利要求2或3所述的方法,其特征在于,若所述待处理特征为矩阵,所述第一子特征是通过对所述待处理特征进行非负特征分解得到的子矩阵,所述方法还包括:
向所述节点发送针对第i+1轮特征处理的第二参数,所述第二参数用于生成第二随机矩阵;
其中,所述第二随机矩阵的行数小于所述待处理特征的行数,或者,所述第二随机矩阵的列数小于所述待处理特征的列数。


6.一种特征处理方法,其特征在于,应用于节点,所述方法包括:
接收数据处理设备发送的相同用户标识集合,并根据所述相同用户标识集合,从所述原始特征中确定待处理特征;所述待处理特征对应于所述相同用户标识集合中的用户;
将第i轮特征处理后得到的第一子特征发送至所述数据处理设备;
接收所述数据处理设备发送的针对第i+1轮特征处理的第一同步子特征,进行第i+1轮的特征处理过程;
在进行所述第i+1轮的特征处理过程中,根据所述待处理特征和所述第一同步子特征,确定第二子特征;并根据所述待处理特征和所述第二子特...

【专利技术属性】
技术研发人员:钱宇秋
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1