样本对齐方法、系统及计算机可读存储介质技术方案

技术编号:20369415 阅读:60 留言:0更新日期:2019-02-16 19:46
本发明专利技术公开了一种样本对齐方法、系统及计算机可读存储介质,其中,样本对齐方法,通过获取样本对齐发起方样本的样本编号、用户编号、样本特征和时间信息,获取样本接收方样本的用户编号、样本特征和时间信息;对用户编号进行交互加密,比较加密后的用户编号得到交集部分;基于时间信息,将交集部分中接收方样本中同一用户编号对应的相同时间信息的样本,用发起方对应的第一样本编号进行标记,得到目标样本;将各第一样本编号与其对应目标样本中接收方和发起方的样本特征进行样本对齐。使用哈希和RSA加密算法对数据交互过程进行加密,使用样本编号和时间信息实现样本信息的对齐,在保证样本信息安全的前提下通过时间信息实现样本的对齐。

Sample Alignment Method, System and Computer Readable Storage Media

The invention discloses a sample alignment method, system and computer readable storage medium, in which the sample alignment method obtains the user number, sample characteristics and time information of the sample recipient sample by acquiring the sample number, user number, sample characteristics and time information of the sample alignment initiator sample; interactively encrypts the user number and compares the encrypted use. Based on the time information, the sample of the same time information corresponding to the same user number in the sample of the receiver in the intersection part is labeled with the first sample number corresponding to the initiator, and the target sample is obtained. The first sample number is aligned with the sample characteristics of the recipient and initiator in the corresponding target sample. Hash and RSA encryption algorithms are used to encrypt the data interaction process. Sample number and time information are used to align the sample information. Sample alignment is achieved by time information on the premise of ensuring the information security of the sample.

【技术实现步骤摘要】
样本对齐方法、系统及计算机可读存储介质
本专利技术涉及数据交互隐私保护
,尤其涉及一种样本对齐方法、系统及计算机可读存储介质。
技术介绍
在数据信息爆炸的时代,数据的网络传输、数据交互范围逐步扩大,为人们信息共享提供便捷,但是在数据网络传输、数据交互过程中存在安全隐患,数据信息被窃取,隐私可能暴露给不可信的第三方,而且在数据传输、数据交互过程中,容易出现信息的不对称性,数据信息中样本编号或者用户编号不同,无法实现数据之间准确的共享,因而,无法在保证数据安全的前提下,进行数据之前准确的对齐共享。
技术实现思路
本专利技术的主要目的在于提供一种样本对齐方法、系统及计算机可读存储介质,旨在解决现有的数据交互过程中数据信息安全性低和数据信息无法对齐的技术问题。为实现上述目的,本专利技术提供一种样本对齐方法,所述样本对齐方法包括步骤:获取样本对齐发起方样本的第一样本编号、第一用户编号、第一样本特征和第一时间信息,获取样本接收方样本的第二用户编号、第二样本特征和第二时间信息;对第一用户编号和第二用户编号进行交互加密,通过比较加密后的第一用户编号和第二用户编号得到交集部分;基于第一时间信息和第二时间信息,将所述交集部分中接收方样本中同一用户编号对应的相同时间信息的样本,用发起方对应的第一样本编号进行标记,得到接收方和发起方的目标样本;将各第一样本编号与其对应目标样本中发起方的第一样本特征和接收方的第二样本特征进行样本对齐。可选地,所述对第一用户编号和第二用户编号进行交互加密的步骤,还包括:控制样本对齐的发起方和接收方分别对发起方的第一用户编号和接收方的第二用户编号进行去重;基于哈希和RSA加密算法对去重之后的第一用户编号和第二用户编号进行交互加密。可选地,所述对第一用户编号和第二用户编号进行交互加密的步骤包括:基于哈希和RSA加密算法控制接收方通过公钥对第二用户编号进行加密,将加密后的第二用户编号发送给发起方;控制发起方对公钥加密之后的第二用户编号通过私钥进行加密,再将私钥加密后的第二用户编号发送给接收方;控制接收方对私钥加密后的第二用户编号的哈希值再进行哈希,得到加密的第二用户编号,以实现基于哈希和RSA加密算法对第二用户编号进行交互加密。可选地,所述对第一用户编号和第二用户编号进行交互加密的步骤包括:基于哈希和RSA加密算法控制发起方通过私钥对第一用户编号的哈希进行加密;控制发起方对私钥加密后的第一用户编号的哈希值再进行哈希,得到加密的第一用户编号,将加密后的第一用户编号发送给接收方;以实现基于哈希和RSA加密算法对第一用户编号进行交互加密。可选地,所述通过比较加密后的第一用户编号和第二用户编号得到交集部分的步骤包括:控制接收方对加密后的第一用户编号和第二用户编号进行比较,得到接收方和发起方的交集;保留相同的用户编号的交集部分,将所述交集部分传送给发起方,以供接收方和发起方获得交集部分的用户编号。可选地,所述保留相同的用户编号的交集部分,将所述交集部分传送给发起方,以供接收方和发起方获得交集部分的用户编号的步骤包括:发起方将位于交集部分的用户编号以及其对应的第一样本编号和第一样本编号对应的第一时间信息截断脱敏发送给接收方,以供接收方和发起方获得交集部分的用户编号。可选地,所述获取样本对齐发起方样本的第一样本编号、第一用户编号、第一样本特征和第一时间信息,获取样本接收方样本的第二用户编号、第二样本特征和第二时间信息的步骤之前,还包括:确定样本对齐发起方和接收方之间的可信度;若所述发起方和接收方之间为可信交互端,则执行获取样本对齐发起方样本的第一样本编号、第一用户编号、第一样本特征和第一时间信息,获取样本接收方样本的第二用户编号、第二样本特征和第二时间信息的步骤。可选地,所述通过所述第一样本编号实现发起方和接收方的样本对齐的步骤之后,还包括:获取发起方样本的类别标签,确定样本对齐后对应的类别标签;根据所述样本对齐后对应的类别标签实现根据样本信息进行模型训练和机器学习。此外,为实现上述目的,本专利技术还提供一种样本对齐系统,所述样本对齐系统包括接收方、发起方、存储器、处理器和存储在所述存储器上并可在所述处理器上运行的样本对齐程序,所述样本对齐程序被所述处理器执行时实现如上述的样本对齐方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有样本对齐程序,所述样本对齐程序被处理器执行时实现如上述的样本对齐方法的步骤。本专利技术提供一种样本对齐方法,通过获取样本对齐发起方样本的第一样本编号、第一用户编号、第一样本特征和第一时间信息,获取样本接收方样本的第二用户编号、第二样本特征和第二时间信息;对第一用户编号和第二用户编号进行交互加密,通过比较加密后的第一用户编号和第二用户编号得到交集部分;基于第一时间信息和第二时间信息,将所述交集部分中接收方样本中同一用户编号对应的相同时间信息的样本,用发起方对应的第一样本编号进行标记,得到接收方和发起方的目标样本;将各第一样本编号与其对应目标样本中发起方的第一样本特征和接收方的第二样本特征进行样本对齐。使用哈希和RSA加密算法对数据交互过程中样本信息进行加密,使用样本编号和时间信息实现样本信息的对齐,在保证样本信息安全的前提下通过时间信息实现样本的对齐。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的结构示意图;图2为本专利技术样本对齐方法一实施例的流程示意图;图3为本专利技术样本对齐方法一应用实施例样本对齐后样本示意图;图4为本专利技术样本对齐方法一实施例的样本加密计算交集的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的结构示意图。需要说明的是,图1即可为样本对齐系统的硬件运行环境的结构示意图。本专利技术实施例样本对齐系统可以包括PC,便携计算机、智能手机等终端设备。如图1所示,该样本对齐系统可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。本领域技术人员可以理解,图1中示出的样本对齐系统的结构并不构成对样本对齐系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及样本对齐程序。其中,操作系统是管理和控制样本对齐系统硬件和软件资源的程序,支持样本对齐程序以及其它软件或程序的运行。在图1所示的样本对齐系统中,用户接口1003主要用于获取业务请求;网络接口1004主要本文档来自技高网...

【技术保护点】
1.一种样本对齐方法,其特征在于,所述样本对齐方法包括以下步骤:获取样本对齐发起方样本的第一样本编号、第一用户编号、第一样本特征和第一时间信息,获取样本接收方样本的第二用户编号、第二样本特征和第二时间信息;对第一用户编号和第二用户编号进行交互加密,通过比较加密后的第一用户编号和第二用户编号得到交集部分;基于第一时间信息和第二时间信息,将所述交集部分中接收方样本中同一用户编号对应的相同时间信息的样本,用发起方对应的第一样本编号进行标记,得到接收方和发起方的目标样本;将各第一样本编号与其对应目标样本中发起方的第一样本特征和接收方的第二样本特征进行样本对齐。

【技术特征摘要】
1.一种样本对齐方法,其特征在于,所述样本对齐方法包括以下步骤:获取样本对齐发起方样本的第一样本编号、第一用户编号、第一样本特征和第一时间信息,获取样本接收方样本的第二用户编号、第二样本特征和第二时间信息;对第一用户编号和第二用户编号进行交互加密,通过比较加密后的第一用户编号和第二用户编号得到交集部分;基于第一时间信息和第二时间信息,将所述交集部分中接收方样本中同一用户编号对应的相同时间信息的样本,用发起方对应的第一样本编号进行标记,得到接收方和发起方的目标样本;将各第一样本编号与其对应目标样本中发起方的第一样本特征和接收方的第二样本特征进行样本对齐。2.如权利要求1所述的样本对齐方法,其特征在于,所述对第一用户编号和第二用户编号进行交互加密的步骤,还包括:控制样本对齐的发起方和接收方分别对发起方的第一用户编号和接收方的第二用户编号进行去重;基于哈希和RSA加密算法对去重之后的第一用户编号和第二用户编号进行交互加密。3.如权利要求1所述的样本对齐方法,其特征在于,所述对第一用户编号和第二用户编号进行交互加密的步骤包括:基于哈希和RSA加密算法控制接收方通过公钥对第二用户编号进行加密,将加密后的第二用户编号发送给发起方;控制发起方对公钥加密之后的第二用户编号通过私钥进行加密,再将私钥加密后的第二用户编号发送给接收方;控制接收方对私钥加密后的第二用户编号的哈希值再进行哈希,得到加密的第二用户编号,以实现基于哈希和RSA加密算法对第二用户编号进行交互加密。4.如权利要求3所述的样本对齐方法,其特征在于,所述对第一用户编号和第二用户编号进行交互加密的步骤包括:基于哈希和RSA加密算法控制发起方通过私钥对第一用户编号的哈希进行加密;控制发起方对私钥加密后的第一用户编号的哈希值再进行哈希,得到加密的第一用户编号,将加密后的第一用户编号发送给接收方;以实现基于哈希和RSA加密算法对第一用户编号进行交互加密。5.如权利要求4所述的样本对齐方法,其特征...

【专利技术属性】
技术研发人员:范涛张润杰马国强刘洋陈天健杨强
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1