一种数据开放输出方法、装置和计算设备制造方法及图纸

技术编号:26377004 阅读:62 留言:0更新日期:2020-11-19 23:45
本发明专利技术公开了一种数据开放输出方法,在计算设备中执行,该计算设备中存储有M×N的第一稀疏矩阵,并根据该矩阵训练了嵌入模型,该模型适于将输入的稀疏矩阵分解为至少三个子矩阵,并将其中两个子矩阵重构为输出矩阵,该方法包括:获取待输出数据的L个用户标识,并提取各用户标识所对应的N个用户特征的原始数据,生成L×N的第二稀疏矩阵;将第二稀疏矩阵拼接到第一稀疏矩阵中得到第三稀疏矩阵;将第一稀疏矩阵更新为第三稀疏矩阵,并采用第三稀疏矩阵对嵌入模型进行再训练得到新嵌入模型;以及采用新嵌入模型对第二稀疏矩阵进行学习,得到对应的输出矩阵,并将该输出矩阵进行开放输出。本发明专利技术还公开了对应的数据开放输出装置和计算设备。

【技术实现步骤摘要】
一种数据开放输出方法、装置和计算设备
本专利技术涉及互联网
,尤其涉及一种数据开放输出方法、装置和计算设备。
技术介绍
随着互联网技术的快速发展和电子商务的日渐普及,网络信息资源的数量急剧增长,信息提供商总是希望能够获取更多的用户数据,以便根据用户偏好来推荐其可能感兴趣的商品资源。现有的数据提供方在对数据使用方(信息提供商)输出数据时,大部分都是将原始数据以明文的方式直接输出,这样会导致用户的隐私泄漏问题。而如果将原始数据加工为标签一类的数据进行输出,则会漏损很多用户信息,数据使用方根据这些数据来向客户对应推荐最合适的商品资源,推荐效果会大大折扣,影响产品的落地转化率。因此,需要提供一种更好既能保护用户隐私,又能输出更多用户信息的数据输出方法。
技术实现思路
为此,本专利技术提供一种数据开放输出方法、装置和计算设备,以力图解决或至少缓解上面存在的问题。根据本专利技术的一个方面,提供一种数据开放输出方法,适于在计算设备中执行,所述计算设备中存储有M×N的第一稀疏矩阵,并根据该矩阵训练了用于进行数据开放输出的嵌入模型,嵌入模型适于将输入的稀疏矩阵分解为至少三个子矩阵,并将其中两个子矩阵重构为输出矩阵,该方法包括:获取待输出数据的L个用户标识,并提取各用户标识所对应的N个用户特征的原始数据,生成L×N的第二稀疏矩阵;将第二稀疏矩阵拼接到所述第一稀疏矩阵中,得到第三稀疏矩阵;将所存储的第一稀疏矩阵更新为第三稀疏矩阵,并采用该第三稀疏矩阵对嵌入模型进行再训练,得到新嵌入模型;以及采用新嵌入模型对第二稀疏矩阵进行学习,得到该第二稀疏矩阵的输出矩阵,并将该输出矩阵进行开放输出,以便数据使用方根据该输出矩阵进行用户行为预测。可选地,在根据本专利技术的方法中,数据使用方中训练有预测模型,该预测模型根据该输出矩阵输出对应的用户行为预测结果。可选地,在根据本专利技术的方法中,数据使用方通过从计算设备中获取多个用户的输出矩阵和对应的用户行为特征来对预测模型进行训练。可选地,在根据本专利技术的方法中,嵌入模型为奇异值分解模型,所述奇异值分解模型适于将输入的稀疏矩阵分解为第一酉矩阵U、奇异值矩阵S和第二酉矩阵V,并将U和S两个子矩阵重构为输出矩阵。可选地,在根据本专利技术的方法中,将U和S两个子矩阵重构为输出矩阵的步骤包括:截取U子矩阵的前K列得到U截断矩阵,截取S子矩阵的前K行和前K列得到S截断矩阵,并将U截断矩阵子和S截断矩阵相乘得到输出矩阵。可选地,在根据本专利技术的方法中,嵌入模型为词向量模型或变分自编码器模型中。可选地,在根据本专利技术的方法中,用户特征包括安装应用、地理位置、地理位置偏好、设备信息和设备联网信息中的至少一类。可选地,在根据本专利技术的方法中,计算设备中还存储有各用户标识所对应的唯一企业标识,用户特征的原始数据以所述唯一企业标识为索引进行存储。可选地,在根据本专利技术的方法中,提取各用户标识所对应的N个用户特征的原始数据的步骤包括:检索各用户标识所对应的唯一企业标识,并以该唯一企业标识为索引来提取相对应的原始数据。可选地,在根据本专利技术的方法中,其中,计算设备中为每个数据使用方均存储有对应的第一稀疏矩阵和根据该矩阵训练的嵌入模型;获取待输出数据的L个用户标识的步骤包括:接收某数据使用方发送的所述L个用户标识;将所述第二稀疏矩阵拼接到第一稀疏矩阵中的步骤包括:将第二稀疏矩阵拼接到该数据使用方所对应的第一稀疏矩阵中,得到对应的第三稀疏矩阵;将所存储的第一稀疏矩阵更新为所述第三稀疏矩阵的步骤包括:将所存储的该数据使用方的第一稀疏矩阵更新为第三稀疏矩阵。根据本专利技术的另一个方面,提供一种数据开放输出装置,适于驻留在计算设备中,计算设备中存储有M×N的第一稀疏矩阵,并根据该矩阵训练了用于进行数据开放输出的嵌入模型,嵌入模型适于将输入的稀疏矩阵分解为至少三个子矩阵,并将其中两个子矩阵重构为输出矩阵,该装置包括:数据提取模块,适于获取待输出数据的L个用户标识,并采集各用户标识所对应的N个用户特征的原始数据,生成L×N的第二稀疏矩阵;矩阵拼接模块,适于将第二稀疏矩阵拼接到第一稀疏矩阵中,得到第三稀疏矩阵;模型再训练模块,适于将所存储的第一稀疏矩阵更新为第三稀疏矩阵,并采用该第三稀疏矩阵对嵌入模型进行再训练,得到新嵌入模型;以及数据输出模块,适于采用新嵌入模型对第二稀疏矩阵进行学习,得到该第二稀疏矩阵的输出矩阵,并将该输出矩阵进行开放输出,以便数据使用方根据该输出矩阵进行用户行为预测。可选地,在根据本专利技术的装置中,数据使用方中训练有预测模型,该预测模型根据该输出矩阵输出对应的用户行为预测结果。可选地,在根据本专利技术的装置中,数据使用方通过从计算设备中获取多个用户的输出矩阵和对应的用户行为特征来对预测模型进行训练。可选地,在根据本专利技术的装置中,嵌入模型为奇异值分解模型,奇异值分解模型适于将输入的稀疏矩阵分解为第一酉矩阵U、奇异值矩阵S和第二酉矩阵V,并将U和S两个子矩阵重构为输出矩阵。可选地,在根据本专利技术的装置中,奇异值分解模型适于截取U子矩阵的前K列得到U截断矩阵,截取S子矩阵的前K行和前K列得到S截断矩阵,并将U截断矩阵子和S截断矩阵相乘得到输出矩阵。根据本专利技术的又一个方面,提供一种计算设备,包括至少一个处理器;以及包括计算机程序指令的至少一个存储器;所述至少一个存储器和所述计算机程序指令被配置为与所述至少一个处理器一起使得所述计算设备执行如上所述的数据开放输出方法。根据本专利技术的又一个方面,提供一种存储一个或多个程序的可读存储介质,所述一个或多个程序包括指令,所述指令当由计算设备执行时,使得所述计算设备执行如上所述的数据开放输出方法。根据本专利技术的技术方案,构建了嵌入模型,该模型能够将输入的稀疏矩阵分解为至少三个子矩阵,并将其中两个子矩阵重构为输出矩阵,该输出矩阵不包含用户的隐私信息,但又代表了用户的隐含表征,能够最大限度的为数据使用(接收)方提供所需要的用户行为特征数据。本专利技术首先根据初始存储的M×N的第一稀疏矩阵作为训练集来训练嵌入模型,其中M代表M个用户标识,N代表有N个用户特征。若需要给数据使用方输出某L个用户标识的对应数据,则先提取这些用户标识所对应的N个用户特征的原始数据,生成L×N的第二稀疏矩阵,并将该第二稀疏矩阵拼接到第一稀疏矩阵中,得到(M+L)×N的第三稀疏矩阵。之后,将作为训练集的第一稀疏矩阵更新为第三稀疏矩阵,并根据该第三稀疏矩阵对嵌入模型进行再次训练,得到新嵌入模型。最后,再用该新嵌入模型对该第二稀疏矩阵进行学习,得到对应的输出矩阵后输出给数据使用方。这样,每次在需要输出数据之前,都会先再次训练下模型,提高模型的精度,进而为数据使用方提供更好的输出结果。也就是,本专利技术以机器学习的方式对原始数据进行数据变换和隐含表征提取,将变换后的数据对外输出。这种输出数据无法被人类理解,但可以被数据使用方的机器学习模型理解并加以使用。数据使用方会根据输出矩阵进行预测模型建模,根据该输出矩阵就能得到对应的用户行为预测结果。本发本文档来自技高网...

【技术保护点】
1.一种数据开放输出方法,适于在计算设备中执行,所述计算设备中存储有M×N的第一稀疏矩阵,并根据该矩阵训练了用于进行数据开放输出的嵌入模型,所述嵌入模型适于将输入的稀疏矩阵分解为至少三个子矩阵,并将其中两个子矩阵重构为输出矩阵,该方法包括:/n获取待输出数据的L个用户标识,并提取各用户标识所对应的N个用户特征的原始数据,生成L×N的第二稀疏矩阵;/n将所述第二稀疏矩阵拼接到所述第一稀疏矩阵中,得到第三稀疏矩阵;/n将所存储的第一稀疏矩阵更新为所述第三稀疏矩阵,并采用该第三稀疏矩阵对所述嵌入模型进行再训练,得到新嵌入模型;以及/n采用所述新嵌入模型对所述第二稀疏矩阵进行学习,得到该第二稀疏矩阵的输出矩阵,并将该输出矩阵进行开放输出,以便数据使用方根据该输出矩阵进行用户行为预测。/n

【技术特征摘要】
1.一种数据开放输出方法,适于在计算设备中执行,所述计算设备中存储有M×N的第一稀疏矩阵,并根据该矩阵训练了用于进行数据开放输出的嵌入模型,所述嵌入模型适于将输入的稀疏矩阵分解为至少三个子矩阵,并将其中两个子矩阵重构为输出矩阵,该方法包括:
获取待输出数据的L个用户标识,并提取各用户标识所对应的N个用户特征的原始数据,生成L×N的第二稀疏矩阵;
将所述第二稀疏矩阵拼接到所述第一稀疏矩阵中,得到第三稀疏矩阵;
将所存储的第一稀疏矩阵更新为所述第三稀疏矩阵,并采用该第三稀疏矩阵对所述嵌入模型进行再训练,得到新嵌入模型;以及
采用所述新嵌入模型对所述第二稀疏矩阵进行学习,得到该第二稀疏矩阵的输出矩阵,并将该输出矩阵进行开放输出,以便数据使用方根据该输出矩阵进行用户行为预测。


2.如权利要求1所述的方法,其中,所述数据使用方中训练有预测模型,所述预测模型根据所述输出矩阵输出对应的用户行为预测结果。


3.如权利要求2所述的方法,其中,所述数据使用方通过从所述计算设备中获取多个用户的输出矩阵和对应的用户行为特征来对所述预测模型进行训练。


4.如权利要求1-3中任一项所述的方法,其中,所述嵌入模型为奇异值分解模型,所述奇异值分解模型适于将输入的稀疏矩阵分解为第一酉矩阵U、奇异值矩阵S和第二酉矩阵V,并将U和S两个子矩阵重构为输出矩阵。


5.如权利要求4所述的方法,其中,所述将U和S两个子矩阵重构为输出矩阵的步骤包括:
截取U子矩阵的前K列生成U截断矩阵,截取S子矩阵的前K行和前K列生成S截断矩阵,并将U截断矩阵子和S截断矩阵相乘得到所述输出矩阵。

...

【专利技术属性】
技术研发人员:刘勇江李想卢健殷尧
申请(专利权)人:北京腾云天下科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1