数据生成方法和装置、存储介质及电子设备制造方法及图纸

技术编号:27256069 阅读:28 留言:0更新日期:2021-02-04 12:35
本发明专利技术公开了一种数据生成方法和装置、存储介质及电子设备。其中,该方法包括:获取按照预设格式存储的原始数据,其中,原始数据包括在登录有目标账号的目标平台中所检测到的历史操作数据;按照原始数据中包括的每个数据的特征类型对原始数据中包括的每个数据进行特征转换,得到训练数据;获取训练数据输入训练模型生成的样本数据,其中,训练模型是根据数据映射得出与输入数据不同且与输入数据相似度大于预定阈值的数据模型;按照样本数据中包括的每个数据的特征类型对样本数据中包括的每个数据进行特征还原,得到满足预设格式的目标数据。本发明专利技术解决了由于平台积累的行为数据较少造成的平台运营不顺畅的技术问题。较少造成的平台运营不顺畅的技术问题。较少造成的平台运营不顺畅的技术问题。

【技术实现步骤摘要】
数据生成方法和装置、存储介质及电子设备


[0001]本专利技术涉及计算机领域,具体而言,涉及一种数据生成方法和装置、存储介质及电子设备。

技术介绍

[0002]随着网上购物的发展,各种形式的购物平台活跃在人们的生活中。通常,购物平台都会保存用户在平台中产生的行为数据。
[0003]在购物平台中存在的商品推荐或者对购物平台进行压力测试时往往需要使用平台积累的行为数据。但是,在SAAS模式或者类似SAAS模式的购物平台中,由于平台类型导致的积累的行为数据较少,并不足以搭建商品推荐系统,也不足以支撑平台进行压力测试,由此导致平台运营出现问题。
[0004]针对上述的问题,目前尚未提出有效的解决方案。

技术实现思路

[0005]本专利技术实施例提供了一种数据生成方法和装置、存储介质及电子设备,以至少解决由于平台积累的行为数据较少造成的平台运营不顺畅的技术问题。
[0006]根据本专利技术实施例的一个方面,提供了一种数据生成方法,包括:获取按照预设格式存储的原始数据,其中,上述原始数据包括在登录有目标账号的目标平台中所检测到的历史操作数据;按照上述原始数据中包括的每个数据的特征类型对上述原始数据中包括的每个数据进行特征转换,得到训练数据;获取上述训练数据输入训练模型生成的样本数据,其中,上述训练模型是根据数据映射得出与输入数据不同且与输入数据相似度大于预定阈值的数据模型;按照上述样本数据中包括的每个数据的上述特征类型对上述样本数据中包括的每个数据进行特征还原,得到满足上述预设格式的目标数据。
[0007]根据本专利技术实施例的另一方面,还提供了一种数据生成装置,包括:获取模块,用于获取按照预设格式存储的原始数据,其中,上述原始数据包括在登录有目标账号的目标平台中所检测到的历史操作数据;转换模块,用于按照上述原始数据中包括的每个数据的特征类型对上述原始数据中包括的每个数据进行特征转换,得到训练数据;生成模块,用于获取上述训练数据输入训练模型生成的样本数据,其中,上述训练模型是根据数据映射得出与输入数据不同且与输入数据相似度大于预定阈值的数据模型;还原模块,用于按照上述样本数据中包括的每个数据的上述特征类型对上述样本数据中包括的每个数据进行特征还原,得到满足上述预设格式的目标数据。
[0008]根据本专利技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述数据生成方法。
[0009]根据本专利技术实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过上述计算机程序执行上述的数据
生成方法。
[0010]在本专利技术实施例中,采用将平台收集的历史行为数据按照预设格式存储为原始数据,并将原始数据按照数据的特征类型,将原始数据包括的每一个数据进行特征转换得到训练数据,将训练数据输入训练模型生成与训练数据相似但不相同的样本数据,再将样本数据中包括的每一个数据按照特征类型进行特征还原得到目标数据,由此实现了生成与原始数据相似度高但不相同的目标数据,从而增加了能够应用于平台运营的数据量,解决了由于平台积累的行为数据较少造成的平台运营不顺畅的技术问题,提升了平台运营效果。
附图说明
[0011]此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:
[0012]图1是根据本专利技术实施例的一种可选的数据生成方法的应用环境的示意图;
[0013]图2是根据本专利技术实施例的一种可选的数据生成方法的流程的示意图;
[0014]图3是根据本专利技术实施例的又一种可选的数据生成方法的流程的示意图;
[0015]图4是根据本专利技术实施例的又一种可选的数据生成方法的流程的示意图;
[0016]图5是根据本专利技术实施例的又一种可选的数据生成方法的流程的示意图;
[0017]图6是根据本专利技术实施例的又一种可选的数据生成方法的流程的示意图;
[0018]图7是根据本专利技术实施例的又一种可选的数据生成方法的流程的示意图;
[0019]图8是根据本专利技术实施例的一种可选的数据生成装置的结构示意图;
[0020]图9是根据本专利技术实施例的又一种可选的数据生成装置的结构示意图;
[0021]图10是根据本专利技术实施例的一种可选的电子设备的结构示意图。
具体实施方式
[0022]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0023]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0024]根据本专利技术实施例的一个方面,提供了一种数据生成方法,可选地,作为一种可选的实施方式,上述数据生成方法可以但不限于应用于如图1所示的环境中。终端设备102通过网络110与服务器112进行交互。
[0025]终端设备102上包括有登录用户账号的网络平台,在终端设备102将其检测到的操
作数据通过网络发送给服务器112,服务器112按照预设格式将接收到的操作数据存储为原始数据。然后将原始数据中包括的每个数据的特征类型对原始数据中包括的每个数据进行特征转换,得到训练数据。在得到训练数据后,服务器112将训练数据输入到其包含的训练模型中,生成样本数据。训练模型是根据数据映射得出与输入数据不同且与输入数据相似度大于预定阈值的数据生成模型。在得到样本数据后,服务器112将按照样本数据中包括的每个数据的特征类型对样本数据中包括的每个数据进行特征还原,得到满足预设格式的目标数据。然后服务器112通过原始数据和目标数据运行平台的推荐系统,得到平台筛选出的推荐标签,将推荐标签通过网络110发送给终端设备102。服务器112还可以通过原始数据和目标数据运行平台的测试系统,得到平台测试结果,将测试结果通过网络110发送给终端设备102。
[0026]可选地,在本实施例中,上述终端设备102可以是配置有客户端的终端设备,可以包括但不限于以下至少之一:手机(如Andro手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据生成方法,其特征在于,包括:获取按照预设格式存储的原始数据,其中,所述原始数据包括在登录有目标账号的目标平台中所检测到的历史操作数据;按照所述原始数据中包括的每个数据的特征类型对所述原始数据中包括的每个数据进行特征转换,得到训练数据;获取所述训练数据输入训练模型生成的样本数据,其中,所述训练模型是根据数据映射得出与输入数据不同且与输入数据相似度大于预定阈值的数据模型;按照所述样本数据中包括的每个数据的所述特征类型对所述样本数据中包括的每个数据进行特征还原,得到满足所述预设格式的目标数据。2.根据权利要求1所述的方法,其特征在于,所述按照所述原始数据中包括的每个数据的特征类型对所述原始数据中包括的每个数据进行特征转换包括:在所述原始数据中包括有特征类型为账号标识的原始账号数据的情况下,将所述原始账号数据转换为第一序列中对应的第一序列值,其中,所述第一序列是包括全部所述账号标识的序列;在所述原始数据中包括有特征类型为物品标识的原始物品数据的情况下,将所述原始物品数据转换为第二序列中对应的第二序列值,其中,所述第二序列是包括全部所述物品标识的序列;在所述原始数据中包括有特征类型为操作行为特征的原始行为数据的情况下,将所述原始行为数据转换为所述操作行为特征对应的编码值;在所述原始数据中包括有特征类型为操作时间特征的原始时间数据的情况下,将所述原始时间数据转换为所述操作时间特征对应的浮点值。3.根据权利要求2所述的方法,其特征在于,所述按照所述样本数据中包括的每个数据的所述特征类型对所述样本数据中包括的每个数据进行特征还原包括:在所述样本数据中包括有所述特征类型为所述账号标识的第一数据的情况下,确定所述第一数据在第三序列中对应的第三序列值,其中,所述第三序列是按照第一阈值对所述第一序列的数值范围进行拆分得到的多个数值范围序列,所述第三序列值是所述第三序列中数值范围对应标识数值;将所述第一数据还原为所述第三序列值对应的目标账号数据。4.根据权利要求2所述的方法,其特征在于,所述按照所述样本数据中包括的每个数据的所述特征类型对所述样本数据中包括的每个数据进行特征...

【专利技术属性】
技术研发人员:黄楷方依梁新敏陈羲
申请(专利权)人:上海风秩科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1