数据集获取方法、装置、电子设备和计算机可读介质制造方法及图纸

技术编号:41212322 阅读:13 留言:0更新日期:2024-05-09 23:35
本公开的实施例公开了数据集获取方法、装置、电子设备和计算机可读介质。该方法的一具体实施方式包括:获取数据意图信息和数据领域信息;获取至少一个数据集;对于每个数据集,执行第一生成步骤:根据数据意图信息,利用生成式模型,生成添加属性集;生成目标属性数据集;将该目标属性数据集添加至该数据集,得到添加后数据集;利用属性合理信息生成模型,确定属性合理信息;根据该属性合理信息,生成候选数据集;生成价值流转信息;对至少一个候选数据集进行价值区间归置,以生成关联信息;在该目标用户终端显示数据选择区域集。该实施方式通过确定价值流转信息,可以准确地为对应的目标用户提供所需的高质量数据集。

【技术实现步骤摘要】

本公开的实施例涉及计算机,具体涉及数据集获取方法、装置、电子设备和计算机可读介质


技术介绍

1、目前,随着大数据时代的来临,数据集成为各个企业和用户的重要价值资产。对于数据集的获取,通常采用的方式为:相关技术人员人为根据用户所需的数据集进行数据集的导出,以让用户获取所需的数据集。

2、然而,专利技术人发现,当采用上述方式来获取数据集,经常会存在如下技术问题一:

3、所存储的数据集可能数据存在残缺,导致用户所获取的数据集可用性比较差。除此之外,相关技术人员可能不能有效了解用户的数据集需求,导致所得到的数据集不是用户所想要的。

4、继续的,在采用技术方案来解决不能准确地获取高质量的所需的数据集的技术问题的过程中,高质量的候选数据集的精准生成往往又取决于目标属性数据集的精准生成,如何生成精准的目标属性数据集成为关键。针对目标数据产品的价值精准定位,常规的解决方案一般是:通过搜取相关添加属性集对应的数据集。然而,上述解决方案存在如下技术问题二:

5、所得到的目标属性集与原有数据集之间存在数据不匹配的问题,导致后续所本文档来自技高网...

【技术保护点】

1.一种数据集获取方法,包括:

2.根据权利要求1所述的方法,其中,所述生成式模型包括:属性关联关系判断模型和属性生成模型;以及

3.根据权利要求2所述的方法,其中,所述根据所述属性合理信息,生成针对所述添加后数据集的候选数据集,包括:

4.根据权利要求3所述的方法,其中,所述生成针对所述候选数据集的价值流转信息,包括:

5.根据权利要求4所述的方法,其中,所述根据所得到的至少一个价值流转信息,对所得到的至少一个候选数据集进行价值区间归置,以生成表征候选数据集和价值区间之间关联关系的关联信息,包括:

6.根据权利要求5所述的方法...

【技术特征摘要】

1.一种数据集获取方法,包括:

2.根据权利要求1所述的方法,其中,所述生成式模型包括:属性关联关系判断模型和属性生成模型;以及

3.根据权利要求2所述的方法,其中,所述根据所述属性合理信息,生成针对所述添加后数据集的候选数据集,包括:

4.根据权利要求3所述的方法,其中,所述生成针对所述候选数据集的价值流转信息,包括:

5.根据权利要求4所述的方法,其中,所述根据所得到的至少一个价值流转信息,对所得到的至少一个候选数据集进行价值区间归置,以生成表...

【专利技术属性】
技术研发人员:张燕钟一同
申请(专利权)人:朴道征信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1