【技术实现步骤摘要】
数据源的应用效能的确定方法、装置和服务器
本说明书属于互联网
,尤其涉及数据源的应用效能的确定方法、装置和服务器。
技术介绍
随着互联网技术的发展,与应用场景匹配、数据价值高的数据资源变得越来越重要。数据使用方在针对某个应用场景进行数据处理时,往往希望拥有数据量较大、内容较全面、维度较细,且与该应用场景匹配的数据源。通过上述数据源,数据使用方可以获得大量在该应用场景下应用效果较好、参考价值较高的业务数据。进一步可以利用上述业务数据较为准确地理解、描绘出该应用场景中数据的联系和规律,进而能较好地进行针对应用场景的具体的数据处理。因此,亟需一种能够较为准确地评价判断数据源针对应用场景的应用效能的方法。
技术实现思路
本说明书提供了一种数据源的应用效能的确定方法、装置和服务器,以达到能够较为准确、全面地评价目标数据源针对目标应用场景的数据价值。本说明书提供的一种数据源的应用效能的确定方法、装置和服务器是这样实现的:一种数据源的应用效能的确定方法,包括:从目标数据源中获取多个 ...
【技术保护点】
1.一种数据源的应用效能的确定方法,包括:/n从目标数据源中获取多个数据作为针对目标应用场景的测试数据;/n获取与目标应用场景对应的已有业务数据,作为样本数据;/n根据所述样本数据和所述测试数据,确定所述测试数据针对目标应用场景的相关性参数、准确率参数,和潜在价值参数,其中,所述潜在价值参数用于表征测试数据中当前与样本数据不匹配的测试数据转化为与目标应用场景对应的业务数据所产生的价值增益;/n根据所述测试数据针对目标应用场景的相关性参数、准确率参数,和潜在价值参数,确定目标数据源针对目标应用场景的应用效能。/n
【技术特征摘要】
1.一种数据源的应用效能的确定方法,包括:
从目标数据源中获取多个数据作为针对目标应用场景的测试数据;
获取与目标应用场景对应的已有业务数据,作为样本数据;
根据所述样本数据和所述测试数据,确定所述测试数据针对目标应用场景的相关性参数、准确率参数,和潜在价值参数,其中,所述潜在价值参数用于表征测试数据中当前与样本数据不匹配的测试数据转化为与目标应用场景对应的业务数据所产生的价值增益;
根据所述测试数据针对目标应用场景的相关性参数、准确率参数,和潜在价值参数,确定目标数据源针对目标应用场景的应用效能。
2.根据权利要求1所述的方法,根据所述样本数据和所述测试数据,确定所述测试数据针对目标应用场景的相关性参数、准确率参数,和潜在价值参数,包括:
利用所述样本数据,对所述测试数据进行验证性测试,得到对应的测试结果,其中,所述样本数据包括正样本数据和负样本数据;
根据所述测试结果,确定测试数据中与正样本数据匹配的数据量、与负样本数据匹配的数据量、与样本数据不匹配的数据量;
根据测试数据中与正样本数据匹配的数据量、与负样本数据匹配的数据量、与样本数据不匹配的数据量,以及样本数据中的正样本数据的数据量、负样本数据的数据量,确定出所述测试数据针对目标应用场景的相关性参数、准确率参数,和潜在价值参数。
3.根据权利要求2所述的方法,确定测试数据针对目标应用场景的相关性参数,包括:
根据目标应用场景的场景要求,确定相关度的预设期望;
计算测试数据中与正样本数据匹配的数据量、与负样本数据匹配的数据量的和,与样本数据中的正样本数据的数据量、负样本数据的数据量的和的比值,作为相关度的测试结果;
计算并根据所述相关度的预设期望与相关度的测试结果的比值,确定出测试数据针对目标应用场景的相关性参数。
4.根据权利要求2所述的方法,确定测试数据针对目标应用场景的准确率参数,包括:
计算测试数据中与被关注的样本数据匹配的数据量,与测试数据中与正样本数据匹配的数据量、与负样本数据匹配的数据量的和的比值,作为测试数据的准确率;
计算样本数据中被关注的样本数据的数据量,与样本数据中负样本数据的数据量、正样本数据的数据量的和的比值,作为样本数据的准确率;
计算并根据所述测试数据的准确率与样本数据的准确率的比值,确定出测试数据针对目标应用场景的准确率参数。
5.根据权利要求2所述的方法,确定测试数据针对目标应用场景的潜在价值参数,包括:
根据测试数据中与正样本数据匹配的数据量、与负样本数据匹配的数据量,预测测试数据中与样本数据不匹配的测试数据转化为与目标应用场景对应的业务数据的转化率;
根据所述转化率,计算测试数据中与样本数据不匹配的测试数据中潜在的被关注的样本数据的数据量;
根据所述测试数据中与样本数据不匹配的测试数据中潜在的被关注的样本数据的数据量,确定测试数据针对目标应用场景的潜在价值参数。
6.根据权利要求1所述的方法,在根据所述测试数据针对目标应用场景的相关性参数、准确率参数,和潜在价值参数,确定目标数据源针对目标应用场景的应用效能后,所述方法还包括:
根据所述目标数据源针对目标应用场景的应用效能,确定目标数据源的数据价值;并根据目标数据源的数据价值,确定是否将目标数据源接入目标应用场景。
7.根据权利要求6所述的方法,在确定将目标数据源接入目标应用场景中的情况下,所述方法还包括:
获取目标数据源中的数据作为训练数据;
利用所述训练数据,训练针对目标应用场景的数据处理模型。
8.一种数据源的应用效能的确定装置,包括:
第一获取...
【专利技术属性】
技术研发人员:张敏,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。