检测数据的方法和装置制造方法及图纸

技术编号:14765737 阅读:48 留言:0更新日期:2017-03-08 10:07
本申请公开了一种检测数据的方法和装置。其中,该方法包括:读取基于标注样本的样本权重确定的置信区间,其中,样本权重为通过权重模型对预先获取的标注样本进行训练而得到;判断待校验数据是否在置信区间,得到第一判断结果;根据第一判断结果,判断待校验数据是否为合法数据,得到第二判断结果。本申请解决了校验数据的合法性时校验结果准确性低的技术问题,实现了准确地校验数据合法性的效果。

【技术实现步骤摘要】

本申请涉及数据处理领域,具体而言,涉及一种检测数据的方法和装置
技术介绍
在互联网虚拟交易平台中,各类虚拟对象的虚拟资源数据混杂在一起,为了更好的管理和区分这些数据的合法性,可以基于数据置信区间区分账户(如商家)发布的虚拟资源数据(如手机价格)是否合法。现在电子商务网站上各类商家发布的各种类别的商品的价格不一且数量庞大,依靠人工判别来确定数据归类的问题,耗费很大的人工成本,且人工判别存在较大的主观性,判断结果不准确。现有技术中提供了一种数据置信区间估计方法,该方法在预处理数据之后,直接计算数据的均值和方差,并根据设定的方差倍数,确定估计的数据置信区间(即上限值和下限值),来判断数据是否分布在该类数据置信区间内以对数据分类。该现有数据置信区间估计方法仅仅依据数据值的均值和方差确定置信区间,确定的置信区间不准确,从而导致判别新的待校验的数据的准确性和稳定性较低。针对上述校验数据的合法性时校验结果准确性低的问题,目前尚未提出有效的解决方案。
技术实现思路
本申请实施例提供了一种检测数据的方法和装置,以至少解决校验数据的合法性时校验结果准确性低的技术问题。根据本申请实施例的一个方面,提供了一本文档来自技高网...
检测数据的方法和装置

【技术保护点】
一种检测数据的方法,其特征在于,包括:读取基于标注样本的样本权重确定的置信区间,其中,所述样本权重为通过权重模型对预先获取的所述标注样本进行训练而得到;判断待校验数据是否在所述置信区间,得到第一判断结果;根据第一判断结果,判断所述待校验数据是否为合法数据,得到第二判断结果。

【技术特征摘要】
1.一种检测数据的方法,其特征在于,包括:读取基于标注样本的样本权重确定的置信区间,其中,所述样本权重为通过权重模型对预先获取的所述标注样本进行训练而得到;判断待校验数据是否在所述置信区间,得到第一判断结果;根据第一判断结果,判断所述待校验数据是否为合法数据,得到第二判断结果。2.根据权利要求1所述的方法,其特征在于,在读取基于标注样本的样本权重确定的置信区间之前,所述方法包括:获取多个所述标注样本,其中,每个所述标注样本具有样本值;提取各个所述标注样本的属性数据,基于各个所述标注样本的属性数据建立所述权重模型;通过所述权重模型训练所述标注样本,得到各个所述标注样本的样本权重;提取各个所述标注样本中的样本值,其中,所述样本值用于表征所述标注样本所描述的对象对应的虚拟资源参数;基于各个所...

【专利技术属性】
技术研发人员:谢世鹏
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1