数据的审核方法、装置及设备制造方法及图纸

技术编号:24709496 阅读:58 留言:0更新日期:2020-07-01 00:11
本发明专利技术实施例提供一种数据的审核方法、装置及设备,方法包括:获取样本数据,样本数据对预设的审核模型的贡献度大于或等于预设的贡献度阈值,贡献度是指样本数据对审核模型进行优化训练的贡献值;样本数据对应的标注结果满足预设标准;根据样本数据对审核模型进行优化训练;利用优化训练后的审核模型对数据进行审核。通过获取样本数据,利用样本数据对审核模型进行优化训练;实现了在众多的样本数据中,可以挑选出对审核模型贡献度较高的样本数据,减少了样本数据的数量,且保证了样本数据对审核模型进行优化训练的质量,有效地保证了对审核模型对数据进行审核的质量和效率,且在保证审核模型精度不降低的前提下,有效地降低了人工标注的成本。

【技术实现步骤摘要】
数据的审核方法、装置及设备
本专利技术涉及通信
,尤其涉及一种数据的审核方法、装置及设备。
技术介绍
随着多媒体信息的不断发展,电商平台发展的越来越迅速,电商平台可以实现商品的交易。为了提高交易率,电商平台上的卖家们都会编辑和发布有关商品的图片和/或文字信息,而为了保证电商平台运营的安全性,并且保障卖家在平台上销售的商品都是符合国家及平台的相关规定,电商平台会人工地对卖家发布的商品的标题及内容进行审核,判断其是否违规。然而,随着商品的多样性发展,商品所包含的内容越来越丰富,当卖家在电商平台上对商品进行发布时,不仅可以包含商品标题、商品主图、附图和描述图,还可以加入短视频、动态图片等内容,从而使得商品审核的人力成本大大增加,并且也降低了审核的质量和效率。
技术实现思路
本专利技术实施例提供了一种数据的审核方法、装置及设备,用以降低数据审核所需要的人力成本,并且保证审核的质量和效率。第一方面,本专利技术实施例提供一种数据的审核方法,包括:获取样本数据,其中,所述样本数据对预设的审核模型的贡献度大于或本文档来自技高网...

【技术保护点】
1.一种数据的审核方法,其特征在于,包括:/n获取样本数据,其中,所述样本数据对预设的审核模型的贡献度大于或等于预设的贡献度阈值,所述贡献度是指所述样本数据对所述审核模型进行优化训练的贡献值;并且,所述样本数据对应的标注结果满足预设标准;/n根据所述样本数据对所述审核模型进行优化训练;/n利用优化训练后的所述审核模型对数据进行审核。/n

【技术特征摘要】
1.一种数据的审核方法,其特征在于,包括:
获取样本数据,其中,所述样本数据对预设的审核模型的贡献度大于或等于预设的贡献度阈值,所述贡献度是指所述样本数据对所述审核模型进行优化训练的贡献值;并且,所述样本数据对应的标注结果满足预设标准;
根据所述样本数据对所述审核模型进行优化训练;
利用优化训练后的所述审核模型对数据进行审核。


2.根据权利要求1所述的方法,其特征在于,获取样本数据,包括:
利用预设的多个预测模型对至少一个待预测数据进行预测,获得与每个所述待预测数据相对应的多个预测结果;
根据每个待预测数据所对应的多个预测结果确定每个待预测数据的贡献度;
根据每个待预测数据的贡献度在至少一个所述待预测数据中选择至少一个待确认数据。


3.根据权利要求2所述的方法,其特征在于,在根据每个待预测数据的贡献度在至少一个所述待预测数据中选择至少一个待确认数据之后,所述方法还包括:
判断每个待确认数据对应的标注结果是否满足预设标准;
根据判断结果在至少一个所述待确认数据中选择至少一个样本数据。


4.根据权利要求2所述的方法,其特征在于,根据每个待预测数据所对应的多个预测结果确定每个待预测数据的贡献度,包括:
获取每个待预测数据所对应的多个预测结果之间的差异度;
根据所述差异度确定所述待预测数据的贡献度。


5.根据权利要求4所述的方法,其特征在于,所述待预测数据的贡献度与所述差异度呈正比。


6.根据权利要求2所述的方法,其特征在于,在利用预设的多个预测模型对至少一个待预测数据进行预测之前,所述方法还包括:
获取多个参考数据;
在多个所述参考数据中选择至少一个待预测数据。


7.根据权利要求6所述的方法,其特征在于,在多个所述参考数据中选择至少一个待预测数据,包括:
确定每个参考数据所属的类簇信息;
利用分层聚类方法在每个类簇中选择至少一个参考数据作为待预测数据。


8.根据权利要求6所述的方法,其特征在于,在多个所述参考数据中选择至少一个待预测数据,包括:
获取每个参考数据的信息熵;
将信息熵大于或等于预设阈值的至少一个参考数据确定为所述待预测数据。


9.根据权利要求1-8中任意一项所述的方法,其特征在于,在根据所述样本数据对所述审核模型进行优化训练之后,所述方法还包括:
获取所述审核模型的模型准确率;
根据所述模型准确率判断所述审核模型是否满足预设标准。


10.根据权利要求9所述的方法,其特征在于,获取所述审核模型的模型准确率,包括:
获取与所述审核模型相对应的标签数据,所述标签数据用于验证所述审核模型的模型准确率;
根据所述标签数据计算所述审核模型的模型准确率。


11.根据权...

【专利技术属性】
技术研发人员:樊珈珮熊涛
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1