This application provides an algorithm for model checking method, device, equipment and system, the system includes: evaluation module, the evaluation model for the algorithm towards information evaluation, the algorithm model including the algorithm model and algorithm model to measure the history, the history of the algorithm of the model is tested before the algorithm model iteration model; algorithm model for determining the correct rate of detection module, tested the algorithm model; algorithm model training module for training according to the training sample set by the algorithm model. The result of user evaluation information is processed by the historical algorithm model to detect the accuracy rate of users' evaluation information processed by the algorithm model. The accuracy of the algorithm is improved, and the speed of algorithm model is improved without manual testing algorithm model.
【技术实现步骤摘要】
算法模型检测方法、装置、设备及系统
本申请涉及互联网技术,尤其涉及一种算法模型检测方法及装置。
技术介绍
现有技术中,算法模型如同人类的认知模式,需要不断被更正、不断被训练,具体地,算法模型在处理样本数据的过程中,不断地更改其自身的参数,使得算法模型不断的被迭代,但是,如果任其不断的迭代,不对迭代后的算法模型进行测试,将无法确定迭代后的算法模型是否能够按照预设的正确率处理样本数据。现有技术对算法模型的测试方法有以下两种方法:一种是人工测试,例如,算法模型对100个样本数据进行了处理得到100个结果,该100个结果中有处理正确的结果,也有处理错误的结果,为了验证算法模型的正确率,人工判断该100个结果中有多少个正确结果,多少个错误结果,以评估算法模型的正确率和/或错误率。但是,当算法模型需要处理大量的样本数据,且算法模型的迭代周期较短时,人工测试的效率较低。另一种是预先建立两个数据集,一个数据集中的数据实际是正确的,另一个数据集中的数据实际是错误的,算法模型依次处理这两个数据集中的数据,产生每个数据对应的处理结果,根据每个数据对应的处理结果和该数据自身的正确与否,确定该算法模型的正确率和/或错误率。但是,算法模型实际处理的数据并不局限于这两个数据集中的数据,若将算法模型处理预设数据的正确率和/或错误率作为算法模型处理非预设数据的正确率和/或错误率,同样无法准确的检测出算法模型的正确率和/或错误率。因此,现有技术缺乏一种既准确又快速的算法模型的测试方法。
技术实现思路
本申请提供一种算法模型检测方法、装置、设备及系统,以快速精确的检测算法模型。一个方面,本申请提供 ...
【技术保护点】
一种信息评测系统,其特征在于,包括:评测模块,用于通过算法模型对待评测的信息进行评测,所述算法模型包括待测算法模型和历史算法模型,所述历史算法模型是所述待测算法模型的前一次迭代模型;算法模型检测模块,用于获取待测算法模型对应的第一样本集和历史算法模型对应的第二样本集中相同的目标样本;获取所述待测算法模型对所述目标样本进行处理后得到的第一结果集合,以及所述历史算法模型对所述目标样本进行处理后得到的第二结果集合;根据所述第一结果集合和所述第二结果集合,确定第一集合,所述第一集合是在所述第一结果集合和所述第二结果集合中对应有相同处理结果的目标样本构成的集合;根据所述第一集合中的目标样本的个数,以及所述第一结果集合中的目标样本的个数,确定所述待测算法模型的正确率;算法模型训练模块,用于根据训练样本集训练所述算法模型。
【技术特征摘要】
1.一种信息评测系统,其特征在于,包括:评测模块,用于通过算法模型对待评测的信息进行评测,所述算法模型包括待测算法模型和历史算法模型,所述历史算法模型是所述待测算法模型的前一次迭代模型;算法模型检测模块,用于获取待测算法模型对应的第一样本集和历史算法模型对应的第二样本集中相同的目标样本;获取所述待测算法模型对所述目标样本进行处理后得到的第一结果集合,以及所述历史算法模型对所述目标样本进行处理后得到的第二结果集合;根据所述第一结果集合和所述第二结果集合,确定第一集合,所述第一集合是在所述第一结果集合和所述第二结果集合中对应有相同处理结果的目标样本构成的集合;根据所述第一集合中的目标样本的个数,以及所述第一结果集合中的目标样本的个数,确定所述待测算法模型的正确率;算法模型训练模块,用于根据训练样本集训练所述算法模型。2.根据权利要求1所述的系统,其特征在于,所述系统还包括:显示组件,用于显示用户交互界面;存储器,用于存储所述用户交互界面中的待评测的信息,所述待评测的信息包括如下至少一种信息:所述用户输入的信息、统一资源定位符、图片信息。3.根据权利要求2所述的系统,其特征在于,所述系统还包括:数据处理平台,用于从所述存储器中获取所述待评测的信息,以供所述评测模块对所述待评测的信息进行评测。4.根据权利要求3所述的系统,其特征在于,所述系统还包括:管控模块,用于当所述评测模块判断出所述待评测的信息为需要受限的信息时,控制所述显示组件屏蔽所述需要受限的信息。5.根据权利要求4所述的系统,其特征在于,所述系统还包括:算法模型迭代控制模块,用于根据所述算法模型检测模块检测出的待测算法模型的正确率和/或错误率,控制所述算法模型训练模块是否需要停止迭代所述算法模型。6.根据权利要求1-5任一项所述的系统,其特征在于,所述训练样本集中的训练样本包括如下至少一种:所述需要受限的信息、卖家举报买家的举报信息、买家投诉卖家的投诉信息、预先被识别的信息。7.根据权利要求1-5任一项所述的系统,其特征在于,所述待评测的信息包括用户评价信息;所述评测模块具体用于通过算法模型对所述用户评价信息进行评测,确定所述用户评价信息是否为广告信息。8.一种用户评价信息检测方法,其特征在于,包括:获取多个用户评价信息;通过待测算法模型对所述多个用户评价信息分别进行判别得到第一结果集合,所述第一结果集合包括所述待测算法模型对每个用户评价信息进行判别后得到的第一判别结果;通过历史算法模型对所述多个用户评价信息分别进行判别得到第二结果集合,所述第二结果集合包括所述历史算法模型对每个用户评价信息进行判别后得到的第二判别结果;根据所述第一结果集合和所述第二结果集合,确定第一集合,所述第一集合是在所述第一结果集合和所述第二结果集合中对应有相同判别结果的用户评价信息构成的集合;根据所述第一集合中的用户评价信息的个数,以及所述多个用户评价信息的个数,确定所述待测算法模型的正确率;根据所述待测算法模型的正确率,确定所述多个用户评价信息分别对应的判别结果;其中,所述历史算法模型是所述待测算法模型的前一次迭代模型。9.根据权利要求8所述的方法,其特征在于,所述通过待测算法模型对所述多个用户评价信息分别进行判别,包括:通过所述待测算法模型判别各用户评价信息是否为被限制信息;所述通过历史算法模型对所述多个用户评价信息分别进行判别,包括:通过所述历史算法模型判别各用户评价信息是否为被限制信息;其中,所述被限制信息包括广告信息。10.根据权利要求9所述的方法,其特征在于,所述第一集合是所述第一结果集合中所述待测算法模型和所述历史算法模型均判别为广告信息的用户评价信息构成的集合;或者所述第一集合是所述第一结果集合中所述待测算法模型和所述历史算法模型均判别为非广告信息的用户评价信息构成的集合。11.一种算法模型检测方法,其特征在于,包括:获取待测算法模型对应的第一样本集和历史算法模型对应的第二样本集中相同的目标样本,所述历史算法模型是所述待测算法模型的前一次迭代模型;获取所述待测算法模型对所述目标样本进行处理后得到的第一结果集合,以及所述历史算法模型对所述目标样本进行处理后得到的第二结果集合;根据所述第一结果集合和所述第二结果集合,确定第一集合,所述第一集合是在所述第一结果集合和所述第二结果集合中对应有相同处理结果的目标样本构成的集合;根据所述第一集合中的目标样本的个数,以及所述第一结果集合中的目标样本的个数,确定所述待测算法模型的正确率。12.根据权利要求11所述的方法,其特征在于,所述根据所述第一结果集合和所述第二结果集合,确定第一集合,包括:根据所述第一结果集合,确定所述第一结果集合中的第一结果对应的目标样本;根据所述第二结果集合,确定所述第二结果集合中的第一结果对应的目标样本;确定所述第一结果集合中的第一结果对应的目标样本和所述第二结果集合中的第一结果对应的目标样本的交集为所述第一集合。13.根据权利要求12所述的方法,其特征在于,所述根据所述第一集合中的目标样本的个数,以及所述第一结果集合中的目标样本的个数,确定所述待测算法模型的正确率,包括:计算所述第一集合中的第一结果对应的目标样本的个数与所述第一结果集合中的第一结果对应的目标样本的个数的第一比值;确定所述第一比值与衰减系数的比值为所述待测算法模型的正确率,所述衰减系数等于第三结果集合中的第一结果对应的目标样本的个数与第四结果集合中的第一结果对应的目标样本的个数的比值,所述第三结果集合是所述历史算法模型对所述第二样本集中的第二样本进行处理后得到的结果集合,所述第四结果集合是所述待测算法模型对所述第一样本集中的第一样本进行处理后得到的结果集合。14.根据权利要求11-13任一项所述的方法,其特征在于,所述确定所述待测算法模型的正确率之后,还包括:根据所述待测算法模型的正确率和所述历史算法模型的正确率,确定所述待测算法模型是否需要停止迭代。15.根据权利要求14所述的方法,其特征在于,所述根据所述待测算法模型的正确率和所述历史算法模型的正确率,确定所述待测算法模型是否需要停止迭代,包括:若所述待测算法模型的正确率大于或等于所述历史算法模型的正确率,则确定所述待测算法模型不需要停止迭代;若所述待测算法模型的正确率小于所述历史算法模型的正确率,则确定所述待测算法模型需要停止迭代。...
【专利技术属性】
技术研发人员:倪静,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。