用于基于反馈来生成训练模型的方法和装置制造方法及图纸

技术编号：9668322 阅读：93 留言：0更新日期：2014-02-14 07:06

本发明专利技术的各实施方式提供了用于基于反馈来生成训练模型的方法和装置。在本发明专利技术的一个实施方式中，提供了一种用于基于反馈来生成训练模型的方法，包括：计算多个样本中样本的特征向量；在至少一个轮次中，获取至少一个用户对于多个样本中的至少一个样本的评分，包括：获取至少一个用户对于第一数量的样本的评分；响应于基于特征向量检测到至少一个用户对于第一数量的样本的评分中的不一致性，获取至少一个用户对于第二数量的样本的评分；以及基于至少一个用户对于第一数量和第二数量的样本的评分，生成训练模型。在本发明专利技术的另一实施方式中，提供了相应的装置。

全部详细技术资料下载

【技术实现步骤摘要】
用于基于反馈来生成训练模型的方法和装置
本专利技术的各实施方式涉及对样本进行评级，更具体地，涉及在评级系统中的用于基于反馈来生成训练模型的方法、装置和相关计算机程序产品。
技术介绍
随着计算机技术和人工智能技术的发展，已经可以实现采用计算机来以智能化方式对各种数据样本进行自动评级。自动评级系统可以学习专家(或用户)对于代表性样本进行评级时所采用的标准，并且利用学习到的这些评级标准来生成训练模型，进而采用训练模型对其他待评级样本进行评级。通常，待评级样本通常数量巨大(例如，数十万甚至上百万)，因而需要从用户采集针对大量样本(例如，数千甚至上万)的评分，才能保证在评级中使用的训练模型的准确性。然而，对于特定用户而言，针对数千甚至上万的样本进行评级是一项费时费力的工作，并且该用户在长时间的评级中容易产生疲劳，例如可能会出现前后评级标准不一致、误操作等错误，进而导致在对样本的评级中存在“噪声”。以上问题都会影响所生成训练模型的准确性，进而影响自动评级的准确性。
技术实现思路
因而，期望能够开发一种能够准确高效地生成训练模型的技术方案，并且期望该技术方案可以在保证训练模型准确性的同时，尽量减少用户需要评级的样本的数量；还期望能够尽量检测并消除由于用户的疲劳或误操作等错误导致的“噪声”。为此，本专利技术的各实施方式提供了用于基于反馈来生成训练模型的方法和装置和相关计算机程序产品。在本专利技术的一个实施方式中，提供了一种用于基于反馈来生成训练模型的方法，包括：计算多个样本中样本的特征向量；在至少一个轮次中，获取至少一个用户对于多个样本中的至少一个样本的评分，包括：获取至少一...
用于基于反馈来生成训练模型的方法和装置

【技术保护点】
一种用于基于反馈来生成训练模型的方法，包括：计算多个样本中样本的特征向量；在至少一个轮次中，获取至少一个用户对于所述多个样本中的至少一个样本的评分，包括：获取所述至少一个用户对于第一数量的样本的评分；响应于基于所述特征向量检测到所述至少一个用户对于第一数量的样本的评分中的不一致性，获取所述至少一个用户对于第二数量的样本的评分；以及基于所述至少一个用户对于所述第一数量和第二数量的样本的评分，生成所述训练模型。

【技术特征摘要】
1.一种用于基于反馈来生成训练模型的方法，包括：计算多个样本中样本的特征向量；在至少一个轮次中，获取至少一个用户对于所述多个样本中的至少一个样本的评分，包括：获取所述至少一个用户对于第一数量的样本的评分；响应于基于所述特征向量检测到所述至少一个用户对于第一数量的样本的评分中的不一致性，获取所述至少一个用户对于第二数量的样本的评分；以及基于所述至少一个用户对于所述第一数量和第二数量的样本的评分，生成所述训练模型。2.根据权利要求1所述的方法，进一步包括：根据所述特征向量，将所述多个样本聚类为至少一个分组。3.根据权利要求2所述的方法，其中，获取所述至少一个用户对于第一数量的样本的评分和获取所述至少一个用户对于第二数量的样本的评分中的至少一个包括：获取所述至少一个用户对于所述至少一个分组中的每个分组中的至少一个样本的评分。4.根据权利要求1-3中任一项所述的方法，其中，获取所述至少一个用户对于第一数量的样本的评分和获取所述至少一个用户对于第二数量的样本的评分中的至少一个包括：针对所述至少一个用户中的一个用户，提供至少两个样本；获取所述用户针对所述至少两个样本的原始评分；以及将所述原始评分进行归一化，获得所述用户针对所述至少两个样本的评分。5.根据权利要求1-3中任一项所述的方法，其中，响应于基于所述特征向量检测到所述至少一个用户对于第一数量的样本的评分中的不一致性，获取所述至少一个用户对于第二数量的样本的评分包括：如果所述至少一个用户中的第一用户对于相似样本的评分差异超过第一阈值，则向所述第一用户提供更多相似样本以获取所述第一用户针对所述更多相似样本的评分，其中所述相似样本采用基于特征向量计算的距离来度量。6.根据权利要求1-3中任一项所述的方法，其中，响应于基于所述特征向量检测到所述至少一个用户对于第一数量的样本的评分中的不一致性，获取所述至少一个用户对于第二数量的样本的评分包括：如果相似用户针对所述多个样本中的第一样本的评分差异超过第二阈值，则向所述相似用户分别再次提供所述第一样本，以获取所述相似用户针对所述第一样本的评分，其中所述相似用户采用用户对多个样本的评分所组成的向量计算的距离来度量。7.根据权利要求1-3中任一项所述的方法，其中，响应于基于所述特征向量检测到所述至少一个用户对于第一数量的样本的评分中的不一致性，获取所述至少一个用户对于第二数量的样本的评分包括：如果所述至少一个用户中的一个用户对两个样本的原始评分之间的差异与被归一化后的评分之间的差异大于第三阈值，则利用所述多个样本中的另一样本替换所述两个样本中的一个样本。8.根据权利要求1-3中任一项所述的方法，其中，基于所述至少一个用户对于所述第一数量和第二数量的样本的评分，生成所述训练模型包括：利用所述至少一个用户对于所述第一数量和第二数量的样本的评分填充评分矩阵；以及对所述评分矩阵进行协同滤波处理...

【专利技术属性】
技术研发人员：严骏驰，段宁，张欣，曹亮亮，林芊，王晨，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人