【技术实现步骤摘要】
样本评估
技术介绍
[0001]在各种数据处理中,经常需要对样本的某一属性进行评估,并且评估的结果通常以数值或等级的方式呈现。由此,需要对样本进行评分。例如,在计算机辅助的语言学习中,可能需要评估来自用户的语音样本。可能需要对语音样本的口语流利度、发音准确度等进行评分。此外,在文本评估、年龄估计、信用评估等诸多应用场景中也存在类似的样本评估需求。
技术实现思路
[0002]根据本公开的实现,提出了一种用于样本评估的方案。在该方案中,基于输入样本和参考样本集,生成一组比较结果。每个比较结果指示输入样本的目标属性优于参考样本集中的相应参考样本的目标属性的概率。然后,基于该组比较结果,从参考样本集中确定按照目标属性与输入样本相匹配的至少一个参考样本。输入样本的目标属性与所确定的至少一个参考样本的目标属性接近或相似。基于至少一个参考样本关于目标属性的相应得分,确定输入样本关于目标属性的得分。该方案将得分预测问题转化为一系列较为简单的二元比较或二分类,即,输入样本与参考样本的优劣比较。一系列的二元比较有助于准确地找出目标属性与输入样本接近的参考样本。由此,可以确保基于参考样本的得分而确定的输入样本的得分的准确性。以此方式,能够实现更高效、准确和稳健的样本评估。
[0003]提供
技术实现思路
部分是为了以简化的形式来介绍对概念的选择,其在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识要求保护的主题的关键特征或主要特征,也无意限制要求保护的主题的范围。
附图说明
[0004]图1示出了能够实施本公开的多个 ...
【技术保护点】
【技术特征摘要】
1.一种计算机实现的方法,包括:基于输入样本和参考样本集,生成一组比较结果,所述一组比较结果中的每个比较结果指示所述输入样本的目标属性优于所述参考样本集中的相应参考样本的所述目标属性的概率;基于所述一组比较结果,从所述参考样本集中确定按照所述目标属性与所述输入样本相匹配的至少一个参考样本;以及基于所述至少一个参考样本关于所述目标属性的相应得分,确定所述输入样本关于所述目标属性的得分。2.根据权利要求1所述的方法,其中从所述参考样本集中确定所述至少一个参考样本包括:基于所述一组比较结果,按照所述目标属性对所述输入样本和所述参考样本集中的参考样本进行排名;以及基于所述排名的结果,确定所述至少一个参考样本。3.根据权利要求2所述的方法,其中基于所述排名的结果确定所述至少一个参考样本包括:将所述参考样本集中与所述输入样本排名相同的第一参考样本确定为所述至少一个参考样本,并且其中确定所述输入样本关于所述目标属性的得分包括:基于所述第一参考样本关于所述目标属性的得分,确定所述输入样本关于所述目标属性的得分。4.根据权利要求2所述的方法,其中基于所述排名的结果确定所述至少一个参考样本包括:将所述参考样本集中排名在所述输入样本之前的第二参考样本和排名在所述输入样本之后的第三参考样本确定为所述至少一个参考样本,并且其中确定所述输入样本关于所述目标属性的得分包括:通过加权所述第二参考样本和所述第三参考样本关于所述目标属性的相应得分,确定所述输入样本关于所述目标属性的得分。5.根据权利要求1所述的方法,其中生成所述一组比较结果包括:利用经训练的分类器,基于所述输入样本与所述参考样本集中的第四参考样本,生成针对所述第四参考样本的比较结果,所述比较结果指示所述输入样本的所述目标属性优于所述第四参考样本的所述目标属性的概率。6.根据权利要求5所述的方法,还包括:基于训练样本集,生成多个训练样本对,所述多个训练样本对之一包括关于所述目标属性具有第一得分的第一训练样本和关于所述目标属性具有第二得分的第二训练样本;以及利用所述多个训练样本对,训练所述分类器,使得经训练的所述分类器基于所述第一训练样本和所述第二训练样本生成的比较结果符合所述第一得分与所述第二得分的相对水平。7.根据权利要求6所述的方法,还包括:
基于所述训练样本集来确定所述参考样本集。8.根据权利要求7所述的方法,其中基于所述训练样本集来确定所述参考样本集包括:按照所述训练样本集中的训练样本关于所述目标属性的得分,将所述训练样本集划分成多组训练样本;以及从所述多组训练样本中的每组训练样本中,选择所述参考样本集中的参考样本。9.一种电子设备,包括:处理单元;以及存储器,耦合至所述处理单元并且包含存储于其上的指令,所述指令在由所述处理单元执行时,使得所述设备执行动作,所述动作包括:基于输入样本和参考样本集,生成一组比较结果,所述一组比较结果中的每个比较结果指示所述输入样本的目标属性优于所述参考样本集中的相应参考样本的所述目标属性的概率;基于所述一组比较结果,从所述参考样本集中确定按照所述目标属性与所述输入样本相匹配的至少一个参考样本;以及基于所述至少一个参考样本关于所述目标属性的相应得分,确定所述输入样本关于所述目标属性的得分。10.根据权利要求9所述的设备,其中从所述参考样本集中确定所述至少一个参考样本包括:基于所述一组比较结果,按照所述目标属性对所述输入样本和所述参考样本集中的参考样本进行排名;以及基于所述排名的结果,确定所述至少一个参考样本。11.根据权利要求10所述的设备,其中基于所述排名的结果确定所述至少一个参考样...
【专利技术属性】
技术研发人员:毛绍光,宋歌平,夏炎,田江森,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。