【技术实现步骤摘要】
样本总体的处理方法、装置、设备和存储介质
本专利技术涉及计算机领域,尤其涉及一种样本总体的处理方法、装置、设备和存储介质。
技术介绍
由已分类的样本总体对待测样本进行归类,这种归类的合理性就完全取决于样本总体本身分类的合理性。而目前很多场景中在对待测样本进行归类时,并未对样本总体的合理性进行检验,样本总体是在建立时通过人为来判断其合理性,这就导致对待测样本的归类存在误判高的风险。因此,现有技术中存在对待测样本的归类误判风险高的问题。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种样本总体的处理方法、装置、设备和存储介质,旨在解决现有技术中存在的对待测样本的归类误判风险高的技术问题。为实现上述目的,本专利技术提供一种样本总体的处理方法,包括:获取用户选择的当前样本总体集;对所述当前样本总体集进行回代误判率的计算,获得误判率;将所述误判率与预设值进行比较;若所述误判率小于等于所述预设值,则利用所述当前样本总体集 ...
【技术保护点】
1.一种样本总体的处理方法,其特征在于,所述样本总体的处理方法包括以下步骤:/n获取用户选择的当前样本总体集;/n对所述当前样本总体集进行回代误判率的计算,获得误判率;/n将所述误判率与预设值进行比较;/n若所述误判率小于等于所述预设值,则利用所述当前样本总体集进行待测样本的归类分析。/n
【技术特征摘要】
1.一种样本总体的处理方法,其特征在于,所述样本总体的处理方法包括以下步骤:
获取用户选择的当前样本总体集;
对所述当前样本总体集进行回代误判率的计算,获得误判率;
将所述误判率与预设值进行比较;
若所述误判率小于等于所述预设值,则利用所述当前样本总体集进行待测样本的归类分析。
2.如权利要求1所述的样本总体的处理方法,其特征在于,所述将所述误判率与预设值进行比较的步骤之后,所述样本总体的处理方法还包括:
若所述误判率大于所述预设值,则获取新的样本总体集作为当前样本总体集,返回所述对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤。
3.如权利要求1所述的样本总体的处理方法,其特征在于,所述获取当前样本总体集的步骤,还包括:
获取用户选择的对待测样本进行归类的归类规则;
所述对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤,具体包括:
根据所述归类规则对应的目标算法,对所述当前样本总体集进行回代误判率的计算,获得误判率。
4.如权利要求3所述的样本总体的处理方法,其特征在于,所述归类规则为马氏距离算法,所述根据所述归类规则对应的目标算法,对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤包括:
遍历所述当前样本总体集,获得遍历到的当前样本总体;
将所述当前样本总体集中除所述当前样本总体以外的各样本总体作为其他样本总体,计算所述当前样本总体内的各样本到各其他样本总体之间的马氏距离;
根据各所述马氏距离判断所述当前样本总体内的各样本是否误判,统计所述当前样本总体中被误判的样本数;
在遍历完成后,获得所述当前样本总体集内各样本总体中被误判的样本数;
根据所述当前样本总体集内各样本总体中被误判的样本数和各样本总体的样本均值,计算所述当前样本总体集的误判率。
5.如权利要求4所述的样本总体的处理方法,其特征在于,所述遍历所述当前样本总体集,获得遍历到的当前样本总体之前,所述样本总体的处理方法还包括:
统计所述当前样本总体集的样本容量;
若所述样本容量小于2,则获取新的样本总体集作为当前样本总体集,返回所述对所述当前样本总体集进行回代误判率的计算,获得误判率...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。