样本总体的处理方法、装置、设备和存储介质制造方法及图纸

技术编号:24577663 阅读:39 留言:0更新日期:2020-06-21 00:36
本发明专利技术公开了一种样本总体的处理方法,包括:获取用户选择的当前样本总体集;对所述当前样本总体集进行回代误判率的计算,获得误判率;将所述误判率与预设值进行比较;若所述误判率小于等于所述预设值,则利用所述当前样本总体集进行待测样本的归类分析。本发明专利技术还公开了一种样本总体的处理装置、设备和存储介质。本发明专利技术降低了对待测样本的误判风险。

Processing method, device, equipment and storage medium of sample population

【技术实现步骤摘要】
样本总体的处理方法、装置、设备和存储介质
本专利技术涉及计算机领域,尤其涉及一种样本总体的处理方法、装置、设备和存储介质。
技术介绍
由已分类的样本总体对待测样本进行归类,这种归类的合理性就完全取决于样本总体本身分类的合理性。而目前很多场景中在对待测样本进行归类时,并未对样本总体的合理性进行检验,样本总体是在建立时通过人为来判断其合理性,这就导致对待测样本的归类存在误判高的风险。因此,现有技术中存在对待测样本的归类误判风险高的问题。上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
本专利技术的主要目的在于提供一种样本总体的处理方法、装置、设备和存储介质,旨在解决现有技术中存在的对待测样本的归类误判风险高的技术问题。为实现上述目的,本专利技术提供一种样本总体的处理方法,包括:获取用户选择的当前样本总体集;对所述当前样本总体集进行回代误判率的计算,获得误判率;将所述误判率与预设值进行比较;若所述误判率小于等于所述预设值,则利用所述当前样本总体集进行待测样本的归类分析。可选地,所述将所述误判率与预设值进行比较的步骤之后,所述样本总体的处理方法还包括:若所述误判率大于所述预设值,则获取新的样本总体集作为当前样本总体集,返回所述对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤。可选地,所述获取当前样本总体集的步骤,还包括:获取用户选择的对待测样本进行归类的归类规则;所述对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤,具体包括:根据所述归类规则对应的目标算法,对所述当前样本总体集进行回代误判率的计算,获得误判率。可选地,所述归类规则为马氏距离算法,所述根据所述归类规则对应的目标算法,对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤包括:遍历所述当前样本总体集,获得遍历到的当前样本总体;将所述当前样本总体集中除所述当前样本总体以外的各样本总体作为其他样本总体,计算所述当前样本总体内的各样本到各其他样本总体之间的马氏距离;根据各所述马氏距离判断所述当前样本总体内的各样本是否误判,统计所述当前样本总体中被误判的样本数;在遍历完成后,获得所述当前样本总体集内各样本总体中被误判的样本数;根据所述当前样本总体集内各样本总体中被误判的样本数和各样本总体的样本均值,计算所述当前样本总体集的误判率。可选地,所述遍历所述当前样本总体集,获得遍历到的当前样本总体之前,所述样本总体的处理方法还包括:统计所述当前样本总体集的样本容量;若所述样本容量小于2,则获取新的样本总体集作为当前样本总体集,返回所述对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤。可选地,所述归类规则为贝叶斯算法,所述根据所述归类规则对应的目标算法,对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤包括:遍历所述当前样本总体集,获得遍历到的当前样本总体;将所述当前样本总体集中除所述当前样本总体以外的各样本总体作为其他样本总体,计算所述当前样本总体内的各样本到各其他样本总体之间的贝叶斯判别值;根据各所述贝叶斯判别值判断所述当前样本总体内的各样本是否误判,统计所述当前样本总体中被误判的样本数;在遍历完成后,获得所述当前样本总体集内各样本总体中被误判的样本数;根据所述当前样本总体集内各样本总体中被误判的样本数和各样本总体的样本均值,计算所述当前样本总体集的误判率。可选地,根据下式计算所述当前样本总体内的各样本到各其他样本总体之间的贝叶斯判别值:其中,k为遍历所述当前样本总体集获得所述当前样本总体的遍历次数,wj为所述当前样本总体中的第j个样本的贝叶斯判别值,Gki为所述当前样本总体中的第i个样本值,mj为第j个样本总体的样本均值,sj为第j个样本总体的协方差,所述pj为第j个样本总体的先验概率。此外,为实现上述目的,本专利技术还提供一种样本总体的处理装置,所述样本总体的处理装置包括:获取模块,用于获取当前样本总体集;计算模块,用于对所述当前样本总体集进行回代误判率的计算,获得误判率;比较模块,用于将所述误判率与预设值进行比较;归类模块,用于若所述误判率小于等于所述预设值,则利用所述当前样本总体集进行待测样本的归类分析。此外,为实现上述目的,本专利技术还提供一种样本总体的处理设备,所述样本总体的处理设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的样本总体的处理程序,所述样本总体的处理程序被所述处理器执行时实现如上述的样本总体的处理方法的步骤。此外,为实现上述目的,本专利技术还提供一种存储介质,所述存储介质上存储有样本总体的处理程序,所述样本总体的处理程序被处理器执行时实现如上述的样本总体的处理方法的步骤。本专利技术实施例提出的一种样本总体的处理方法、装置、设备和存储介质,本实施例中,通过获取当前样本总体集,对所述当前样本总体集进行回代误判率的计算,获得误判率,将所述误判率与预设值进行比较,若所述误判率小于等于所述预设值,则利用所述当前样本总体集进行待测样本的归类分析,从而能够保障对待测样本的归类的正确率,降低了对待测样本的误判风险。附图说明图1为本专利技术实施例方案涉及的硬件运行环境的终端结构示意图;图2为本专利技术样本总体的处理方法实施例的流程示意图;图3为图2中本专利技术样本总体的处理方法实施例的步骤S204的细化流程示意图;图4为图3中本专利技术样本总体的处理方法实施例的步骤S302之前的步骤流程示意图;图5为图2中本专利技术样本总体的处理方法实施例的步骤S204的另一细化流程示意图;图6为本专利技术样本总体的处理装置实施例的结构框图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的终端结构示意图。本专利技术实施例终端可以是PC,也可以是智能手机、平板电脑、电子书阅读器、MP3(MovingPictureExpertsGroupAudioLayerIII,动态影像专家压缩标准音频层面3)播放器、MP4(MovingPictureExpertsGroupAudioLayerIV,动态影像专家压缩标准音频层面4)播放器、便携计算机等具有显示功能的可移动式终端设备。如图1所示,该终端可以包括:处理器1001,例如CPU,网络接口1004,用户接口1003,存储器1005,通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器本文档来自技高网...

【技术保护点】
1.一种样本总体的处理方法,其特征在于,所述样本总体的处理方法包括以下步骤:/n获取用户选择的当前样本总体集;/n对所述当前样本总体集进行回代误判率的计算,获得误判率;/n将所述误判率与预设值进行比较;/n若所述误判率小于等于所述预设值,则利用所述当前样本总体集进行待测样本的归类分析。/n

【技术特征摘要】
1.一种样本总体的处理方法,其特征在于,所述样本总体的处理方法包括以下步骤:
获取用户选择的当前样本总体集;
对所述当前样本总体集进行回代误判率的计算,获得误判率;
将所述误判率与预设值进行比较;
若所述误判率小于等于所述预设值,则利用所述当前样本总体集进行待测样本的归类分析。


2.如权利要求1所述的样本总体的处理方法,其特征在于,所述将所述误判率与预设值进行比较的步骤之后,所述样本总体的处理方法还包括:
若所述误判率大于所述预设值,则获取新的样本总体集作为当前样本总体集,返回所述对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤。


3.如权利要求1所述的样本总体的处理方法,其特征在于,所述获取当前样本总体集的步骤,还包括:
获取用户选择的对待测样本进行归类的归类规则;
所述对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤,具体包括:
根据所述归类规则对应的目标算法,对所述当前样本总体集进行回代误判率的计算,获得误判率。


4.如权利要求3所述的样本总体的处理方法,其特征在于,所述归类规则为马氏距离算法,所述根据所述归类规则对应的目标算法,对所述当前样本总体集进行回代误判率的计算,获得误判率的步骤包括:
遍历所述当前样本总体集,获得遍历到的当前样本总体;
将所述当前样本总体集中除所述当前样本总体以外的各样本总体作为其他样本总体,计算所述当前样本总体内的各样本到各其他样本总体之间的马氏距离;
根据各所述马氏距离判断所述当前样本总体内的各样本是否误判,统计所述当前样本总体中被误判的样本数;
在遍历完成后,获得所述当前样本总体集内各样本总体中被误判的样本数;
根据所述当前样本总体集内各样本总体中被误判的样本数和各样本总体的样本均值,计算所述当前样本总体集的误判率。


5.如权利要求4所述的样本总体的处理方法,其特征在于,所述遍历所述当前样本总体集,获得遍历到的当前样本总体之前,所述样本总体的处理方法还包括:
统计所述当前样本总体集的样本容量;
若所述样本容量小于2,则获取新的样本总体集作为当前样本总体集,返回所述对所述当前样本总体集进行回代误判率的计算,获得误判率...

【专利技术属性】
技术研发人员:王防修
申请(专利权)人:武汉轻工大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1