当前位置: 首页 > 专利查询>刘亚文专利>正文

产品抽样检测方法及装置、电子设备、计算机可读介质制造方法及图纸

技术编号:27835104 阅读:23 留言:0更新日期:2021-03-30 11:56
本公开提供了一种产品抽样检测方法,该方法依据直方数L与众数频率PL确定产品抽样检测里总体分布估计所需样本量,其中所述直方数为样本直方的数量,众数频率为统计分布直方中最高直方的高度,所述样本量为总体分布估计的样本量。该样本量确定方法明确了总体分布估计所需样本量n与直方数L之间的正相关关系,避开了原本最复杂且最关键的最稀少组频率PL的预估及其绝对误差限的规定,代之以预估众数频率PL及规定相对误差限,大大降低了样本量确定的难度,实用价值极大。本公开还提供了一种产品抽样检测装置、电子设备、计算机可读介质。计算机可读介质。计算机可读介质。

【技术实现步骤摘要】
产品抽样检测方法及装置、电子设备、计算机可读介质


[0001]本公开实施例涉及计算机
,特别涉及一种总体分布估计的样本量估计方法及装置。

技术介绍

[0002]统计学基础的基本理论的内容不外乎有两个:一是用样本数据估计总体分布,二是如何确定能够确保总体分布估计精度的样本量。
[0003]因为总体分布包含了变量的全部信息,因此,如何通过变量Y的简单随机样本数据y
i
(i=1,2,

,n),估计Y的总体分布F(y)是统计学的最高级课题。目前,估计总体分布有两条途经,一是基于分布属于哪个分布族的先验信息,通过估计分布特征间接估计出分布函数的参数,进而获得分布函数的间接估计模式(即参数估计模式)。二是经由样本数据估计随机变量概率分布或总体分布的直接估计模式。
[0004]相比参数估计模式,直接估计模式不需要任何关于分布本身的先验信息,因此更具一般性与广泛性。尽管格列文科定理和DKW定理在理论上证明了直接估计模式的可能性,甚至进一步给出了一个粗糙的理论置信区间,但统计学迄今为止不仅没有解决相应的样本量确定问题,更令人难以置信地完全忽视了这个堪称统计学的核心课题之一的问题。合适的样本量一方面能够确保中心极限定理的成立,另一方面能够降低估计成本。
[0005]对于带参数的总体分布的估计,其理论比较成熟。但对于不带参数的总体分布的估计,其理论比较薄弱。格列文科定理虽然证明了以样本分布估计总体分布的可能性,但迄今尚未出现以总体分布估计为指向的类似中心极限定理地位的研究成果,因而缺乏类似区间估计的可行操作路径。
[0006]公开内容
[0007]本公开实施例提供一种产品抽样检测方法、装置、电子设备及计算机可读介质,为总体分布估计提供一种便捷的实现途径。
[0008]第一方面,本公开实施例提供一种产品抽样检测方法,包括:利用直方数与众数频率确定总体分布估计所需样本量,而且,总体分布估计所需样本量n与所述直方数L之间为正相关关系;其中,所述直方数为样本直方的数量,所述众数频率为统计分布直方中最高直方的高度,所述样本量为总体均值估计的样本量
[0009]第二方面,本公开实施例提供一种产品抽样检测装置,包括:样本量确定模块,用于利用直方数与众数频率确定总体分布估计所需样本量,而且,总体分布估计所需样本量n与所述直方数L之间为正相关关系;其中,所述直方数为样本直方的数量,所述众数频率为统计分布直方中最高直方的高度,所述样本量为总体均值估计的样本量。
[0010]第三方面,本公开实施例提供一种电子设备,其包括:
[0011]一个或多个处理器;
[0012]存储器,其上存储有一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器上述任意一种产品抽样检测的方法;
[0013]一个或多个I/O接口,连接在所述处理器与存储器之间,配置为实现所述处理器与存储器的信息交互。
[0014]第四方面,本公开实施例提供一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现上述任意一种产品抽样检测的方法。
[0015]本公开实施例提供的产品抽样检测方法,从产品抽样检测的总体分布估计所需样本量,阐释了直方数L与众数频率P
L
如何影响总体分布估计所需样本量,即各个样本直方与相应总体直方之间绝对误差之总和恰好等于其平均相对误差,因此,利用直方数与众数频率确定样本量,凸显了直方数L对样本量n的重大影响,样本量n与直方数L成正相关关系,避开了原本最复杂且最关键的最稀少组频率P
L
的预估及其绝对误差限的规定,代之以预估众数频率P
L
及规定相对误差限,众数频率P1或较大频率组的频率其操作简单,难度明显低于传统样本量公式的总体方差预估,巧妙避开了原本最为关键的预估最稀少组频率P
L
的难题,实用价值极大。
附图说明
[0016]附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开的实施例一起用于解释本公开,并不构成对本公开的限制。通过参考附图对详细示例实施例进行描述,以上和其它特征和优点对本领域技术人员将变得更加显而易见,在附图中:
[0017]图1为本公开实施例中示性函数的曲线图;其中,横坐标表示变量值,纵坐标表示频率和概率,而且,对于分布函数,纵坐标是概率;对于经验分布函数,纵坐标是累计频率;
[0018]图2为本公开实施例中的样本直方图;图中,横坐标为分组,纵坐标为各组的频率;
[0019]图3为本公开实施例顶点的高度呈线性均匀递减趋势的直方图;其中,横坐标为分组,纵坐标为各组的频率;
[0020]图4为本公开实施例中矮胖L型分布的直方图;其中,横坐标为分组,纵坐标为各组的频率;
[0021]图5为本公开实施例中瘦高L型分布的直方图;其中,横坐标为分组,纵坐标为各组的频率;
[0022]图6为本公开实施例中均匀分布的直方图;其中,横坐标为分组,纵坐标为各组的频率;
[0023]图7为本公开实施例中楼梯型分布的直方图;其中,横坐标为分组,纵坐标为各组的频率;
[0024]图8为本公开实施例提供的另一种产品抽样检测装置的原理图;
[0025]图9为本公开实施例提供一种电子设备的原理图。
具体实施方式
[0026]为使本领域的技术人员更好地理解本公开的技术方案,下面结合附图对本公开提供的产品抽样检测方法及装置、电子设备、计算机可读介质进行详细描述。
[0027]对于带参数的总体分布的估计,统计学将参数看作总体期望总体方差等总体分布特征的化身或简单函数,通过估计分布特征间接地估计参数,从而实现对总体分布的估计。
[0028]基于大数定律和中心极限定理的推断统计,给出了二分类变量Y的总体频率估计
与数值变量Y的总体均值估计两种情形的样本量公式为公式(1)和公式(2):
[0029]二分类变量:
[0030]数值变量:
[0031]其中,N表示样本总体规模,n表示总体均值估计的样本量,S2表示总体方差,表示标准正态分布的双侧百分位点的平方,Δ2表示最大容许绝对误差Δ的平方。P表示二分类变量所关注的一个变量值。
[0032]在使用0

1变换后,二分类变量情形可以化为后一种情形,于是将二分类变量和数值变量公式统一为总体均值估计情形的样本量公式。对总体均值估计精度的要求是:
[0033][0034]其中,表示样本均值,表示总体均值,Δ表示容许的最大绝对误差,1

α表示容许的最小置信度。由此可知,估计量样本均值(或样本比例)与待估参数总体均值(总体比例)之间的绝对误差不超过Δ的概率低于1

α是不能接受和容许的。
[0035]对于不带参数的总体分布F(y),对于给定的变量值y∈R
Y
,总体分布F(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种产品抽样检测方法,包括:利用直方数与众数频率确定总体分布估计所需样本量,而且,总体分布估计所需样本量n与所述直方数L之间为正相关关系;其中,所述直方数为样本直方的数量,所述众数频率为统计分布直方中最高直方的高度,所述样本量为总体分布估计的样本量。2.根据权利要求1所述的方法,其中,在频率最小组的频率P
L
为时,所述样本量通过以下公式确定:其中,n为总体均值估计的样本量,N为样本总体规模,为标准正态分布的双侧百分位点的平方,r为相对误差限,L为直方数,P1为众数频率。3.根据权利要求1所述的方法,其中,在频率最小组的频率P
L
为1

(L

1)P1时,所述样本量通过以下公式确定:其中,n为总体均值估计的样本量,N为样本总体规模,为标准正态分布的双侧百分位点的平方,r为相对误差限,L为直方数,P1为众数频率。4.根据权利要求1所述的方法,其中,在频率最小组的频率P
L
为时,所述样本量通过以下公式确定:其中,n为总体均值估计的样本量,N为样本总体规模,为标准正态分布的双侧百分位点的平方,r为相对误差限,L为直方数,P1为众数频率。5.根据权利要求1所述的方法,其中,在频率最小组的频率P
L
为时,所述样本量通过以下公式确定:其中,n为总体均值估计的样本量,N为...

【专利技术属性】
技术研发人员:刘亚文杜子芳
申请(专利权)人:刘亚文
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1