当前位置: 首页 > 专利查询>厦门大学专利>正文

似然比检验误差的检测方法技术

技术编号:4042927 阅读:418 留言:0更新日期:2012-04-11 18:40
似然比检验误差的检测方法,涉及一种人工智能技术在中医的应用。提供一种基于概率积分变换的似然比检验误差的检测方法。提供预测准确和高效的分析工具,仿真实验显示,该方法可以用于通常的小样本;若似然比检验所得到的P值结论与单向有序列联表的面貌不一致时,应依据基于概率积分变换的0.074校准参数修正P值误差,使P值结论与单向有序列联表的面貌一致。提供一种广泛适用的尾预测检验方法来评估这种预测,它能够评价整个预测的分布,而不是一个标量或区间。预测分布的信息内容与事后知识相结合就足以建立一个强大的检验,即使在样本规模小至100的情况下也能够满足预测程序的需要。

【技术实现步骤摘要】

本专利技术涉及一种人工智能技术在中医的应用,尤其是涉及一种似然比检验误差的 检测方法。
技术介绍
早在东汉时期,张仲景就十分重视证型理论的功能。证型理论是指古代医生制定 的辨证标准和论治规则。“辨证论治”原则显示,辨证和论治被用来诊断与治疗。中医建议,辨证理论描述证型症状的关系,论治理论描述证型方剂的关系,以及处 方理论联系证型中药的关系。4个实体(即证型、症状、方剂和中药)和3个关系(即证型症状的关系、证型方剂 关系和证型中药的关系)是中医的精髓。证型可以有许多症状,一个症状可以被许多证型 包括。一证型必须包括至少一个症状,但症状不一定有证型。证型症状的关系是指用来表 示一个或多个特定症状的辨证。目前,中医证型模型仅有张连文等( Zhang, N. L. Yuan, S.,Chen, Τ. and Wang, Y. Latent tree models and diagnosis in traditional Chinese medicine. Artificial Intelligence in Medicine, 2008,42 (3) :229_245)使用隐树模型分析数据集,发现数据集 的自然集群,很好地对应于中医证型。它提供统计,以验证中医证型,并建议在辨证的基础 上建造证型模型。然而,这种方法以为单个的症状属于特定的证型,并且使用Bayesian网 络分析以发现数据集里的自然群。那些假定不与现实一致,结果使用这种方法所建立的模 型很少产生相当积极的性能。现实生活中,包括中医等,都需要科学的预测,而预测的准确程度是研究的首要目 的。目前,小样本的似然比检验研究分为区间预测、密度预测和尾预测三类。预测的传统方 法侧重于评估区间预测和密度预测。Johansen (Johansen, S. A small sample correction for tests of hypotheses on the cointegrating vectors .Journal of Econometrics,2002, 111(2) 195-221)在对协整(cointegrated)风险价值模型进行有关的协整关系的推论,得 出小样本的渐近推断结果不够准确,应根据样本大小和参数获得校正因子。McSorley 等(McSorley, Ε. 0.,Lu, J. C.,and Li, C. S. Performance of Parameter-Estimates in Step-Stress Accelerated Life-Tests With Various Sample-Sizes , IEEE Transactions on Reliability, 2002, 51 (3) :271_277)采用仿真 技术调查使用大样本的高斯近似置信区间,并估计在不同的拟合模型有限样本情况的ML 所需的样本大小。Wong等(Wong,Heung. ,Liu,F. ,Chen,M. and Cheung,W. Empirical likelihood based diagnostics for heteroscedasticity in partial linear models . Computational Statistics and Data Analysis,2009,53 :3466_3477)使用经验似然的自 举仿真,克服小样本的失真。因为似然比检验是一个具有限制卡方分布的渐近测试。通过经验似然自举临界值(EL bootstrap critical value)可以克服小样本的经验似然比检验 造成的失真。 在大部分中医机构中,并没有针对疾病的证型症状模型建立历史数据,此外,中医 证型模型需要比其它医学模型更长的时间积累,这些事实表明,需要适合小样本的预测技 术。如果中医模型以小样本进行评价,模型的性能必须具有更广泛的角度。但是,密度预测 评估会受密度内部的影响,由于受内部刻划许多小的干扰,可能会大幅减少中医管理人员 对尾的关注。尾预测度量满足了一套合理的直观公理,如单调性和次可加性,尾预测导致比 基于区间预测较低的损失。从统计学的角度来看,很显然,尾预测度量包含比区间更多的信 息。尾预测检验力的相对高效和要求更多的参数与基本假设条件,在目前来讲,具有最好的 检测效果。
技术实现思路
本专利技术的目的在于提供一种基于概率积分变换的。本专利技术所述一种基于概率积分变换的包括以下步 骤步骤1)设定数学模型设母体之随机变量X取值0、1,则X之概率函数为 由此随机取出η个样本X1, X2,…,Xn(Xi = 0,1 i = 1,2,…,η),式(12)中,χ 代表可能结果为0或1,P代表X可能结果为0的概率(每次试验皆相同)。步骤2)设随机变量Y = X^X2+- +Xn,因Y之分布函数为 式(13)中,h代表二项式实验中,η次试验有y次为0的随机变量X的概率分布 y代表结果为0的次数,η代表试验次数,ρ代表每次0出现的概率。故可由下列求其正确值 式(14)中,P代表η次试验至少有S次(S < η)为0的概率,S代表至少有S次为 0,η代表试验次数,y代表结果为0的次数。步骤3)为了与高斯似然关联,可利用中心极限定理如下求其近似值为X = -YjXk ,其中,η代表样本大小。步骤4)由中心极限定理知其分布近似于 其中,N代表正态分布,η代表样本大小, 之分布近似于N(0,1),其中t代表t分布,叉代表样本大小为η的随机变量X的均 值,η代表样本大小为η,因 式(16)中,y代表结果为0的次数,S代表结果为0至少有S次(S < η),η代表 样本大小,故 其中,设标准单变量正态分布 步骤5)当η=①时(η = 1000),由 可查正态分布表(统计学最重要的连续概率分布表)得 解得S后再与η比较,即可得出校准参数。步骤6)当似然比检验所得到的P值结论与单向有序列联表的面貌不一致时,依据 基于概率积分变换的校准参数修正P值误差,使P值结论与单向有序列联表的面貌一致。本专利技术的突出优点如下本专利技术提出有关,用于单向有序列联表和小样本的预 测。其目的是提供预测准确度和高效的分析工具,以及更普遍的预测检验力。仿真实验显 示,该方法可以用于通常的小样本。若似然比检验所得到的P值结论与单向有序列联表的 面貌不一致时,应依据基于概率积分变换的0. 074校准参数修正P值误差,使P值结论与单 向有序列联表的面貌一致。我们将应用到胃病的分析,得到证 型的胃痛严重度参数与列联表面貌的预测一致的结果。附图说明图1为本专利技术实施例的证型和胃痛严重度面貌。在图1中,横坐标为证型,纵坐标 为概率;曲线1为肝胃不和;曲线2为脾胃虚弱;曲线3为脾胃湿热;曲线3为边缘概率。图2为本专利技术实施例的证型和胃痛严重度面貌。在图2中,横坐标为证型,纵坐标 为概率;曲线1为肝胃不和;曲线2为脾胃虚弱;曲线3为脾胃湿热;曲线3为边缘概率。 IimP辛钦大数定律说明独立同分布的随机变量的算术平均值依概率收敛于它的数学 期望值,它为实际应用中用算术平均值估计数学期望提供了理论依据。1.2中心极限定理独立同分布(iid)的中心极限定理设X1, x2,…,Xn是独本文档来自技高网
...

【技术保护点】
似然比检验误差的检测方法,其特征在于包括以下步骤:步骤1)设定数学模型:设母体之随机变量X取值0、1,则X之概率函数为:f(X=x;p)=(1/2)↑[x](1/2)↑[1-x],x=0,1(12)由此随机取出n个样本X↓[1],X↓[2],…,X↓[n](X↓[i]=0,1i=1,2,…,n),式(12)中,x代表可能结果为0或1,p代表x可能结果为0的概率(每次试验皆相同);步骤2)设随机变量Y=X↓[1]+X↓[2]+…+X↓[n],因Y之分布函数为h(Y=y;n,p)=(***)(1/2)↑[y](1/2)↑[n-y],y=1,2,...,n(13)式(13)中,h代表二项式实验中,n.次试验有y次为0的随机变量X的概率分布;y代表结果为0的次数,n代表试验次数,p代表每次0出现的概率;故可由下列求其正确值P(Y≥S)=*(***)(1/2)↑[y](1/2)↑[n-y](14)式(14)中,P代表n次试验至少有S次(S<n)为0的概率,S代表至少有S次为0,n代表试验次数,y代表结果为0的次数;步骤3)为了与高斯似然关联,可利用中心极限定理如下求其近似值为:*=1/n*X↓[k],其中,n代表样本大小;步骤4)由中心极限定理知其分布近似于N(1/2;1/4n)其中,N代表正态分布,n代表样本大小,因p=1/2,pq=1/4(q=1-p=1/2,p为0的概率,q为1的概率),故t=*-1/2/***(15)之分布近似于N(0,1),其中t代表t分布,*代表样本大小为n的随机变量X的均值,n代表样本大小为n,因***(16)式(16)中,y代表结果为0的次数,S代表结果为0至少有S次(S<n),n代表样本大小,故P{Y≥S}=P(t≥2S-n/*)~1/***=0.5-1/***dt=0.5-Φ(2S-n/*)(17)其中,设标准单变量正态分布Φ(x)=***;步骤5)当n=∞时(n=1000),由Φ(2S-1000/31.6)=0.49,可查正态分布表(统计学最重要的连续概率分布表)得2S-1000/31.6=2.33(20)解得S后再与n比较,即可得出校准参数;步骤6)当似然比检验所得到的P值结论与单向有序列联表的面貌不一致时,依据基于概率积分变换的校准参数修正P值误差,使P值结论与单向有序列联表的面貌一致。...

【技术特征摘要】

【专利技术属性】
技术研发人员:陈彤生李绍滋周昌乐
申请(专利权)人:厦门大学
类型:发明
国别省市:92[中国|厦门]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1