病因分析方法,装置,存储介质及电子设备制造方法及图纸

技术编号:24290640 阅读:64 留言:0更新日期:2020-05-26 20:30
本公开涉及一种病因分析方法,装置,存储介质及电子设备,以提供一种新的病因分析方式,实现病因自动化分析。该方法包括:获取对照组的样本数据和病例组的样本数据,所述样本数据中包括样本的多种属性项以及样本在各所述属性项下的取值数据,其中,所述病例组中的各病例的病症相同;根据每种所述属性项下的取值数据,确定每种所述属性项的数据类型;将所述对照组和所述病例组的每一属性项信息输入到数据处理模型中,得到所述数据处理模型输出的与所述病症相关的目标属性项;其中,所述属性项信息包括属性项的取值数据以及该属性项的数据类型,所述数据处理模型用于根据属性项的数据类型对应的数据处理算法对属性项的取值数据进行处理。

Etiology analysis method, device, storage medium and electronic equipment

【技术实现步骤摘要】
病因分析方法,装置,存储介质及电子设备
本公开涉及计算机
,具体地,涉及一种病因分析方法,装置,存储介质及电子设备。
技术介绍
病因分析是医疗科研领域中的一个重要研究方向,病因分析主要探究疾病发生的原因、相关因素间的相互效应以及各因素对疾病的发生和发展的影响。相关技术中,病因分析过程主要包括三个步骤:一般性资料分析,单因素分析和多因素分析。其中,在进行一般性资料分析时,需要科研人员对待分析资料中的每一变量词语进行标注,基于标注结果对待分析资料中的所有变量进行分类,然后针对每一类变量采用不同的算法进行分析。在进行单因素分析和多因素分析时,需要重新对变量进行分类标注,然后针对重新分类后的不同类型的变量进行分析。这种方式,需要花费大量的人员去手动标注每个变量词语。而在人工标注大量变量的过程中,容易将变量的类型标注错,变量的类型标注错了会导致病因分析结果明显不准确。而若病因分析的结果明显不准确时,科研人员会对大量的变量词语进行标注检查,这无疑是需要花费大量的时间的,而若对所有变量进行重新标注,也会耗费大量的时间。因此,这种人工标注的方式使得病因分本文档来自技高网...

【技术保护点】
1.一种病因分析方法,其特征在于,所述方法包括:/n获取对照组的样本数据和病例组的样本数据,所述样本数据中包括样本的多种属性项以及样本在各所述属性项下的取值数据,其中,所述病例组中的各病例的病症相同;/n根据每种所述属性项下的取值数据,确定每种所述属性项的数据类型;/n将所述对照组和所述病例组的每一属性项信息输入到数据处理模型中,得到所述数据处理模型输出的与所述病症相关的目标属性项;/n其中,所述属性项信息包括属性项的取值数据以及该属性项的数据类型,所述数据处理模型用于根据属性项的数据类型对应的数据处理算法对属性项的取值数据进行处理。/n

【技术特征摘要】
1.一种病因分析方法,其特征在于,所述方法包括:
获取对照组的样本数据和病例组的样本数据,所述样本数据中包括样本的多种属性项以及样本在各所述属性项下的取值数据,其中,所述病例组中的各病例的病症相同;
根据每种所述属性项下的取值数据,确定每种所述属性项的数据类型;
将所述对照组和所述病例组的每一属性项信息输入到数据处理模型中,得到所述数据处理模型输出的与所述病症相关的目标属性项;
其中,所述属性项信息包括属性项的取值数据以及该属性项的数据类型,所述数据处理模型用于根据属性项的数据类型对应的数据处理算法对属性项的取值数据进行处理。


2.根据权利要求1所述的方法,其特征在于,所述根据每种所述属性项下的取值数据,确定每种所述属性项的数据类型,包括:
确定取值数据的取值种类为两种的所述属性项的数据类型为定性可比较类型;
确定取值数据的取值种类非两种、取值数据为数值型数据且取值数据符合正态性分布的所述属性项的数据类型为定量类型;
确定取值数据的取值种类非两种、取值数据为数值型数据且取值数据不符合正态性分布的所述属性项的数据类型为所述定性可比较类型;
确定取值数据的取值种类非两种、取值数据为非数值型数据且取值数据不存在知识库中的所述属性项的数据类型为定性不可比较类型;
确定取值数据的取值种类非两种、取值数据为非数值型数据且取值数据存在所述知识库中的所述属性项的数据类型为所述定性可比较类型。


3.根据权利要求2所述的方法,其特征在于,所述数据处理模型对各属性项的取值数据的处理包括:
对于数据类型为所述定量类型的属性项,通过秩和检验、T检验、T′检验中的至少一者进行检验,得到第一中间属性项;
对于数据类型为定性类型的属性项,通过卡方检验算法进行检验,得到第二中间属性项,所述定性类型包括所述定性可比较类型和所述定性不可比较类型;
对所述第一中间属性项和所述第二中间属性项进行单因素分析,得到与所述病症相关的第一目标属性项,所述目标属性项包括所述第一目标属性项。


4.根据权利要求3所述的方法,其特征在于,所述单因素分析包括对所述第一中间属性项中的各属性项的取值数据进行分段离散化处理,其中,所述分段离散化处理中的分段过程包括:
根据所述属性项的最大取值和最小取值,确定所述属性项的数值区间;
根据预设超参空间中的每一超参数对所述数值区间进行分段,得到所有分段情况下的分段区间序列集合;
针对所述分段区间序列集合中的每一分段区间序列,计算表征该分段区间序列的统计学意义的P值,并将P值最小的分段区间序列作为分段结果。


5.根据权利要求3或4所述的方法,其特征在于,所述数据处理模型对各属性项的取值数据的处理还包括:
对所述第一目标属性项,进行多因素分析,得到第二目标属性项,所述目标属性项包...

【专利技术属性】
技术研发人员:孙浩侯广健刘满兰刘志鹏邹存璐王锋
申请(专利权)人:东软集团股份有限公司
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1