【技术实现步骤摘要】
基于定向加权关联规则模型的散发性结直肠腺瘤的危险因素筛查方法
本专利技术涉及医疗数据分析,具体涉及一种基于定向加权关联规则模型的散发性结直肠腺瘤的危险因素筛查方法。
技术介绍
散发性结直肠腺瘤(CRA)是结肠和直肠的良性腺体肿瘤,是结直肠癌的前期病变。早期发现并及时治疗可以有效降低其癌变的概率,对延长患者的生存时间具有重要意义。调查研究发现CRA与生活饮食习惯密切相关,66%~78%的结直肠腺瘤可以通过健康的生活习惯来避免。但有些重要的危险因素仍被忽视甚至并未被发现,因而无法有效的指导患者健康生活,改善现状。近年来,越来越多的研究人员意识到生活饮食习惯因素在结直肠腺瘤病因学中的重要意义,并投入结肠直肠腺瘤危险因素的研究中。但在危险因素的分析方面方法过于单一,这些传统的方法对于单因素分析取得一定的效果,但不够完善,一些小概率但很重要的危险因素容易被遗漏。为克服以上问题,我们提出了定向加权关联规则模型,它是通过概率计算加权支持度和固定后项的方式相结合来构建的一个高效的关联规则挖掘模型。通过生成结直肠腺瘤发病的规则 ...
【技术保护点】
1.一种基于定向加权关联规则模型的散发性结直肠腺瘤的危险因素筛查方法,包括如下具体步骤:/nS1、数据及数据预处理;/nS2、采用随机森林平均不纯度减少的方法进行特征选择,得到优选指标集;/nS3、使用定向加权关联规则模型进行分析;/nS4、将S3中生成的强关联规则中蕴含的危险因素纳入危险因素集合,并与专家交流;/n所述步骤S1中数据包括以下数据段项目:/n数据列字段包括基本信息、疾病状态、生活习惯、饮食习惯、结肠镜检查结果五个方面的79个专家初步筛选的与生活饮食习惯相关的危险因素特征;/n其中,基本信息包括:姓名,性别,年龄,种族,电话号码,教育程度,当地居民,身高,体重 ...
【技术特征摘要】
1.一种基于定向加权关联规则模型的散发性结直肠腺瘤的危险因素筛查方法,包括如下具体步骤:
S1、数据及数据预处理;
S2、采用随机森林平均不纯度减少的方法进行特征选择,得到优选指标集;
S3、使用定向加权关联规则模型进行分析;
S4、将S3中生成的强关联规则中蕴含的危险因素纳入危险因素集合,并与专家交流;
所述步骤S1中数据包括以下数据段项目:
数据列字段包括基本信息、疾病状态、生活习惯、饮食习惯、结肠镜检查结果五个方面的79个专家初步筛选的与生活饮食习惯相关的危险因素特征;
其中,基本信息包括:姓名,性别,年龄,种族,电话号码,教育程度,当地居民,身高,体重,职业,婚姻状况,家庭收入;
(1)疾病状况包括①既往病史:糖尿病史、高血压史、冠心病史、慢性肝病史、慢性肾病史、慢性支气管炎病史、脑血管病史、高脂血症病史、脂肪肝病史、胆囊切除术史、肠外科病史、胃手术史、食管手术史、其他疾病或手术史;②目前的病史:腹痛、腹胀、腹泻、便秘、血便、粘液便、其他症状;③使用抗生素;
(2)生活习惯包括:吸烟,熬夜,运动,出行方式;
(3)饮食习惯包括①海水产品的频率和烹饪方式:熟食新鲜海水鱼类、生食新鲜冷冻鱼片、腌制海水鱼及鱼干、辣制海水鱼及鱼干、熟食新鲜海水虾/蟹/贝类/螺类、生食新鲜冷冻虾/蟹/贝类/螺类、腌制海水虾/虾/蟹/贝类/螺类、醉制海水虾/蟹/贝类/螺类、海水植物类、腌制等加工海水植物类;②禽畜肉类频次及烹调加工方式:新宰杀的猪/牛/羊/鸡/鸭肉、新杀的动物内脏、腌制加工肉制品、烧烤加工肉制品、熏制加工肉制品、辣制加工肉制品;③淡水产品频率和烹饪方法:新鲜的淡水鱼类、腌制淡水鱼、辣制淡水鱼、新鲜的淡水虾/蟹/贝类/螺类、腌制淡水虾/蟹/贝类/螺类、醉制淡水虾/蟹/贝类/螺类;④禽蛋/奶类及奶制品:普通牛奶,低脂/脱脂牛奶,酸奶,奶粉,鸡蛋/鸭蛋/鹌鹑蛋,腌制等加工禽蛋;⑤零食类:加工过的碳水化合物,加工的肉类,加工过的果脯;⑥蔬菜/瓜果类及烹调加工方式:新鲜蔬菜、腌制等加工蔬菜、菌菇类、菜瓜类、新鲜水果;⑦饮水饮料类:可饮用的自来水、可饮用的矿泉水、可饮用的纯净水、碳酸饮料类、果汁饮料;⑧饮酒类:低度白酒、高度白酒、红酒、黄酒、啤酒、果酒、含酒精饮料、多种酒类混合;
(4)结肠镜检查结果包括:检查结果,检查部位和病理结果。病理结果用于确定他们是否是结直肠腺瘤患者;
所述步骤S1中数据预处理包括如下步骤:
S101、删除无关数据;
S102、删除冗余信息、删除缺失值超过50%的特征列,删除具有明显异常的脏数据;
S103、数据转换;
所述步骤S2中采用随机森林平均不纯度减少的方法进行特征选择包括如下步骤:
S201、计算原始数据的信息熵H1:
S202、选择一个特...
【专利技术属性】
技术研发人员:余盖青,高俊波,程陈,费若岚,王长静,
申请(专利权)人:上海海事大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。