本发明专利技术涉及一种基于随机森林算法的医疗图像处理方法及存储介质,包括以下步骤,步骤101、获取用户的特征信息P,获取样本库症状的特征信息Q,将特征信息P和Q进行整合得到特征信息H;步骤102、构建用于匹配用户症状的随机森林,结合特征信息H进行训练得到用于匹配用户症状的随机森林模型;步骤103、获取需要进行匹配的用户以及症状,将需要进行匹配的用户以及症状按照步骤101进行整合得到整合的特征信息;步骤104、重复上述步骤直到得到所述用户与样本库所有症状的程度指数集合{I
A medical image processing method and storage medium based on random forest algorithm
【技术实现步骤摘要】
一种基于随机森林算法的医疗图像处理方法及存储介质
本专利技术涉及人工智能领域,尤其涉及一种基于随机森林算法的医疗图像处理方法及存储介质。
技术介绍
医院(Hospital)一词是来自于拉丁文原意为“客人”,因为一开始设立时,是供人避难,还备有休息间,使来者舒适,有招待意图。后来,才逐渐成为满足人类医疗需求,提供医疗服务的专业机构,收容和治疗病人的服务场所。医院是指按照法律法规和行业规范,为病员开展必要的医学检查、治疗措施、护理技术、接诊服务、康复设备、救治运输等服务,以救死扶伤为主要目的医疗机构。当下的医院往往人满为患,许多科室的医生已经无法应对大量的病人的咨询,对于一些轻微的典型症状,完全可以根据以往确诊的图像信息来确定,这样如果还由医生一个一个来看话,属实有些浪费时间了。
技术实现思路
本专利技术的目的是解决现有技术的不足,提供一种基于随机森林算法的医疗图像处理方法及存储介质。为了实现上述目的,本专利技术采用以下的技术方案:本专利技术提出一种基于随机森林算法的医疗图像处理方法及存储介质,包括以下:步骤101、获取用户的特征信息P,获取样本库症状的特征信息Q,将特征信息P和Q进行整合得到特征信息H;步骤102、构建用于匹配用户症状的随机森林,结合特征信息H进行训练得到用于匹配用户症状的随机森林模型;步骤103、获取需要进行匹配的用户以及症状,将需要进行匹配的用户以及症状按照步骤101进行整合得到整合的特征信息,将整合的特征信息输入所述随机森林模型得到匹配程度指数I;步骤104、重复上述步骤直到得到所述用户与样本库所有症状的程度指数集合{I1、I2、…Im},取MAX{I1、I2、…Im},并将MAX{I1、I2、…Im}所对应的症状作为用户的匹配症状推送给用户。进一步,上述步骤101中用户的特征信息P包括用户的年龄、性别、疾病史以及用户的此次医疗图像信息,所述该次医疗图像信息为用户选择的用于咨询的医疗图像信息。进一步,上述步骤101中的样本库症状的特征信息Q包括症状的年龄段对应的发病率、性别对应的发病率以及以往确诊的医疗图像信息集。进一步,上述步骤101中的特征信息H包括用户的年龄对应的发病率、用户的性别对应的发病率、用户是否具有该疾病史、用户的该次医疗图像与该症状的以往确诊的医疗图像信息集的相似度。进一步,上述步骤102只能够进行构建随机森林模型的方法包括以下:步骤501、从样本库症状中,采用bootstrap方法有放回地随机抽取M个新的自助样本集,并根据所述自助样本集构建M棵分类回归树;步骤502、将特征信息P的个数定义为n个,在每一棵树的每个节点处随机抽取m个特征,m≤n,通过计算信息增益的方式在m个特征中选择最具有分类能力的特征进行节点分裂;步骤503、使每棵树最大限度地生长,不进行剪枝操作;步骤504、将生成的M棵树组成随机森林,并生成随机森林模型,所述随机森林模型通过投票的方式进行用户症状匹配,若投票为匹配成功的树的数量占M的比例不低于阈值N,则将该用户与该症状匹配。进一步,上述步骤502中计算信息增益的方法为通过ID3算法进行计算,具体包括以下:若特征信息P中的子特征p将样本库症状集T划分为T1、T2、…Tj共j个子集,则该子特征p的信息增益为其中,M为症状集T的个数与步骤501中的M数值相同,|Tj|为子集中属于Tj的样本个数,freq(Cj,T)为T的样本属于Cj类别的频率,s是T中样本的类别数量。进一步,上述步骤504中的进行投票的方式为:定义C为需要进行推送标签,则其中M为树的数量,I(*)为示性函数,c为单棵树hi对类C的分类结果,是树hi的叶子节点数,若C的权值大于阈值H,则代表单棵树hi赞成将该用户与该症状匹配。进一步,所述用户的该次医疗图像与该症状的以往确诊的医疗图像信息集的相似度的计算方法包括,通过OpenCV对该次医疗图像与该症状的以往确诊的医疗图像集中的每一张医疗图像进行相似度计算,取其中的最大值作为用户的该次医疗图像与该症状的以往确诊的医疗图像信息集的相似度,其中医疗图像集由医生根据以往确诊的典型医疗图像来选取。本专利技术还提出一种计算机可读存储的介质,所述计算机可读存储的介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现所述基于随机森林算法的医疗图像处理方法的步骤。本专利技术的有益效果为:本专利技术通过提出一种基于随机森林算法的医疗图像处理方法及存储介质,能够通过随机森林对用户与相应的症状进行匹配,之后用户可以根据匹配的结果来寻找对应的科室进行挂号诊断,十分的方便,节约了医生的时间。附图说明图1所示为本专利技术一种基于随机森林算法的医疗图像处理方法及存储介质的流程图。具体实施方式以下将结合实施例和附图对本专利技术的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本专利技术的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。附图中各处使用的相同的附图标记指示相同或相似的部分。结合图1,提出一种基于随机森林算法的医疗图像处理方法及存储介质,包括以下:步骤101、获取用户的特征信息P,获取样本库症状的特征信息Q,将特征信息P和Q进行整合得到特征信息H;步骤102、构建用于匹配用户症状的随机森林,结合特征信息H进行训练得到用于匹配用户症状的随机森林模型;步骤103、获取需要进行匹配的用户以及症状,将需要进行匹配的用户以及症状按照步骤101进行整合得到整合的特征信息,将整合的特征信息输入所述随机森林模型得到匹配程度指数I;步骤104、重复上述步骤直到得到所述用户与样本库所有症状的程度指数集合{I1、I2、…Im},取MAX{I1、I2、…Im},并将MAX{I1、I2、…Im}所对应的症状作为用户的匹配症状推送给用户。作为本方案的优选实施方式,上述步骤101中用户的特征信息P包括用户的年龄、性别、疾病史以及用户的此次医疗图像信息,所述该次医疗图像信息为用户选择的用于咨询的医疗图像信息。作为本方案的优选实施方式,上述步骤101中的样本库症状的特征信息Q包括症状的年龄段对应的发病率、性别对应的发病率以及以往确诊的医疗图像信息集。作为本方案的优选实施方式,上述步骤101中的特征信息H包括用户的年龄对应的发病率、用户的性别对应的发病率、用户是否具有该疾病史、用户的该次医疗图像与该症状的以往确诊的医疗图像信息集的相似度。对于用户信息的采集可以通过人机交互界面让用户自行输入,也可以是其他的方式,合理即可。作为本方案的优选实施方式,上述步骤102只能够进行构建随机森林模型的方法包括以下:步骤501、从症状样本库中,采用bootstrap方法有放回地随机抽取M个新的自助样本集,并根据所述自助样本集构建M棵分类回归树;步骤502、将特征信息本文档来自技高网...
【技术保护点】
1.一种基于随机森林算法的医疗图像处理方法及存储介质,其特征在于,包括以下:/n步骤101、获取用户的特征信息P,获取样本库症状的特征信息Q,将特征信息P和Q进行整合得到特征信息H;/n步骤102、构建用于匹配用户症状的随机森林,结合特征信息H进行训练得到用于匹配用户症状的随机森林模型;/n步骤103、获取需要进行匹配的用户以及症状,将需要进行匹配的用户以及症状按照步骤101进行整合得到整合的特征信息,将整合的特征信息输入所述随机森林模型得到匹配程度指数I;/n步骤104、重复上述步骤直到得到所述用户与样本库所有症状的程度指数集合{I
【技术特征摘要】
1.一种基于随机森林算法的医疗图像处理方法及存储介质,其特征在于,包括以下:
步骤101、获取用户的特征信息P,获取样本库症状的特征信息Q,将特征信息P和Q进行整合得到特征信息H;
步骤102、构建用于匹配用户症状的随机森林,结合特征信息H进行训练得到用于匹配用户症状的随机森林模型;
步骤103、获取需要进行匹配的用户以及症状,将需要进行匹配的用户以及症状按照步骤101进行整合得到整合的特征信息,将整合的特征信息输入所述随机森林模型得到匹配程度指数I;
步骤104、重复上述步骤直到得到所述用户与样本库所有症状的程度指数集合{I1、I2、...Im},取MAX{I1、I2、...Im},并将MAX{I1、I2、...Im}所对应的症状作为用户的匹配症状推送给用户。
2.根据权利要求1所述的一种基于随机森林算法的医疗图像处理方法及存储介质,其特征在于,上述步骤101中用户的特征信息P包括用户的年龄、性别、疾病史以及用户的此次医疗图像信息,所述该次医疗图像信息为用户选择的用于咨询的医疗图像信息。
3.根据权利要求2所述的一种基于随机森林算法的医疗图像处理方法及存储介质,其特征在于,上述步骤101中的样本库症状的特征信息Q包括症状的年龄段对应的发病率、性别对应的发病率以及以往确诊的医疗图像信息集。
4.根据权利要求3所述的一种基于随机森林算法的医疗图像处理方法及存储介质,其特征在于,上述步骤101中的特征信息H包括用户的年龄对应的发病率、用户的性别对应的发病率、用户是否具有该疾病史、用户的该次医疗图像与该症状的以往确诊的医疗图像信息集的相似度。
5.根据权利要求4所述的一种基于随机森林算法的医疗图像处理方法及存储介质,其特征在于,上述步骤102只能够进行构建随机森林模型的方法包括以下:
步骤501、从样本库症状中,采用bootstrap方法有放回地随机抽取M个新的自助样本集,并根据所述自助样本集构建M棵分类回归树;
步骤502、将特征信息P的个数定义为n个,...
【专利技术属性】
技术研发人员:霍颖瑜,
申请(专利权)人:佛山科学技术学院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。