一种基于舌象特征和BMI指数的脂肪肝预测方法技术

技术编号:23326709 阅读:35 留言:0更新日期:2020-02-14 23:26
本发明专利技术公开了一种基于舌象特征和BMI指数的脂肪肝预测方法,涉及人工智能技术领域,本发明专利技术包括采集舌体图像样本及对应的BMI指数,随机分为训练数据集和测试数据集;对训练数据集中的舌体图像样本进行特征提取,基于舌质舌苔颜色特征向量[p

A prediction method of fatty liver based on tongue features and BMI index

【技术实现步骤摘要】
一种基于舌象特征和BMI指数的脂肪肝预测方法
本专利技术涉及人工智能
,更具体的是涉及一种基于舌象特征和BMI指数的脂肪肝预测方法。
技术介绍
BMI(BodyMassIndex)指数为体质指数,是目前国际上常用来量度体重与身高比例的工具,利用身高和体重之间的比例衡量一个人是否过瘦或过肥,而通常情况下脂肪肝患者往往由于脂肪含量过高较肥胖,因此BMI指数对判定脂肪肝具有辅助作用。传统的脂肪肝诊断往往靠医生配合辅助检查来进行确诊,比如医生根据患者病史和如肝功能,血脂,B超,CT等辅助检查项目对脂肪肝进行诊断,但是目前的诊断方法依赖于大量的先验知识,同时进行辅助检查又需要去医院,费时费力而且成本不低,十分不便利。随着技术的不断发展,目前已经有了直接使用舌体图像对脂肪肝进行预测识别的技术,但是现有技术依赖于大量标记过的数据样本,否则训练出的模型准确率并不高,并且现有模型网络结构较为复杂,计算时间较长,不利于部署。
技术实现思路
本专利技术的目的在于:为了解决目前直接使用舌体图像对脂肪肝进行预测,依赖于大量样本,且网络结构复杂的问题,本专利技术提供一种基于舌象特征和BMI指数的脂肪肝预测方法。本专利技术为了实现上述目的具体采用以下技术方案:一种基于舌象特征和BMI指数的脂肪肝预测方法,包括:采集若干张患病和未患病的舌体图像样本及每张舌体图像样本对应的BMI指数,将舌体图像样本随机分为训练数据集和测试数据集,并将每张舌体图像样本对应的BMI指数添加到对应的训练数据集和测试数据集中;对训练数据集中的舌体图像样本进行特征提取,得到舌质舌苔颜色特征向量[pxi,pyi]、舌苔厚薄特征向量[T,M]、舌体润燥特征L和舌体胖瘦指数I;基于舌质舌苔颜色特征向量[pxi,pyi]、舌苔厚薄特征向量[T,M]、舌体润燥特征L、舌体胖瘦指数I及BMI指数构建训练特征向量[pxi,pyi,T,M,L,I,BMI],利用训练特征向量[pxi,pyi,T,M,L,I,BMI]对预设的RandomForest模型进行训练,利用网格调参法对RandomForest模型进行优化;利用测试数据集对RandomForest模型进行测试,直至输出训练好的最佳RandomForest模型;利用最佳RandomForest模型对待预测舌体图像进行预测,得到预测结果。进一步的,所述对训练数据集中的舌体图像样本进行特征提取,得到舌质舌苔颜色特征向量[pxi,pyi],具体为:利用LGBM模型将舌体图像样本中的像素点分为十类,其中舌质类像素点和舌苔类像素点各五类,舌质类像素点分别是:淡色舌质、淡红舌质、红色舌质、深红舌质和绛色舌质,舌苔类像素点分别是:白色舌苔、淡黄舌苔、深黄舌苔、棕黄舌苔和灰黑舌苔;设舌质类像素点数量分别为x1,...,xi,...,x5,舌苔类像素点数量分别为y1,...,yi,...,y5,分别计算各舌质类像素点占舌质类像素点总数的百分比pxi和各舌苔类像素点占舌苔类像素点总数的百分比pyi,计算式为:则舌质舌苔颜色特征向量为[pxi,pyi]。进一步的,所述对训练数据集中的舌体图像样本进行特征提取,得到舌苔厚薄特征向量[T,M],具体为:设舌体图像样本总像素点数量为N,对于其中任一个像素点Pij,选取其5*5邻域,计算该邻域中舌质类像素点数量Nij,根据Nij的取值为像素点Pij分配权重ωij:基于权重ωij计算舌体图像样本的苔厚指数T:然后计算舌体图像样本的苔质比M:基于苔厚指数T和苔质比M得到舌苔厚薄特征向量[T,M]。进一步的,所述对训练数据集中的舌体图像样本进行特征提取,得到舌体润燥特征L,具体为:将舌体图像样本分为10*10的区域,计算各区域平均亮度值In,取最大的平均亮度值作为全局阈值It;对舌体图像样本中所有大于全局阈值It的像素点进行八邻域生长,形成各亮斑区域;对各亮斑区域基于二分光反射原理进行分类,得到水分亮斑区,计算水分亮斑区的像素点总和L,舌体润燥特征即为L。进一步的,所述对各亮斑区域基于二分光反射原理进行分类,得到水分亮斑区,具体为:计算各亮斑区域像素点协方差矩阵的特征值λ1,λ2和λ3,确保λ1>λ2>λ3;计算对应于每个特征值λ1的特征向量V1,并对所有的特征向量V1进行归一化处理;设定阈值ε,取满足λ1>ε>λ2>λ3的亮斑区域的特征向量V1,近似估计光照方向;取满足λ1>λ2>ε>λ3和λ1>ε>λ2>λ3的亮斑区域,判断亮斑区域的特征向量V1是否与近似估计的光照方向接近,若是,则判断该亮斑区域为水分亮斑区。进一步的,所述取满足λ1>ε>λ2>λ3的亮斑区域的特征向量V1,近似估计光照方向,具体是将所选取的亮斑区域的特征向量V1的均值Vmean设定为近似估计的光照方向。进一步的,所述对训练数据集中的舌体图像样本进行特征提取,得到舌体胖瘦指数I,具体为:将舌体图像样本转换为灰度图,在灰度图中提取舌体边缘点集合Pedge,利用线性回归,将舌体边缘点集合中的边缘点拟合为四次曲线,则舌体胖瘦指数I的计算式为:其中,a0和a2分别为四次曲线的四次项系数和二次项系数,Rl/w为舌体图像样本中舌体外接矩阵的长宽比,F为设定的长宽比阈值。进一步的,由于训练数据集中样本数量不均衡,为了保证RandomForest模型的平衡,所述利用训练特征向量[pxi,pyi,T,M,L,I,BMI]对预设的RandomForest模型进行训练之前,针对数量少的舌体图像样本进行上采样,向训练特征向量中的各特征添加扰动,构造新的舌体图像样本,使患病和未患病的舌体图像样本数量保持均衡。进一步的,所述利用网格调参法对RandomForest模型进行优化,具体是采用F1分数作为网格调参得分方式并结合正则校验对RandomForest模型进行优化。本专利技术的有益效果如下:1、本专利技术对舌体图像样本进行特征提取,然后利用提取到的舌质舌苔颜色特征向量[pxi,pyi]、舌苔厚薄特征向量[T,M]、舌体润燥特征L和舌体胖瘦指数I构建训练特征向量,通过训练特征向量训练RandomForest模型,提高了脂肪肝预测效果和预测结果准确率,并且模型结构简单,占用资源较少。2、本专利技术的RandomForest模型属于bagging算法,相较于基于boosting算法的分类模型,RandomForest模型能更好的解决过拟合的干扰,并且运行速度相较于其他分类模型更具有优势,并且RandomForest模型能较好地应对不均衡数据,使得模型分类效果更好。附图说明图1是本专利技术具体实施方式的方法流程示意图。具体实施方式为了本
的人员更好的理本文档来自技高网
...

【技术保护点】
1.一种基于舌象特征和BMI指数的脂肪肝预测方法,其特征在于,包括:/n采集若干张患病和未患病的舌体图像样本及每张舌体图像样本对应的BMI指数,将舌体图像样本随机分为训练数据集和测试数据集,并将每张舌体图像样本对应的BMI指数添加到对应的训练数据集和测试数据集中;/n对训练数据集中的舌体图像样本进行特征提取,得到舌质舌苔颜色特征向量[p

【技术特征摘要】
1.一种基于舌象特征和BMI指数的脂肪肝预测方法,其特征在于,包括:
采集若干张患病和未患病的舌体图像样本及每张舌体图像样本对应的BMI指数,将舌体图像样本随机分为训练数据集和测试数据集,并将每张舌体图像样本对应的BMI指数添加到对应的训练数据集和测试数据集中;
对训练数据集中的舌体图像样本进行特征提取,得到舌质舌苔颜色特征向量[pxi,pyi]、舌苔厚薄特征向量[T,M]、舌体润燥特征L和舌体胖瘦指数I;
基于舌质舌苔颜色特征向量[pxi,pyi]、舌苔厚薄特征向量[T,M]、舌体润燥特征L、舌体胖瘦指数I及BMI指数构建训练特征向量[pxi,pyi,T,M,L,I,BMI],利用训练特征向量[pxi,pyi,T,M,L,I,BMI]对预设的RandomForest模型进行训练,利用网格调参法对RandomForest模型进行优化;
利用测试数据集对RandomForest模型进行测试,直至输出训练好的最佳RandomForest模型;
利用最佳RandomForest模型对待预测舌体图像进行预测,得到预测结果。


2.根据权利要求1所述的一种基于舌象特征和BMI指数的脂肪肝预测方法,其特征在于,所述对训练数据集中的舌体图像样本进行特征提取,得到舌质舌苔颜色特征向量[pxi,pyi],具体为:
利用LGBM模型将舌体图像样本中的像素点分为十类,其中舌质类像素点和舌苔类像素点各五类,舌质类像素点分别是:淡色舌质、淡红舌质、红色舌质、深红舌质和绛色舌质,舌苔类像素点分别是:白色舌苔、淡黄舌苔、深黄舌苔、棕黄舌苔和灰黑舌苔;
设舌质类像素点数量分别为x1,...,xi,...,x5,舌苔类像素点数量分别为y1,...,yi,...,y5,分别计算各舌质类像素点占舌质类像素点总数的百分比pxi和各舌苔类像素点占舌苔类像素点总数的百分比pyi,计算式为:






则舌质舌苔颜色特征向量为[pxi,pyi]。


3.根据权利要求2所述的一种基于舌象特征和BMI指数的脂肪肝预测方法,其特征在于,所述对训练数据集中的舌体图像样本进行特征提取,得到舌苔厚薄特征向量[T,M],具体为:
设舌体图像样本总像素点数量为N,对于其中任一个像素点Pij,选取其5*5邻域,计算该邻域中舌质类像素点数量Nij,根据Nij的取值为像素点Pij分配权重ωij:



基于权重ωij计算舌体图像样本的苔厚指数T:



然后计算舌体图像样本的苔质比M:



基于苔厚指数T和苔质比M得到舌苔厚薄特征向量[T,M]。


4.根据权利要求1所述的一种基于舌象特征和BMI指数的脂肪...

【专利技术属性】
技术研发人员:王畇浩代超何帆周振
申请(专利权)人:中电健康云科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1