基于疾病加权和食品类别约束的食品-疾病关联预测方法技术

技术编号:20275109 阅读:38 留言:0更新日期:2019-02-02 04:36
本发明专利技术涉及一种基于疾病加权和食品类别约束的食品‑疾病关联预测方法,包括以下步骤:利用国际疾病分类数据构建疾病加权关系;利用成分表构建食品相似度网络;利用食品分类系统构造食品组关系;构造已知的二元食品‑疾病关联网络;随机初始化食品和疾病在潜在空间的表示;引入疾病加权关系和食品组关系,学习食品和疾病潜在空间的表示;利用食品和疾病潜在空间的表示,输出预测食品和疾病的关联结果。本发明专利技术设计合理,克服了食品疾病关联数据的稀疏问题,提升食品和疾病关联预测模型的准确性,同时,使模型计算时间复杂度与食品组中食品数目成线性关系,降低了计算复杂度,减少了计算资源的消耗。

【技术实现步骤摘要】
基于疾病加权和食品类别约束的食品-疾病关联预测方法
本专利技术属于食品安全
,尤其是一种基于疾病加权和食品类别约束的食品-疾病关联预测方法。
技术介绍
随着居民消费能力的提升和健康意识的增强,人们不再满足于基础物质生活需求,而对生命质量、健康生活的要求越来越高。其中,最典型的是对健康饮食指南的需求越来越强烈。已有研究证实,膳食与疾病的发生、发展有着密切的关系,这种关联通常是惊人的,影响深远的,例如,以动物性食物为主的膳食会导致慢性疾病的发生(如肥胖、冠心病、肿瘤、骨质疏松等);以植物性食物为主的膳食最有利于健康,也最能有效地预防和控制慢性疾病。为了研究上述关系,通常通过局部人口学采样、调查问卷、口述内容或者活体实验得到相关数据,再进行统计分析。但这种关联获取方式需要消耗极大的人力物力,尤其置信度高的活体实验,存在极大的风险,难以满足人民细致的食品-疾病关联的知情需求。典型的风险主要在于调查问卷被调查对象错误信息的填写,调查问卷中指标的有偏统计,被调查者多方面因素综合作用,并非单一食品变量因素。活体实验中实验者的操作也是风险来源之一。同时,随着食品种类的快速增长,实验和调查的成本成指数级增长,而由于人力物力限制,事实研究不能及时更新,只能集中在少数疾病和少数食品范畴。进一步地,对于食品和疾病之间的量、食用方法相互作用的细粒度关系,并不明晰,由于变量数巨大,全局统计起来极其困难,而细粒度的用量、食用方法的分析又是具体导致疾病的重要方面。综上所述,食品与疾病的关联是目前热门的关注领域。目前,对于广泛的食品和疾病的关联尚未出现置信度高、有指导意义的预测方法。如何对疾病与食品的关联研究提供研究指南、缩小调查范围、减少随机试验带来的大量人力和资源的消耗是目前迫切需要解决的问题。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提出一种基于疾病加权和食品类别约束的食品-疾病关联预测方法,其通过食品与疾病相关性的计算机预测方法将疾病的类别层次关系与食品组的作用结合起来,增强食品疾病关联预测的鲁棒性,克服了食品疾病关联数据的稀疏问题。本专利技术解决其技术问题是采取以下技术方案实现的:一种基于疾病加权和食品类别约束的食品-疾病关联预测方法,包括以下步骤:步骤1、利用国际疾病分类数据构建疾病加权关系;步骤2、利用成分表构建食品相似度网络;步骤3、利用食品分类系统构造食品组关系;步骤4、构造已知的二元食品-疾病关联网络;步骤5、随机初始化食品和疾病在潜在空间的表示;步骤6、引入疾病加权关系和食品组关系,学习食品和疾病潜在空间的表示;步骤7、利用食品和疾病潜在空间的表示,输出预测食品和疾病的关联结果。进一步,所述步骤1的具体实现方法为:首先,利用国际疾病分类数据,构造疾病相关度矩阵S1,如果两种疾病的表述在国际疾病分类中为父子关系,则设置疾病相关度矩阵中的元素Sij=1,否则Sij=0,其中,疾病i为疾病j的父目录,疾病j为疾病i的具体亚类;然后,定义父结点i的深度depth(i,j)和父结点i和子结点j所构成的边所处深度的权重C(depth(i,j)),定义如下:C(depth(i,j))=1+log(depth(i,j))最后,基于层次结构加权后,疾病的相关度矩阵表示如下:(S′1)ij=(S1)ij*C(depth(i,j))。进一步,所述步骤2的具体实现方法为:在食品相似度网络中,每一个节点为“食品-量-食用方法”的组合;在“量-食用方法”不同的情况下,两两节点关系置为0;在“量-使用方法”相同的情况下,根据食品成分表,利用余弦公式,计算两两食品之间的相似度,作为节点关系值,得到食品相似度网络S2进一步,所述步骤3的具体实现方法为:根据国家规定的食品分类系统作为食品的关系并使用具体分类的20类;将同量同食用方法同分类的食品分做一组,即每一个元素为一个“食品名-量-食用方法”的三元组;根据食品性状、成分的比例的不同将食品归纳在不同的食品组中。进一步,所述步骤4的具体实现方法为:将已知的食品-疾病关联用二进制矩阵R(n×m)表示,将“食品名-量-食用方法”作为食品的细化项,利用“食品名-量-食用方法-疾病”进行建模,将已验证关联的四元组设置为1,否则为0,其中矩阵中行为n个“食品名-量-食用方法”,列为m个疾病。进一步,所述步骤5的具体实现方法为:随机初始化食品和疾病在潜在空间的表示Rn×K和VK×m:通过对两个矩阵中的每一个值赋予0-1之间的任意数作为初始化。进一步,所述步骤6的具体实现方法为:将食品-疾病关联矩阵R分解为食品向量U和疾病向量V的乘积,则分解目标函数定义为:定义疾病加权后的层次结构关系,将具有邻接父子关系的两个疾病限制在潜在空间保持比较近的距离:其中tr(·)表示括号中·所对应的矩阵的迹,S′1是疾病的对称关系矩阵;对角矩阵(D′1)ii=∑j(S′1)ij,图拉普拉斯算子L1=D'1-S′1,||A||2是A矩阵的L2正则化值;V.i、V.j为V矩阵中第i、第j列的列向量;AT是指A矩阵的转置;将普通图拉普拉斯算子应用于食品相似度中:S2为食品相似度网络,(D2)ii=∑j(S2)ij,D2是对角矩阵且对角线上元素是S2的行和,L2=D2-S2;引入食品组关系,将潜在空间中所有食品的几何中心点作为组中心点,并且该组中的所有组成员应该接近于组中心点;在每次迭代中,用已发生的最后一次迭代中使用的U和V来计算每个组的中心点,这些点在当前迭代中用作固定变量;以组为中心的约束表示如下:其中是食品组G中第j个元素,是食品组G的几何中心;表示一个组G中的成员j和其所在组中心点的欧氏距离;将R0、R1、R2合并到基础的矩阵分解目标中,得到目标函数如下:其中λ0、λ1和λ2为人为指定的参数,选值范围为:λ0和λ1从集合{0,0.001,0.01,0.1,1,10,100,1000}中选择,λ2从集合{1,10,100,1000}中选择,利用梯度下降的方法,求解得到食品和疾病潜在空间的表示U和V。进一步,所述步骤7的具体实现方法为:通过食品潜在空间的表示U中第i行与疾病潜在空间的表示V中的第j列做点乘,得到“食品-量-食用方法”i与疾病j之间可能的关系值。本专利技术的优点和积极效果是:1、本专利技术在矩阵分解框架下,考虑到疾病分类的层次关系和食品类别的组关系,通过应用加权策略和组中心策略,即根据疾病分类层次计算疾病加权关系且利用食品分类信息构建食品组,以此作为疾病与食品关联建模的先验约束,以此克服食品疾病关联数据的稀疏问题,用先验知识辅助增强预测的鲁棒性,提升食品和疾病关联预测模型的准确性。同时,本专利技术定义组中心概念,使模型计算时间复杂度与食品组中食品数目成线性关系,降低了计算复杂度,减少了计算资源的消耗。2、本专利技术将疾病的类别层次关系与食品组的作用结合起来,有助于识别新的食品-疾病关联,可以进一步指导健康饮食的研究,同时,本专利技术的食品和疾病的潜在空间表示还可以广泛地应用于食品、疾病相关的其他研究中。附图说明图1是本专利技术的整体处理流程图;图2是本专利技术的步骤6的算法流程图。具体实施方式以下结合附图对本专利技术实施例做进一步详述。本专利技术的设计思想是:在营养学和食品安全领域,利用机器学习中矩阵分解和语义空间理论和技术,以食品-疾病本文档来自技高网
...

【技术保护点】
1.一种基于疾病加权和食品类别约束的食品‑疾病关联预测方法,其特征在于包括以下步骤:步骤1、利用国际疾病分类数据构建疾病加权关系;步骤2、利用成分表构建食品相似度网络;步骤3、利用食品分类系统构造食品组关系;步骤4、构造已知的二元食品‑疾病关联网络;步骤5、随机初始化食品和疾病在潜在空间的表示;步骤6、引入疾病加权关系和食品组关系,学习食品和疾病潜在空间的表示;步骤7、利用食品和疾病潜在空间的表示,输出预测食品和疾病的关联结果。

【技术特征摘要】
1.一种基于疾病加权和食品类别约束的食品-疾病关联预测方法,其特征在于包括以下步骤:步骤1、利用国际疾病分类数据构建疾病加权关系;步骤2、利用成分表构建食品相似度网络;步骤3、利用食品分类系统构造食品组关系;步骤4、构造已知的二元食品-疾病关联网络;步骤5、随机初始化食品和疾病在潜在空间的表示;步骤6、引入疾病加权关系和食品组关系,学习食品和疾病潜在空间的表示;步骤7、利用食品和疾病潜在空间的表示,输出预测食品和疾病的关联结果。2.根据权利要求1所述的基于疾病加权和食品类别约束的食品-疾病关联预测方法,其特征在于:所述步骤1的具体实现方法为:首先,利用国际疾病分类数据,构造疾病相关度矩阵S1,如果两种疾病的表述在国际疾病分类中为父子关系,则设置疾病相关度矩阵中的元素Sij=1,否则Sij=0,其中,疾病i为疾病j的父目录,疾病j为疾病i的具体亚类;然后,定义父结点i的深度depth(i,j)和父结点i和子结点j所构成的边所处深度的权重C(depth(i,j)),定义如下:C(depth(i,j))=1+log(depth(i,j))最后,基于层次结构加权后,疾病的相关度矩阵表示如下:(S′1)ij=(S1)ij*C(depth(i,j))。3.根据权利要求1所述的基于疾病加权和食品类别约束的食品-疾病关联预测方法,其特征在于:所述步骤2的具体实现方法为:在食品相似度网络中,每一个节点为“食品-量-食用方法”的组合;在“量-食用方法”不同的情况下,两两节点关系置为0;在“量-使用方法”相同的情况下,根据食品成分表,利用余弦公式,计算两两食品之间的相似度,作为节点关系值,得到食品相似度网络S2。4.根据权利要求1所述的基于疾病加权和食品类别约束的食品-疾病关联预测方法,其特征在于:所述步骤3的具体实现方法为:根据国家规定的食品分类系统作为食品的关系并使用具体分类的20类;将同量同食用方法同分类的食品分做一组,即每一个元素为一个“食品名-量-食用方法”的三元组;根据食品性状、成分的比例的不同将食品归纳在不同的食品组中。5.根据权利要求1所述的基于疾病加权和食品类别约束的食品-疾病关联预测方法,其特征在于:所述步骤4的具体实现方法为:将已知的食品-疾病关联用二进制矩阵R(n×m)表示,将“食品名-量-食用方法”作为食品的细化项,利用“食品名...

【专利技术属性】
技术研发人员:王嫄张耀功陈赠光王靖寰杨巨成赵青陈亚瑞孔娜王洁
申请(专利权)人:天津科技大学
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1