当前位置: 首页 > 专利查询>厦门大学专利>正文

用于中医健康状态分析的四诊表征信息融合方法技术

技术编号:19906230 阅读:37 留言:0更新日期:2018-12-26 03:46
用于中医健康状态分析的四诊表征信息融合方法,采集临床就诊患者的望、闻、问、切等信息,用于生成病人的多源信息表示,并标注其隶属的证型类别;利用每个信息源的特征表征及其类别信息分别对测试者的健康状态进行分析,得多个信息源对测试者的辅助决策信息;构建信息融合模型使得决策一致性最大化,用于返回优化的健康状态分析结果;对比测试者的实际健康状态与相应的预测结果来评价所提算法的性能。能检测出测试者当前的健康状态和病变本质,使得测试者能够明自身的体质状况,为制定干预方案提供参考。能提供高精度的健康状态分析结果,为健康保健提供依据。能融合临床就诊患者的四诊表征信息,获得更加准确可靠的状态分析结果。

【技术实现步骤摘要】
用于中医健康状态分析的四诊表征信息融合方法
本专利技术涉及多标记学习,尤其是涉及用于中医健康状态分析的四诊表征信息融合方法。
技术介绍
状态是中医健康认知理论的逻辑起点,健康状态是指人体单位时间内形态结构、生理功能、心理状态、适应外界环境能力的综合状态,体现的是健康的状况和态势。健康状态分析是以中医学理论为依据,将采集的望、闻、问、切等信息用数据形式表达,强调客观地评价人体健康状态和病变本质,并对所患病、证给出概括性判断(李灿东.中医状态学[M].北京:中国中医药出版社,2016)。多标记学习技术用于处理真实世界中具有多义性的对象,在图像自动标注、生物信息学、信息检索以及推荐系统等领域得到了广泛关注和应用。具体地,临床就诊患者的证型分布往往多状态兼挟。故而,立足于人工智能技术解决中医健康状态分析问题,多标记学习技术引入到中医健康状态分析中来。按照中医“四诊合参”的原则,状态分析是建立在四诊信息的基础上。考虑到不同信息源对于预测的贡献程度具有差异性,且不同信息源之间相互关联,那么通过四诊方法收集临床就诊患者的整体信息,进而构建信息融合模型用以分析该患者所处健康状态。中医健康大数据呈现多模态性与多标记性等特征,使得传统的数据分析理论、方法与技术面临有效性、准确性与可计算性等严峻挑战。因此,研究用于中医健康状态分析的四诊表征信息融合方法,有利于构建更为准确可靠的辨识模型,有利于发挥人工智能技术的优势促进交叉学科共同发展和繁荣。
技术实现思路
本专利技术的目的在于针对临床就诊患者多状态兼挟,且诊断信息的来源具有多样性,提供用于中医健康状态分析的四诊表征信息融合方法。本专利技术包括以下步骤:1)采集临床就诊患者的望、闻、问、切等信息,用于生成病人的多源信息表示,并标注其隶属的证型类别;2)利用每个信息源的特征表征及其类别信息分别对测试者的健康状态进行分析,得到多个信息源对测试者的辅助决策信息;3)构建信息融合模型使得决策一致性最大化,用于返回优化的健康状态分析结果;4)对比测试者的实际健康状态与相应的预测结果来评价所提算法的性能。在步骤1)中,所述采集临床就诊患者的望、闻、问、切等信息,用于生成病人的多源信息表示,并标注其隶属的证型类别的具体方法可为:(1)从电子病历中提取临床就诊患者的四诊表征信息,组成信息源A;利用望诊仪得到患者舌象,基于U-Net网络模型实现舌象分割,然后采用HSV、LAB和RGB描述算子获取舌象多个特征表示,分别组成信息源B、信息源C和信息源D;(2)医生对临床就诊患者的健康状态进行标记,记为{l1,l2,...,lq},1≤j≤q,其中lj为临床就诊患者的第j个证型,q为类别标记的总数;(3)采用十折交叉验证方法对算法进行验证:将处理好的标准化数据按照9︰1的比例进行划分,分为训练数据和测试数据。在步骤2)中,所述利用每个信息源的特征表征及其类别信息分别对测试者的健康状态进行分析,得到多个信息源对测试者的辅助决策信息的具体方法可为:(1)采用SVM预测测试者的健康状态,计算公式为:其中,表示在数据源A上第i个测试者关于第j个证型的预测结果,表示第i个测试者在数据源A上的特征表征信息;(2)联合特征表征和相应的预测信息在训练集中搜寻测试者的Top-k个近邻,近邻选择基于测试者与训练样本的相似性关系,计算公式为:其中,包含测试者与训练样本在特征空间上的相似度,用余弦相似性方法计算得到;由杰卡德相似性方法求得,包含测试者与训练样本在标记空间上的相似度;β为阈值,其取值范围为[0,1];(3)利用相似性关系simA对证型之间的相关性建模来重构测试者的标记空间:其中,表示在数据源A上第i个测试者关于第j个证型的预测结果,Yzj表示第i个测试者的第z个近邻在第j个证型上的实际值;(4)重复步骤(1)~(3),分别得到基于信息源B~D的状态分析结果。在步骤3)中,所述构建信息融合模型使得决策一致性最大化,用于返回优化的健康状态分析结果的具体方法可为:(1)利用临床就诊患者四诊表征信息预测的多个状态结果来获取测试者最终的结果,构建以下优化目标函数进行求解:其中,表示第i个测试者在第j个证型上的优化结果,该优化结果通过融合多源的决策信息得到,W={w1,w2,...,wM}为M个信息源的权重分布,其中M=4,另外,cm表示(i,j)的集合,且(i,j)满足α为阈值,其取值范围为[0,1];(2)初始化权重,令设置:(3)固定W,利用梯度下降法求解Y*,计算公式为:(4)固定Y*,利用拉格朗日乘子法求解W,计算公式为:(5)重复步骤(3)和(4),直到优化目标收敛,返回测试者健康状态的优化结果Y*。在步骤4)中,所述对比测试者的实际健康状态与相应的预测结果来评价所提算法的性能的具体方法可为:利用所提方法对测试数据中测试者的类别标记进行预测,并采用以下五个指标对所提算法的性能进行评价:(1)汉明损失:用于考察样本在单个标记上的误分类情况,该评价指标越小越好;(2)1-错误率:用于考察在样本的类别标记排序序列中,序列最前端的标记不属于相关标记集合的情况,该评价指标越小越好;(3)覆盖率:用于考察在样本的类别标记排序序列中,覆盖所有相关标记所需的搜索深度情况,该评价指标越小越好;(4)排序损失:用于考察在样本的类别标记排序序列中出现排序错误的情况,该评价指标越小越好;(5)平均精度:用于考察在样本的类别标记排序序列中,排在相关标记之前的标记仍为相关标记的情况,该评价指标越大越好。与现有技术相比,本专利技术能够检测出测试者当前的健康状态和病变本质,使得测试者能够明了自身的体质状况,为制定干预方案提供参考。本专利技术能够提供高精度的健康状态分析结果,为健康保健提供依据。本专利技术能够融合临床就诊患者的四诊表征信息,从而获得更加准确可靠的状态分析结果。附图说明图1为舌象分割的示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。本实施例包括如下步骤:1)采集729例临床就诊患者的望、闻、问、切等信息,用于生成病人的多源信息表示,并标注其隶属的证型类别,共计339个证型类别数;(1)从电子病历中提取临床就诊患者的四诊表征信息,组成信息源A;利用望诊仪得到患者舌象,基于U-Net网络模型实现舌象分割,如图1所示。然后采用HSV、LAB和RGB描述算子获取舌象多个特征表示,分别组成信息源B、信息源C和信息源D;(2)医生对临床就诊患者的健康状态进行标记,记为{l1,l2,...,lq}(1≤j≤q)。其中lj为临床就诊患者的第j个证型,q为类别标记的总数;(3)采用十折交叉验证方法对算法进行验证:将处理好的标准化数据按照9︰1的比例进行划分,分为训练数据和测试数据。2)利用每个信息源的特征表征及其类别信息分别分析测试者的健康状态,得到多个信息源对测试者的辅助决策信息;(1)采用SVM预测测试者健康状态,计算公式为:其中,表示在数据源A上第i个测试者关于第j个证型的预测结果,表示第i个测试者在数据源A上的特征表征信息;(2)联合特征表征和相应的预测信息在训练集中搜寻测试者的Top-k个近邻。近邻选择基于测本文档来自技高网...

【技术保护点】
1.用于中医健康状态分析的四诊表征信息融合方法,其特征在于包括以下步骤:1)采集临床就诊患者的望、闻、问、切信息,用于生成病人的多源信息表示,并标注其隶属的证型类别;2)利用每个信息源的特征表征及其类别信息分别对测试者的健康状态进行分析,得到多个信息源对测试者的辅助决策信息;3)构建信息融合模型使得决策一致性最大化,用于返回优化的健康状态分析结果;4)对比测试者的实际健康状态与相应的预测结果来评价所提算法的性能。

【技术特征摘要】
1.用于中医健康状态分析的四诊表征信息融合方法,其特征在于包括以下步骤:1)采集临床就诊患者的望、闻、问、切信息,用于生成病人的多源信息表示,并标注其隶属的证型类别;2)利用每个信息源的特征表征及其类别信息分别对测试者的健康状态进行分析,得到多个信息源对测试者的辅助决策信息;3)构建信息融合模型使得决策一致性最大化,用于返回优化的健康状态分析结果;4)对比测试者的实际健康状态与相应的预测结果来评价所提算法的性能。2.如权利要求1所述用于中医健康状态分析的四诊表征信息融合方法,其特征在于在步骤1)中,所述采集临床就诊患者的望、闻、问、切信息,用于生成病人的多源信息表示,并标注其隶属的证型类别的具体方法为:(1)从电子病历中提取临床就诊患者的四诊表征信息,组成信息源A;利用望诊仪得到患者舌象,基于U-Net网络模型实现舌象分割,然后采用HSV、LAB和RGB描述算子获取舌象多个特征表示,分别组成信息源B、信息源C和信息源D;(2)医生对临床就诊患者的健康状态进行标记,记为{l1,l2,...,lq},1≤j≤q,其中lj为临床就诊患者的第j个证型,q为类别标记的总数;(3)采用十折交叉验证方法对算法进行验证:将处理好的标准化数据按照9︰1的比例进行划分,分为训练数据和测试数据。3.如权利要求1所述用于中医健康状态分析的四诊表征信息融合方法,其特征在于在步骤2)中,所述利用每个信息源的特征表征及其类别信息分别对测试者的健康状态进行分析,得到多个信息源对测试者的辅助决策信息的具体方法为:(1)采用SVM预测测试者的健康状态,计算公式为:其中,表示在数据源A上第i个测试者关于第j个证型的预测结果,表示第i个测试者在数据源A上的特征表征信息;(2)联合特征表征和相应的预测信息在训练集中搜寻测试者的Top-k个近邻,近邻选择基于测试者与训练样本的相似性关系,计算公式为:其中,包含测试者与训练样本在特征空间上的相似度,用余弦相似性方法计算得到;由杰卡德相似性方法求得,包含测试者与训练样本在标记空间上的相似度;β为阈值,其取值范围为[0,1...

【专利技术属性】
技术研发人员:代亮张佳林达真曹冬林李绍滋林旺庆
申请(专利权)人:厦门大学
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1