一种基于边信息的体检数据补全方法、装置及应用制造方法及图纸

技术编号:20922079 阅读:46 留言:0更新日期:2019-04-20 10:52
本发明专利技术公开了一种基于边信息的体检数据补全方法,包括(1)构建和根据边信息补全体检‑疾病矩阵、致病因子‑疾病矩阵、致病因子‑体检矩阵;(2)分别在任意两个矩阵之间建立编码解码网络D2F Net,D2C Net以及F2C Net;(3)联合训练D2F Net,D2C Net以及F2C Net,训练结束,致病因子‑疾病矩阵和致病因子‑体检矩阵已经被补全;(4)将待补全的体检‑疾病矩阵输入到D2F Net,D2C Net中,利用补全的致病因子‑疾病矩阵、致病因子‑体检矩阵和F2C Net,经计算补全体检‑疾病矩阵。还公开了一种基于边信息的体检数据补全装置,能够根据已有信息来补全体检数据和疾病结果。

A Method, Device and Application of Medical Examination Data Completion Based on Edge Information

The invention discloses a method for completing medical examination data based on edge information, which includes: (1) constructing and completing the whole examination, disease matrix, disease matrix and disease matrix based on edge information; (2) establishing coding and decoding networks D2F Net, D2C Net and F2C Net between any two matrices; (3) training D2F Net, D2C Net and F2C Net jointly, and training knots. The disease-causing factors, disease-causing factors and physical examination matrices have been completed; (4) The medical examination matrix to be completed is input into D2F Net and D2C Net, and the disease-causing factors, physical examination matrices and F2C Net are used to calculate the disease-causing factors matrix. A medical examination data completion device based on edge information is also disclosed, which can supplement all examination data and disease results according to existing information.

【技术实现步骤摘要】
一种基于边信息的体检数据补全方法、装置及应用
本专利技术属于数据统计和人工智能领域,具体涉及一种基于边信息的体检数据补全方法、装置及应用。
技术介绍
传统体检方案是经过一系列的体检以进行疾病筛查:根据不同的病症需要,在医生或者医疗手册的安排建议下进行相关生理特征项目的体检,再由医生通过相关的生理特征体检结果对患者可能患有的疾病进行诊断。由于体检项目繁多,不同的医院、医生以及时代都具有不同的检查方式,导致体检项目纷繁杂乱,无法统一,造成相关医疗资源的浪费和使病患无畏受累。随着科技的不断发展,不同体检项目隐含的生理特征相关性以及生理特征与疾病之间的影响程度等医疗知识的研究趋于完善,矩阵补全和边信息问题也得到了发展。矩阵补全(MatrixCompletion,简记为:MC)就是根据已知元素估计未知元素,从而把矩阵恢复完整的过程,是人工智能研究项目中的一个重点难点,其任务是通过人工智能算法对不完整的矩阵进行补全。该任务在数据挖掘,电商营销、工程控制、图像和视频处理中皆有重要的应用。在医疗项目中,不同医疗体检项目的统一有赖于矩阵补全算法,通过相关的体检项目推测未知的体检项目的效果。但是,因为矩阵补全技术目前往往通过线性变换、局部信息插值等方法,但是在利用背景知识进行非线性变换的研究较少,结果也不够完善。边信息(SideInformation)是指利用已有的信息Y辅助对信息X进行编码,可以使得信息X的编码长度更短。边信息见多用户信源编码。一个通俗的例子是:假设到马场去赌马,根据每个马的赔率可以得到一个最佳的投资方案。但是如果知道赌马的一些历史数据,例如上几场的胜负情况,那么可以得出一个更优的投资方案。赌马中的历史数据就是边信息。边信息算法是基于边信息补全矩阵中缺失信息的算法,即在信息流中找到相关和不相关的数据点,约束和辅助矩阵补全技术的完善,应用于各种需要矩阵补全的领域。边信息法还是传统机器学习中的一个分支,在与人工神经网络和深度学习的结合上也没有足够的尝试。医疗领域中,数据缺失如此严重,带标签数据稀少的情况也很常见,但却鲜有矩阵补全方法应用。
技术实现思路
本专利技术的目的是提供一种基于边信息的体检数据补全方法、装置,能够根据已有的信息来补全体检数据和疾病结果。本专利技术的另一目的是提供一种基于边信息的体检数据补全装置的应用,该装置用于重构疾病。为实现上述专利技术目的,提供以下技术方案:第一方面,一种基于边信息的体检数据补全方法,包括以下步骤:(1)构建列表示生理特征和疾病亚型,行表示患者,元素值为患者的生理特征检测值和疾病类型的体检-疾病矩阵;列表示疾病亚型,行表示致病因子,元素值为致病因子导致患疾病的概率的致病因子-疾病矩阵;以及列表示生理特征,行表示致病因子,元素值为致病因子与生理特征的相关性的致病因子-体检矩阵;(2)针对体检-疾病矩阵,根据体检项目数据补充生理特征检测值,根据医生的主观诊断结果补充疾病类型;针对致病因子-疾病矩阵和致病因子-体检矩阵,根据医学知识,补充已知致病因子导致已知疾病亚型的概率,补充已知致病因子与生理特征的相关性;(3)分别在体检-疾病矩阵和致病因子-疾病矩阵,体检-疾病矩阵和致病因子-体检矩阵,以及致病因子-疾病矩阵和致病因子-体检矩阵建立编码解码网络D2FNet,D2CNet以及F2CNet;(4)联合训练编码解码网络D2FNet,D2CNet以及F2CNet,当训练结束后,致病因子-疾病矩阵和致病因子-体检矩阵已经被补全;(5)将待补全的体检-疾病矩阵输入到D2FNet,D2CNet中,利用补全的致病因子-疾病矩阵、致病因子-体检矩阵和F2CNet,经计算补全体检-疾病矩阵。该体检数据补全方法能够根据已有的数据信息,通过编码和解码的方式对未知的信息进行补全,极大地减轻了一声繁重的工作量,减轻患者的经济和身体负担,此外,还能够帮助不同的医院、医生统一应用不同的体检结果,保证医疗资源不浪费。第二方面,一种基于边信息的体检数据补全装置,包括计算机存储器、计算机处理器以及存储在所述计算机存储器中并可在所述计算机处理器上执行的计算机程序,所述计算机存储器中存有通过第一方面所述的基于边信息的体检数据补全方法补全的致病因子-疾病矩阵、致病因子-体检矩阵以及D2FNet,D2CNet以及F2CNet的参数;所述计算机处理器执行所述计算机程序时实现以下步骤:接收输入的待补全的体检-疾病矩阵,利用补全的致病因子-疾病矩阵、致病因子-体检矩阵、D2FNet,D2CNet以及F2CNet对体检-疾病矩阵进行计算,输出补全的体检-疾病矩阵。该体检数据补全装置能够根据已有的数据信息和确定的致病因子-疾病矩阵、致病因子-体检矩阵,通过编码和解码的方式对未知的信息进行补全,极大地减轻了一声繁重的工作量,减轻患者的经济和身体负担,此外,还能够帮助不同的医院、医生统一应用不同的体检结果,保证医疗资源不浪费。第三方面,一种利用如第二方面所述的基于边信息的体检数据补全装置获得疾病结果的应用,根据输出的补全体检-疾病矩阵,查找获得疾病结果。根据该体检数据补全装置输出的补全体检-疾病矩阵获得的预测疾病亚型,准确率能达到95%以上,能辅助医生进行疾病诊断。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动前提下,还可以根据这些附图获得其他附图。图1是实施例提供的体检-疾病矩阵的一个示意形式;图2是实施例提供的致病因子-疾病矩阵的一个示意形式;图3是实施例提供的致病因子-体检矩阵的一个示意形式;图4是实施例提供的在体检-疾病矩阵、致病因子-疾病矩阵、以及致病因子-体检矩阵之间构建的编码解码网络的示意图。具体实施方式为使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例对本专利技术进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本专利技术,并不限定本专利技术的保护范围。为了解决体检费钱费力以及医生体检工作繁重的问题,本实施例提供的基于边信息的体检数据补全方法,具体包括以下步骤:S101、构建体检-疾病矩阵、致病因子-疾病矩阵以及致病因子-体检矩阵。针对体检-疾病矩阵,列表示生理特征和疾病亚型,行表示患者,元素值为患者的生理特征检测值和疾病类型。其中,生理特征是指人体的一些生理信息,一般都是体检的项目,包括身高、体重、心率、血常规20相等,疾病亚型是医生主观诊断的疾病类型,如高血压、糖尿病等。图1给出了一个示意性的体检-疾病矩阵,不包含任何真实信息,仅用于描述体检-疾病矩阵的结构。根据图1所示,行表示不同的患者,列表示不同的体检项目,如球蛋白、洪锡标、谷丙转氨酶等,列还表示患者的体检结果,如A、B、C、D、E、F、G等。体检-疾病矩阵中,对于以阴阳表示的生理特征,以阳表示的生理特征对应的检测值用1表示,以阴表示的生理特征对应的检测值用0表示。针对致病因子-疾病矩阵,列表示疾病亚型,分为显性和隐性,对于已知的疾病即为显性疾病亚型,对于未知的疾病即为隐性疾病亚型,行表示致病因子,致病因子也分为显性和隐性,已知的致病因子即为显性致病因子,未知致病因本文档来自技高网
...

【技术保护点】
1.一种基于边信息的体检数据补全方法,包括以下步骤:(1)构建列表示生理特征和疾病亚型,行表示患者,元素值为患者的生理特征检测值和疾病类型的体检‑疾病矩阵;列表示疾病亚型,行表示致病因子,元素值为致病因子导致患疾病的概率的致病因子‑疾病矩阵;以及列表示生理特征,行表示致病因子,元素值为致病因子与生理特征的相关性的致病因子‑体检矩阵;(2)针对体检‑疾病矩阵,根据体检项目数据补充生理特征检测值,根据医生的主观诊断结果补充疾病类型;针对致病因子‑疾病矩阵和致病因子‑体检矩阵,根据医学知识,补充已知致病因子导致已知疾病亚型的概率,补充已知致病因子与生理特征的相关性;(3)分别在体检‑疾病矩阵和致病因子‑疾病矩阵,体检‑疾病矩阵和致病因子‑体检矩阵,以及致病因子‑疾病矩阵和致病因子‑体检矩阵建立编码解码网络D2F Net,D2C Net以及F2C Net;(4)联合训练编码解码网络D2F Net,D2C Net以及F2C Net,当训练结束后,致病因子‑疾病矩阵和致病因子‑体检矩阵已经被补全;(5)将待补全的体检‑疾病矩阵输入到D2F Net,D2C Net中,利用补全的致病因子‑疾病矩阵、致病因子‑体检矩阵和F2C Net,经计算补全体检‑疾病矩阵。...

【技术特征摘要】
1.一种基于边信息的体检数据补全方法,包括以下步骤:(1)构建列表示生理特征和疾病亚型,行表示患者,元素值为患者的生理特征检测值和疾病类型的体检-疾病矩阵;列表示疾病亚型,行表示致病因子,元素值为致病因子导致患疾病的概率的致病因子-疾病矩阵;以及列表示生理特征,行表示致病因子,元素值为致病因子与生理特征的相关性的致病因子-体检矩阵;(2)针对体检-疾病矩阵,根据体检项目数据补充生理特征检测值,根据医生的主观诊断结果补充疾病类型;针对致病因子-疾病矩阵和致病因子-体检矩阵,根据医学知识,补充已知致病因子导致已知疾病亚型的概率,补充已知致病因子与生理特征的相关性;(3)分别在体检-疾病矩阵和致病因子-疾病矩阵,体检-疾病矩阵和致病因子-体检矩阵,以及致病因子-疾病矩阵和致病因子-体检矩阵建立编码解码网络D2FNet,D2CNet以及F2CNet;(4)联合训练编码解码网络D2FNet,D2CNet以及F2CNet,当训练结束后,致病因子-疾病矩阵和致病因子-体检矩阵已经被补全;(5)将待补全的体检-疾病矩阵输入到D2FNet,D2CNet中,利用补全的致病因子-疾病矩阵、致病因子-体检矩阵和F2CNet,经计算补全体检-疾病矩阵。2.如权利要求1所述的基于边信息的体检数据补全方法,其特征在于,体检-疾病矩阵中,对于以阴阳表示的生理特征,以阳表示的生理特征对应的检测值用1表示,以阴表示的生理特征对应的检测值用0表示。3.如权利要求2所述的基于边信息的体检数据补全方法,其特征在于,D2FNet,D2CNet以及F2CNet的网络结构均为由卷积层搭建的自编码器和反卷积搭建的自解码器。4.如权利要求3所述的基于边信息的体检数据补全方法,其特征在于,当补全致病因子-疾病矩阵时,采用D2FNet和F2CNet对致病因子-疾病矩阵进行补全,具体地,对于D2FNet,以体检-疾病矩阵作为输入变量,采用自编码器对体检-疾病矩阵进行编码产生重构致病因子-疾病矩阵,采用自解码器对重构致病因子-疾病矩阵进行解码,产生重构体检-疾病矩阵,以体检-疾病矩阵与重构体检-疾病矩阵的离差平方和损失函数,和因子-疾病矩阵与重构因子-疾病矩阵的离差平方和损失函数之和作为D2FNet的损失函数L1;对于F2CNet,以致病因子-体检矩阵作为输入变量,采用自编码器对致病因子-体检矩阵进行编码产生重构致病因子-疾病矩阵,采用自解码器对重构致病因子-疾病矩阵进行解码,产生重构致病因子-体检矩阵,以致病因子-体检矩阵与重构致病因子-体检矩阵的离差平方和损失函数,和致病因子-疾病矩阵与重构致病因子-疾病矩阵的离差平方和损失函数之和作为F2CNet的损失函数L2;以损失函数L1和损失函数L2之和L1作为补全致病因子-疾病矩阵的总损失函数。5.如权利要求4所述的基于边信息的体检数据补全方法,其特征在于,当补全致病因子-体检矩阵时,采用F2CNet和D2CNet对致病因子-体检矩阵进行补全,具体地,对于F2CNet,以致病因子-疾病矩阵作为输入变量,采用自编码...

【专利技术属性】
技术研发人员:吴健陈晋泰郭若乾冯芮苇雷璧闻王文哲陆逸飞吴福理
申请(专利权)人:浙江大学山东工业技术研究院
类型:发明
国别省市:山东,37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1