补充缺失数据的生成器模型训练方法和系统技术方案

技术编号:36876811 阅读:9 留言:0更新日期:2023-03-15 20:43
本发明专利技术公开了一种补充缺失数据的生成器模型训练方法、系统、存储介质和处理器。获取患者数据并填充对应的时态信息索引得到患者信息;将患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,将第一特征矩阵输入至感知经验池中得到第二特征矩阵;将第二特征矩阵输入至第二列多尺度神经场模块得到填充好的患者信息和生成器模型,将完整患者原始数据与填充好的患者信息随机输入至判别器模型当中,计算一致性指数对判别器模型和生成器模型进行优化。通过本发明专利技术解决了现有技术在有时间序列的临床数据上无法预测缺失数据使缺失数据得到较好填充的问题,能够更加快速高效的处理有时间序列的临床数据。理有时间序列的临床数据。理有时间序列的临床数据。

【技术实现步骤摘要】
补充缺失数据的生成器模型训练方法和系统


[0001]本专利技术涉及数据处理领域,具体而言,涉及一种补充缺失数据的生成器模型训练的方法、系统、存储介质和处理器。

技术介绍

[0002]数据缺失是大数据处理当中比较常见需要解决的问题之一。在临床大数据当中,患者的指标数据往往是不全面的、较为稀疏的。对于数学模型而言,想要建立一个较为健壮的数学模型从而精准的对患者进行分类或回归,其输入数据的质量高低是非常重要的。而质量的高低很大程度上取决于有效数据的规模、数据的缺失程度以及多样性。当前业界常用的量化方法大体上分为三种:赋值填充、回归填充、序列填充、混合填充:混合填充结合了以上三种填充方法,并根据数据集情况建立规则来决定何时使用赋值填充、何时使用回归填充。本质上是大量人工参与的填充。
[0003]上述方式均无法在有时间序列的临床数据上预测缺失数据得到较好的填充。
[0004]针对现有技术在有时间序列的临床数据上无法预测缺失数据使缺失数据得到较好填充的技术问题,目前尚未提出有效地解决方案。

技术实现思路

[0005]本专利技术提供了一种补充缺失数据的生成器模型训练的方法、系统、存储介质和处理器,以解决现有技术在有时间序列的临床数据上无法预测缺失数据得到较好填充的问题。
[0006]根据本专利技术实施例的一个方面,提供了一种补充缺失数据的生成器模型训练方法,包括:获取患者数据并填充对应的时态信息索引得到患者信息;将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;将所述第二特征矩阵输入至所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中,在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化;直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。
[0007]进一步地,将所述患者信息依次输入至所述第一列多尺度神经场模块得到所述第一特征矩阵包括:将每个所述患者信息同时输入至不同尺度的多个卷积神经网络、全连接神经网络、极大值选取过程进行运算获得各自运算的特征图;将输入不同尺度的多个所述卷积神经网络运算得到的特征图和输入所述极大值选取过程运算得到的特征图,进行矩阵
拼接得到第一拼接矩阵;将输入所述全连接神经网络获得的特征图与所述第一拼接矩阵进行相乘得到第二拼接矩阵;创建高斯随机数矩阵与所述第二拼接矩阵相乘并将结果经过Sigmoid函数激活后得到第一激活特征矩阵;将所述第一拼接矩阵输入至递归神经网络中,得到待预测结果的当前时态信息;将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息。
[0008]进一步地,将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息之后包括:将所述当前时态的患者信息和将下一时态的患者信息输入至所述第一列多尺度神经场模块中下一个第一多尺度神经场模块得到下一时态的患者信息;直至将所述患者信息依次输入至所述第一列多尺度神经场模块中所有的第一多尺度神经场模块为止,得到所述第一特征矩阵。
[0009]进一步地,将所述第一特征矩阵输入至所述感知经验池中得到所述第二特征矩阵包括:获取预设权重矩阵,其中,所述预设权重矩阵为多个;将所述第一特征矩阵分别与所述预设权重矩阵相乘得到多个过程矩阵;将多个所述过程矩阵通过最大池化放缩至相同大小;将放缩后的多个所述过程矩阵进行拼接得到第三拼接矩阵;将所述第三拼接矩阵当中小于等于零的元素保持不变;将所述第三拼接矩阵当中大于零的元素进行开平方根获得第二特征矩阵。
[0010]进一步地,将所述第二特征矩阵输入至所述第二列多尺度神经场模块得到所述填充好的患者信息和所述生成器模型包括:将所述第二特征矩阵与从输入所述第一列多尺度神经场模块获得的患者信息共同输入至所述第二列多尺度神经场模块中的所述第二多尺度神经场模块,获得新的患者数据;将所述新的患者数据与下一时态患者信息共同输入至所述第二列多尺度神经场模块中的所述第二多尺度神经场模块,获得下一时态的患者数据直至依次输入至所述第二列多尺度神经场模块中的全部第二多尺度神经场模块进行计算为止,得到所述填充好的患者信息和所述生成器模型。
[0011]根据本专利技术实施例的另一个方面,还提供了一种补充缺失数据的生成器模型训练系统,包括:获取单元,用于获取患者数据并填充对应的时态信息索引得到患者信息;第一列多尺度神经场单元,用于将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;感知经验池单元,用于将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;第二列多尺度神经场单元,用于将所述第二特征矩阵输入至所述所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;第一判别器单元,用于将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中,第二判别器单元,用于在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;第三判别器单元,用于在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化,直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。
[0012]根据本专利技术实施例的另一个方面,还提供给了一种存储介质,所述存储介质上保存有程序,所述程序被运行时执行上所述的方法。
[0013]根据本专利技术实施例的另一个方面,还提供给了一种处理器,所述程序被运行时执行上述的方法。
[0014]根据本专利技术实施例中,采用获取患者数据并填充对应的时态信息索引得到患者信息;将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;将所述第二特征矩阵输入至所述所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;将完整患者原始数据与本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种补充缺失数据的生成器模型训练方法,其特征在于,包括:获取患者数据并填充对应的时态信息索引得到患者信息;将所述患者信息依次输入至第一列多尺度神经场模块得到第一特征矩阵,其中,所述第一列多尺度神经场模块包括多个第一多尺度神经场模块;将所述第一特征矩阵输入至感知经验池中得到第二特征矩阵;将所述第二特征矩阵输入至所述第二列多尺度神经场模块得到填充好的患者信息和生成器模型,其中,所述第二列多尺度神经场模块包括多个第二多尺度神经场模块,所述第一多尺度神经场模块与所述第二多尺度神经场模块数量相同;将完整患者原始数据与所述填充好的患者信息随机输入至判别器模型当中;在输入至所述判别器模型的数据为所述完整患者原始数据的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型进行单独优化;在输入至所述判别器的数据为所述填充好的患者信息的情况下,计算所述一致性指数,将所述一致性指数作为Loss对所述判别器模型和所述生成器模型同时进行优化;直到当所述一致性指数不再发生变化时,停止训练得到最终的生成器模型。2.根据权利要求1所述的方法,其特征在于,将所述患者信息依次输入至所述第一列多尺度神经场模块得到所述第一特征矩阵包括:将每个所述患者信息同时输入至不同尺度的多个卷积神经网络、全连接神经网络、极大值选取过程进行运算获得各自运算的特征图;将输入不同尺度的多个所述卷积神经网络运算得到的特征图和输入所述极大值选取过程运算得到的特征图,进行矩阵拼接得到第一拼接矩阵;将输入所述全连接神经网络获得的特征图与所述第一拼接矩阵进行相乘得到第二拼接矩阵;创建高斯随机数矩阵与所述第二拼接矩阵相乘并将结果经过Sigmoid函数激活后得到第一激活特征矩阵;将所述第一拼接矩阵输入至递归神经网络中,得到待预测结果的当前时态信息;将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息。3.根据权利要求2所述的方法,其特征在于,将所述待预测结果的时态信息经过ReLU函数激活后,与所述第一激活特征矩阵做点乘,得到每个当前时态的患者信息之后包括:将所述当前时态的患者信息和将下一时态的患者信息输入至所述第一列多尺度神经场模块中下一个第一多尺度神经场模块得到下一时态的患者信息;直至将所述患者信息依次输入至所述第一列多尺度神经场模块中所有的第一多尺度神经场模块为止,得到所述第一特征矩阵。4.根据权利要求1所述的方法,其特征在于,将所述第一特征矩阵输入至所述感知经验池中得到所述第二特征矩阵包括:获取...

【专利技术属性】
技术研发人员:田永谦郭锐翰王苏宏肖志峰陈子东
申请(专利权)人:北京白星花科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1