基于自回归模型的报告单编码模型生成方法、系统和设备技术方案

技术编号:25124824 阅读:35 留言:0更新日期:2020-08-05 02:54
本发明专利技术公开了一种基于自回归模型的报告单编码模型生成方法,包括:初始化预先构建的初始训练模型中的网络参数;根据第一预设循环次数使得初始训练模型进入一次循坏迭代;在初始训练模型中输入训练数据,以对初始训练模型进行训练;计算预设的损失函数的损失值;通过反向传播算法将损失值用于修正网络参数;根据第二预设循环次数使得初始训练模型进入二次循坏迭代;对初始训练模型进行拆分,以在初始训练模型中拆分出编码器作为编码模型。本发明专利技术还公开了一种基于自回归模型的报告单编码模型生成系统和设备。采用本发明专利技术实施例生成的编码模型能够学习到非线性的特征表示,有利于后续任务算法的效果的提升,采用无监督算法,可以节省人力标注的成本。

【技术实现步骤摘要】
基于自回归模型的报告单编码模型生成方法、系统和设备
本专利技术涉及数据编码领域,尤其涉及一种基于自回归模型的报告单编码模型生成方法、系统和设备。
技术介绍
目前对应医疗检测报告单的结果分析主要针对某类报告单中的检测项目进行结果值的分析,检测的结果值跟统计的参考值进行对比,得到最终的报告单结果。报告单的大部分结果值经过大量试验和病人治疗期间的临床表现得到佐证,但检测报告单的结果值仍然还有很大的研究和挖掘的空间。在某特定的时间点上,同时通过多种检测方法对受检者进行检测,不仅可以提供检测结果的准确性,而且可以更加全面的了解生物体目前的状态,为临床治疗提供更加详细的病人身体数据。但随着检测项目和累计的报告单的数量的增多,带来的挑战也越来越大。主要原因是人的生物状态信息通过检测结果被投射到了一个高维的数据空间中,通过传统的统计学方法分析检测项目之间和临床表现之间的相关性变的越来越难,对于检测项目的特征工程效率低下,导致整个检测项目数据分析的过程漫长且昂贵,因此,亟待一个编码模型能够对检测项目数据进行编码,以提取检测报告的数据特征。
技术实现思路
本专利技术实施例的目的是提供一种基于自回归模型的报告单编码模型生成方法、系统和设备,生成的编码模型能够学习到非线性的特征表示,有利于后续任务算法的效果的提升,采用无监督算法,操作方便,可以节省大量人力标注的成本。为实现上述目的,本专利技术实施例提供了一种基于自回归模型的报告单编码模型生成方法,包括:初始化预先构建的初始训练模型中的网络参数;其中,所述初始训练模型为自回归模型,所述初始训练模型包括编码器,所述网络参数为编码器参数;根据第一预设循环次数使得所述初始训练模型进入一次循坏迭代;在所述初始训练模型中输入训练数据,以对所述初始训练模型进行训练;其中,所述训练数据包括与报告单中的检测项目对应的检测结果值,所述检测结果值按照预设顺序排列;计算预设的损失函数的损失值;通过反向传播算法将所述损失值用于修正所述网络参数;根据第二预设循环次数使得所述初始训练模型进入二次循坏迭代;对所述初始训练模型进行拆分,以在所述初始训练模型中拆分出所述编码器作为编码模型。与现有技术相比,本专利技术实施例公开的基于自回归模型的报告单编码模型生成方法,首先,初始化预先构建的初始训练模型中的网络参数;然后,根据第一预设循环次数使得初始训练模型进入一次循坏迭代,在初始训练模型中输入训练数据,以对所述初始训练模型进行训练,利用初始训练模型计算预设损失函数的损失值,通过反向传播算法将损失值用于修正所述网络参数,根据第二预设循环次数使得所述初始训练模型进入二次循坏迭代;最后,对所述初始训练模型进行拆分,在所述初始训练模型拆分出所述编码器作为数据编码模型。本专利技术实施例所述的基于自回归模型的报告单编码模型生成方法生成的编码模型能够学习到非线性的特征表示,有利于后续任务算法的效果的提升,采用无监督算法,操作方便,可以节省大量人力标注的成本。作为上述方案的改进,所述在所述初始训练模型中输入训练数据,以对所述初始训练模型进行训练,具体包括:选取所述检测结果值中的一个数值作为锚点;将排列位置位于所述锚点前的若干个检测结果值组成所述锚点的上下文信息;将排列位置位于所述锚点后的检测结果值与所述上下文信息组成正例对,并将其他检测结果值与所述上下文信息组成负例对;将所述正例对和所述负例对输入所述编码器,以对所述编码器进行训练。作为上述方案的改进,所述训练数据还包括检测结果信息,所述检测结果信息通过concat的拼接方式和卷积网络融合到所述上下文信息中;其中,所述接测结果信息包括用户信息、检测项目信息和量纲信息中的至少一种。作为上述方案的改进,所述方法还包括:使用随机梯度下降算法对所述初始训练模型进行网络参数调整。作为上述方案的改进,所述初始化预先构建的初始训练模型中的网络参数,具体包括:利用截断随机高斯初始化预先构建的初始训练模型中的网络参数。为实现上述目的,本专利技术实施例还提供了一种基于自回归模型的报告单编码模型生成系统,包括:网络参数初始化模块,用于初始化预先构建的初始训练模型中的网络参数;其中,所述初始训练模型为自回归模型,所述初始训练模型包括编码器,所述网络参数为编码器参数;一次循坏迭代模块,用于根据第一预设循环次数使得所述初始训练模型进入一次循坏迭代;训练模块,用于在所述初始训练模型中输入训练数据,以对所述初始训练模型进行训练;其中,所述训练数据包括与报告单中的检测项目对应的检测结果值,所述检测结果值按照预设顺序排列;损失值计算模块,用于计算预设的损失函数的损失值;网络参数修正模块,用于通过反向传播算法将所述损失值用于修正所述网络参数;二次循坏迭代模块,用于根据第二预设循环次数使得所述初始训练模型进入二次循坏迭代;编码模型生成模块,用于对所述初始训练模型进行拆分,以在所述初始训练模型中拆分出所述编码器作为编码模型。与现有技术相比,本专利技术实施例公开的基于自回归模型的报告单编码模型生成系统,首先,网络参数初始化模块初始化预先构建的初始训练模型中的网络参数;然后,一次循坏迭代模块根据第一预设循环次数使得初始训练模型进入一次循坏迭代,训练模块在初始训练模型中输入训练数据,以对所述初始训练模型进行训练,损失值计算模块利用初始训练模型计算预设损失函数的损失值,网络参数修正模块通过反向传播算法将损失值用于修正所述网络参数,二次循坏迭代模块根据第二预设循环次数使得所述初始训练模型进入二次循坏迭代;最后,编码模型生成模块对所述初始训练模型进行拆分,在所述初始训练模型拆分出所述编码器作为数据编码模型。本专利技术实施例所述的基于自回归模型的报告单编码模型生成系统生成的编码模型能够学习到非线性的特征表示,有利于后续任务算法的效果的提升,采用无监督算法,操作方便,可以节省大量人力标注的成本。作为上述方案的改进,所述训练模块具体用于:选取所述检测结果值中的一个数值作为锚点;将排列位置位于所述锚点前的若干个检测结果值组成所述锚点的上下文信息;将排列位置位于所述锚点后的检测结果值与所述上下文信息组成正例对,并将其他检测结果值与所述上下文信息组成负例对;将所述正例对和所述负例对输入所述编码器,以对所述编码器进行训练。作为上述方案的改进,所述训练数据还包括检测结果信息,所述检测结果信息通过concat的拼接方式和卷积网络融合到所述上下文信息中;其中,所述接测结果信息包括用户信息、检测项目信息和量纲信息中的至少一种。作为上述方案的改进,所述系统还包括:网络参数调整模块,用于使用随机梯度下降算法对所述初始训练模型进行网络参数调整。为实现上述目的,本专利技术实施例还提供一种基于自回归模型的报告单编码模型生成设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序本文档来自技高网...

【技术保护点】
1.一种基于自回归模型的报告单编码模型生成方法,其特征在于,包括:/n初始化预先构建的初始训练模型中的网络参数;其中,所述初始训练模型为自回归模型,所述初始训练模型包括编码器,所述网络参数为编码器参数;/n根据第一预设循环次数使得所述初始训练模型进入一次循坏迭代;/n在所述初始训练模型中输入训练数据,以对所述初始训练模型进行训练;其中,所述训练数据包括与报告单中的检测项目对应的检测结果值,所述检测结果值按照预设顺序排列;/n计算预设的损失函数的损失值;/n通过反向传播算法将所述损失值用于修正所述网络参数;/n根据第二预设循环次数使得所述初始训练模型进入二次循坏迭代;/n对所述初始训练模型进行拆分,以在所述初始训练模型中拆分出所述编码器作为编码模型。/n

【技术特征摘要】
1.一种基于自回归模型的报告单编码模型生成方法,其特征在于,包括:
初始化预先构建的初始训练模型中的网络参数;其中,所述初始训练模型为自回归模型,所述初始训练模型包括编码器,所述网络参数为编码器参数;
根据第一预设循环次数使得所述初始训练模型进入一次循坏迭代;
在所述初始训练模型中输入训练数据,以对所述初始训练模型进行训练;其中,所述训练数据包括与报告单中的检测项目对应的检测结果值,所述检测结果值按照预设顺序排列;
计算预设的损失函数的损失值;
通过反向传播算法将所述损失值用于修正所述网络参数;
根据第二预设循环次数使得所述初始训练模型进入二次循坏迭代;
对所述初始训练模型进行拆分,以在所述初始训练模型中拆分出所述编码器作为编码模型。


2.如权利要求1所述的基于自回归模型的报告单编码模型生成方法,其特征在于,所述在所述初始训练模型中输入训练数据,以对所述初始训练模型进行训练,具体包括:
选取所述检测结果值中的一个数值作为锚点;
将排列位置位于所述锚点前的若干个检测结果值组成所述锚点的上下文信息;
将排列位置位于所述锚点后的检测结果值与所述上下文信息组成正例对,并将其他检测结果值与所述上下文信息组成负例对;
将所述正例对和所述负例对输入所述编码器,以对所述编码器进行训练。


3.如权利要求2所述的基于自回归模型的报告单编码模型生成方法,其特征在于,所述训练数据还包括检测结果信息,所述检测结果信息通过concat的拼接方式和卷积网络融合到所述上下文信息中;其中,所述接测结果信息包括用户信息、检测项目信息和量纲信息中的至少一种。


4.如权利要求1所述的基于自回归模型的报告单编码模型生成方法,其特征在于,所述方法还包括:
使用随机梯度下降算法对所述初始训练模型进行网络参数调整。


5.如权利要求1所述的基于自回归模型的报告单编码模型生成方法,其特征在于,所述初始化预先构建的初始训练模型中的网络参数,具体包括:
利用截断随机高斯初始化预先构建的初始训练模型中的网络参数。


6.一种基于自回归模型的报告单编码模型生成系统,其特征在于,包括:

【专利技术属性】
技术研发人员:陶然罗秀萍廖倩田德伟
申请(专利权)人:重庆金域医学检验所有限公司
类型:发明
国别省市:重庆;50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1