本发明专利技术实施例涉及一种利用心搏时间序列生成心搏标签序列的处理方法和装置,方法包括:获取心搏时间序列;心搏时间序列包括多导联心搏数据;按照设定数据量对多导联心搏数据进行数据切割,得到多组心搏分析数据;将多组心搏分析数据进行数据组合,得到四维张量数据{B,H,W,C};对四维张量数据进行张量格式转换处理,将四维张量数据中的高度数据收缩为1,并对宽度数据进行压缩,输出为{B,1,W
The processing method and device of generating heart beat tag sequence by using heart beat time series
【技术实现步骤摘要】
利用心搏时间序列生成心搏标签序列的处理方法和装置
本专利技术涉及数据处理
,尤其涉及一种利用心搏时间序列生成心搏标签序列的处理方法和装置。
技术介绍
心血管疾病是威胁人类健康的主要疾病之一,利用有效的手段对心血管疾病进行检测是目前全世界关注的重要课题。心电图(ECG)是现代医学中诊断心血管疾病的主要方法,利用ECG诊断各种心血管疾病,本质上就是提取ECG的特征数据对ECG进行分类的过程。专家医生在心电图的阅读分析过程中,都是需要同时比较各个导联(单导数据除外)的信号在时间顺序上的变化,导联之间的相关性(空间关系)和变异,然后才能够做出一个比较准确的判断。而这种依赖于医生经验的方式,准确率无法得到保障。随着科技的进步,利用计算机对ECG进行自动准确的分析已经得到了快速的发展。但是,虽然市场上大多数的心电图分析软件都可以对数据进行自动分析,但由于心电图信号本身的复杂与变异性,目前自动分析软件的准确率远远不够,无法达到临床分析使用的要求。
技术实现思路
本专利技术的目的是针对现有技术的缺陷,提供一种利用心搏时间序列生成心搏标签序列的处理方法。本方法通过将心搏时间序列建模为自然语言中的“源语句”,将心搏时间序列的标签序列建模为“目标语句”,对Transformer模型进行改进训练,利用训练后的模型对基于心搏时间序列处理转换得到的嵌入特征张量进行处理,输出心搏标签序列。为实现上述目的,第一方面,本专利技术提供了一种利用心搏时间序列生成心搏标签序列的处理方法,包括:获取心搏时间序列;所述心搏时间序列包括多导联心搏数据;按照设定数据量对所述多导联心搏数据进行数据切割,得到多组心搏分析数据;将所述多组心搏分析数据进行数据组合,得到四维张量数据;所述四维张量数据具有四个因子{B,H,W,C},其中因子B为批量数据、因子H为高度数据、因子W为宽度数据、因子C为通道数据;所述批量数据为所述多组心搏分析数据的组数;对所述四维张量数据进行张量格式转换处理,将所述四维张量数据中的高度数据收缩为1,并对宽度数据进行压缩,输出为{B,1,W1,C1}的输出张量;对所述输出张量进行转换,得到特征张量{B,W1,C1};将所述特征张量与随机初始化的权重矩阵相乘,输出嵌入特征张量{B,W1,dmodel};其中,dmodel为输入到Transformer模型的特征向量的维度;将所述嵌入特征张量输入到训练好的Transformer模型,输出所述心搏时间序列对应的心搏标签序列。优选的,在所述将所述嵌入特征张量输入到训练好的Transformer模型之前,所述方法还包括:训练所述Transformer模型。进一步优选的,所述训练所述Transformer模型具体包括:对作为训练样本的心搏时间序列进行心搏数据的数据标注;所述数据标注包括对心搏数据的心搏类型和心搏R点位置的标注;按照设定采样频率和采样长度进行第一数据量的心搏片段提取;在提取到的心搏片段中,根据所述数据标注确定所述心搏R点位置对应的心搏类型,得到神经网络机器翻译(NeuralMachineTranslation,NMT)标签序列;对所述NMT标签序列进行整理,得到符合自然语言处理(NaturalLanguageProcessing,NLP)模型语句要求的作为训练样本的心搏标签序列;以作为训练样本的心搏时间序列和作为训练样本的心搏标签序列对Transformer模型进行训练。进一步优选的,所述对所述NMT标签序列进行整理具体包括:确定所述心搏标签序列的字段长度;在所述NMT标签序列的第一个字段之前添加标记“S”;在所述NMT标签序列的最后一个字段之后添加标记“/S”;根据所述字段长度,在所述标记“/S”之后的字段中填充标记“Pad”。进一步优选的,所述以作为训练样本的心搏时间序列和作为训练样本的心搏标签序列对Transformer模型进行训练具体包括:对所述作为训练样本的心搏时间序列按照上述权利要求1所述方法得到所述户作为训练样本的心搏时间序列的训练样本的嵌入特征张量{B,W1,dmodel};将所述训练样本的嵌入特征张量{B,W1,dmodel},和,数据标注得到NMT标签序列作为训练样本输入数据,将所述整理得到的训练样本的心搏标签序列作为训练样本输出数据,对所述Transformer模型进行训练。优选的,所述对所述四维张量数据进行张量格式转换处理,将所述四维张量数据中的高度数据收缩为1,并对宽度数据进行压缩,输出为{B,1,W1,C1}的输出张量具体为:设定多导联心搏数据的导联数量为所述四维张量数据的高度数据;按照设定步幅,对所述四维张量数据使用CNN卷积神经网络进行多层网络卷积计算,得到高度数据收缩为1且宽度数据被压缩的输出张量。优选的,所述Transformer模型为基于注意力机制,采用了编码器-译码器架构的模型。本专利技术实施例提供的利用心搏时间序列生成心搏标签序列的处理方法。本方法通过将心搏时间序列建模为自然语言中的“源语句”,将心搏时间序列的标签序列建模为“目标语句”,对Transformer模型进行改进训练,利用训练后的模型对基于心搏时间序列处理转换得到的嵌入特征张量进行处理,输出心搏标签序列。第二方面,本专利技术实施例提供了一种设备,该设备包括存储器和处理器,存储器用于存储程序,处理器用于执行第一方面及第一方面的各实现方式中的方法。第三方面,本专利技术实施例提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行第一方面及第一方面的各实现方式中的方法。第四方面,本专利技术实施例提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现第一方面及第一方面的各实现方式中的方法。附图说明图1为本专利技术实施例提供的利用心搏时间序列生成心搏标签序列的数据处理系统结构示意图;图2为本专利技术实施例提供的利用心搏时间序列生成心搏标签序列的处理方法流程图;图3为本专利技术实施例提供的Transformer模型的训练方法流程图;图4为本专利技术实施例提供的初步特征提取CNN模块示例图;图5为本专利技术实施例提供的Transformer模型结构示意图;图6为本专利技术实施例提供的一种设备结构示意图。具体实施方式下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。本专利技术实施例提供的利用心搏时间序列生成心搏标签序列的处理方法,可以用于心搏标签序列的生成。心律失常往往是序列性的改变,虽然每个心搏的定位、定性是分析的基点,但从序列层面统揽全局才能做到全面,准确。诸如文氏现象、干扰性分离、并行收缩、传出阻滞等,绝非是基于少数几个心搏可以作出诊断的。因此形成心搏标签序列对于心电分析是非常有意义且必要的。图1为本专利技术实施例提供的本专利技术实施本文档来自技高网...
【技术保护点】
1.一种利用心搏时间序列生成心搏标签序列的处理方法,其特征在于,所述处理方法包括:/n获取心搏时间序列;所述心搏时间序列包括多导联心搏数据;/n按照设定数据量对所述多导联心搏数据进行数据切割,得到多组心搏分析数据;/n将所述多组心搏分析数据进行数据组合,得到四维张量数据;所述四维张量数据具有四个因子{B,H,W,C},其中因子B为批量数据、因子H为高度数据、因子W为宽度数据、因子C为通道数据;所述批量数据为所述多组心搏分析数据的组数;/n对所述四维张量数据进行张量格式转换处理,将所述四维张量数据中的高度数据收缩为1,并对宽度数据进行压缩,输出为{B,1,W
【技术特征摘要】
1.一种利用心搏时间序列生成心搏标签序列的处理方法,其特征在于,所述处理方法包括:
获取心搏时间序列;所述心搏时间序列包括多导联心搏数据;
按照设定数据量对所述多导联心搏数据进行数据切割,得到多组心搏分析数据;
将所述多组心搏分析数据进行数据组合,得到四维张量数据;所述四维张量数据具有四个因子{B,H,W,C},其中因子B为批量数据、因子H为高度数据、因子W为宽度数据、因子C为通道数据;所述批量数据为所述多组心搏分析数据的组数;
对所述四维张量数据进行张量格式转换处理,将所述四维张量数据中的高度数据收缩为1,并对宽度数据进行压缩,输出为{B,1,W1,C1}的输出张量;
对所述输出张量{B,1,W1,C1}进行转换,得到特征张量{B,W1,C1};
将所述特征张量与随机初始化的权重矩阵相乘,输出嵌入特征张量{B,W1,dmodel};其中,dmodel为输入到Transformer模型的特征向量的维度;
将所述嵌入特征张量输入到训练好的Transformer模型,输出所述心搏时间序列对应的心搏标签序列。
2.根据权利要求1所述的处理方法,其特征在于,在所述将所述嵌入特征张量输入到训练好的Transformer模型之前,所述方法还包括:训练所述Transformer模型。
3.根据权利要求2所述的处理方法,其特征在于,所述训练所述Transformer模型具体包括:
对作为训练样本的心搏时间序列进行心搏数据的数据标注;所述数据标注包括对心搏数据的心搏类型和心搏R点位置的标注;
按照设定采样频率和采样长度进行第一数据量的心搏片段提取;
在提取到的心搏片段中,根据所述数据标注确定所述心搏R点位置对应的心搏类型,得到神经网络机器翻译NMT标签序列;
对所述NMT标签序列进行整理,得到符合自然语言处理NLP模型语句要求的作为训练样本的心搏标签序列;
以作为训练样本的心搏时间序列和作为训练样本的心搏标签序列对Transformer模型进行训练。
4.根据权利要求3所述的处理方...
【专利技术属性】
技术研发人员:王斌,曹君,
申请(专利权)人:上海优加利健康管理有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。