一种基于机器学习的甲状腺采样数据识别方法及装置制造方法及图纸

技术编号:36184463 阅读:13 留言:0更新日期:2022-12-31 20:45
本申请提出一种基于机器学习的甲状腺采样数据识别方法及装置,其中所述识别方法包括:对待测对象的颈前部施加激励源,获取m个待测对象在不同激励条件下的采样数据;将采集到的采样数据进行预处理,并整理成第一数据集,将所述第一数据集内的样本数据输入甲状腺识别模型,所述第一数据集的样本数据经过所述甲状腺识别模型中的特征提取步骤和类别识别步骤后输出,根据输出结果判定所述采样数据的阈值是否超出预设范围。特征提取步骤使用基于注意机制和卷积神经网络的特征提取网络,获得文本的更多相互关系,挖掘文本更多的特征信息;类别识别步骤使用机器学习算法处理特征提取后的数据,既考虑到了线性可分的情况也考虑到了线性不可分的情况。了线性不可分的情况。了线性不可分的情况。

【技术实现步骤摘要】
一种基于机器学习的甲状腺采样数据识别方法及装置


[0001]本专利技术涉及医学数据处理
,尤其涉及一种基于机器学习的甲状腺采样数据特征提取和分类识别方法及装置。

技术介绍

[0002]在医学场景下可通过对被测对象进行高清成像,发现人体中的病变组织,替代外科手术诊断的方式,极大减少了对人体不必要的伤害和减轻手术带来的痛苦。但是常用的检测手段计算机断层图像重建技术等会对人体组织造成一定程度的损伤,无法进行实时成像监测。
[0003]而电阻抗断层成像技术对人体损伤较小,成本也比较低廉,并且可以进行实时观测,在医护监测领域中具有很好的前景,其原理是人体上不同器官组织的电导率不同,出现生理病变时电导率与正常组织的电导率也不同。对人体待测区施加安全的激励源,人体内部电导率分布的变化,将会引起待测表面电位的变化,通过联立电位变化、输入激励和电导率分布的关系,使用一定的算法对这些关系进行求解,最终,根据所求的电导率分布进行图像重构。但目前的电阻抗断层成像系统在成像过程中普遍存在非线性、病态性和不适定性等技术难题导致了成像质量效果不够理想和成像分辨率低,在临床上还没有得到较好的应用。
[0004]公开号为CN201810318306的中国专利公开了“一种甲状腺肿瘤超声图像识别方法及其装置”,这种方法可以辅助医生对甲状腺肿瘤的良恶性进行诊断,在甲状腺超声图像肿瘤良恶性检测试验中取得了较高的准确率,这对临床实际诊断具有重大的参考意义。但是这种识别机制是需要通过超声图片,并没有使病人诊断流程简化。

技术实现思路

[0005]针对现用技术的以上缺陷或者改进需求,本专利技术提供了一种基于机器学习的甲状腺采样数据处理方法,其目的在于解决使用电阻抗断层技术获得的数据进行特征提取和分类识别的问题,有效规避了使用电阻抗断层成像系统在成像质量效果不够理想的问题,可以做到无需成像就可以判断待测对象采集的数据是否超出预设范围。
[0006]根据本专利技术的实施方案,提供了一种基于机器学习的甲状腺采样数据识别方法,包括以下步骤:
[0007]对待测对象的颈前部施加激励源,获取m个待测对象在不同激励条件下的采样数据;
[0008]将采集到的采样数据进行预处理,并整理成第一数据集,将所述第一数据集内的样本数据输入甲状腺识别模型,其中所述甲状腺识别模型包括特征提取部和类别识别部,所述特征提取部用于使训练的样本数据的特征更加明显,并将样本数据整合成类别识别部的输入数据,所述类别识别部用于对所述输入数据进行分类;
[0009]所述第一数据集的样本数据经过特征提取步骤和类别识别步骤后输出,根据输出
结果判定所述采样数据的阈值是否超出预设范围。
[0010]若所述采样数据的阈值超出预设范围,则判定所述采样数据为第一类数据,即异常数据,如果没有超出预设范围,则判定为第二类数据,即正常数据。
[0011]进一步的,所述将采集到的采样数据进行预处理的步骤还包括:
[0012]将采集到的采样数据整理成原始数据集,取所述原始数据集中的最大值i
max
,将所述原始数据集中的每个数据与所述最大值i
max
相加,并通过文本嵌入技术映射到高维空间形成第一数据集,便于后续的特征提取。
[0013]进一步的,所述特征提取步骤包括:
[0014]输入数据依次进入第一特征提取模块、第二特征提取模块和第三特征提取模块,其中所述第一特征提取模块包括一个注意机制模块,所述第二特征提取模块包括两个1
×
1卷积块、一个3
×
3卷积块和一个注意机制模块,所述第三特征提取模块包括两个1
×
1卷积块、一个 3
×
3卷积块和两个全连接层。
[0015]经过所述特征提取步骤处理后,数据之间的差异会被放大,更利于后续的类别识别部进行分类处理。
[0016]进一步的,所述注意力机制模块的计算规则为:
[0017][0018]其中,A、B、E是大小相同的张量,d
k
为输入的词嵌入维度,所述词嵌入维度等于文本嵌入后每一个词对应的映射维度,sigmiod函数用于对张量进行激活。
[0019]进一步的,所述类别识别步骤包括:
[0020]使用第一超平面对所述输入数据进行分类,要求离超平面最近的两个异类距离之和尽可能的大,根据分类的结果,所述甲状腺识别模型输出的结果是

1或者1,其中1代表所述采样数据为第一类数据,即异常数据,

1代表所述采样数据为第二类数据,即正常数据。
[0021]其中,所述第一超平面的表达式为:
[0022]M=w
T
x+b 其中,w=(w1;w2;

;w
m
)为法向量,决定了超平面的方向;m为训练样本数,b为位移项,决定了超平面与原点之间的距离,这个超平面记为(w,b)。
[0023]进一步的,所述第一超平面的表达式中w和b的具体推导过程包括:
[0024]样本空间中任意点x到超平面(w,b)的距离r可写为:
[0025][0026]离超平面最近的两个异类距离之和是由支持向量决定,两个异类支持向量到超平面的距离之和为:
[0027][0028]支持向量机的基本型为:
[0029][0030]s.t.yi(w
T
x
i
+b)≥1,i=1,2,

,m
[0031]根据这个问题拉格朗日表达式,对w和b求偏导为零,由对偶问题可得最终优化目标函数:
[0032][0033]其中,约束条件为:α≥0且代入训练样本值可以求出α,进而求出w和 b,带入模型可得到:
[0034][0035]优选的,使用的优化目标函数的核函数为:
[0036][0037]所述核函数的前一部分采用线性核x
iT
x
j
,考虑了线性可分的情况;后边一部分采用高斯核解决输入高维数据存在线性不可分的情况,使得模型可以适用更多场景。其中,x为训练模型时的采样得到的各个电阻率向量,σ是一个大于0的常量用来控制后一部分作用的重要程度。
[0038]与现有技术相比,本申请通过使用生物电阻抗信息收集平台收集甲状腺部分的电阻率数据,通过对电阻率数据进行处理,经过特征提取步骤,使用了基于注意机制和卷积神经网络的特征提取网络,获得数据中的更多相互关系,能够挖掘数据更多的特征信息,并使得任务主要关注重点特征,忽略不重要特征,使得数据之间的差异被拉大,从而让后续分类的结果更为准确。而所述类别识别步骤使用机器学习算法处理特征提取后的数据,采用线性核和高斯核叠加的方式,既考虑到了线性可分的情况也考虑到了输入高维数据存在线性不可分的情况,使得模型可以适用更多场景。
附图说明
[0039]图1为本专利技术提供的一种基于机器学习的甲状腺采样数据识别方法的步骤本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的甲状腺采样数据识别方法,其特征在于,包括以下步骤:对待测对象的颈前部施加激励源,获取m个待测对象在不同激励条件下的采样数据;将采集到的采样数据进行预处理,并整理成第一数据集,将所述第一数据集内的样本数据输入甲状腺识别模型,其中所述甲状腺识别模型包括特征提取部和类别识别部,所述特征提取部用于使训练的样本数据的特征更加明显,并将样本数据整合成类别识别部的输入数据,所述类别识别部用于对所述输入数据进行分类;所述第一数据集的样本数据经过特征提取步骤和类别识别步骤后输出,根据输出结果判定所述采样数据的阈值是否超出预设范围。2.根据权利要求1所述的一种基于机器学习的甲状腺采样数据识别方法,其特征在于,所述将采集到的采样数据进行预处理的步骤还包括:将采集到的采样数据整理成原始数据集,取所述原始数据集中的最大值i
max
,将所述原始数据集中的每个数据与所述最大值i
max
相加,并通过文本嵌入技术映射到高维空间形成第一数据集,便于后续的特征提取。3.根据权利要求1所述的一种基于机器学习的甲状腺采样数据识别方法,其特征在于,所述特征提取步骤包括:输入数据依次进入第一特征提取模块、第二特征提取模块和第三特征提取模块,其中所述第一特征提取模块包括一个注意机制模块,所述第二特征提取模块包括两个1
×
1卷积块、一个3
×
3卷积块和一个注意机制模块,所述第三特征提取模块包括两个1
×
1卷积块、一个3
×
3卷积块和两个全连接层。4.根据权利要求3所述的一种基于机器学习的甲状腺采样数据识别方法,其特征在于,所述注意力机制模块的计算规则为:其中,A、B、E是大小相同的张量,d
k
为输入的词嵌入维度,sigmiod函数用于对张量进行激活。5.根据权利要求1所述的一...

【专利技术属性】
技术研发人员:燕自保袁静萍肖家波张剑
申请(专利权)人:武汉中数医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1