【技术实现步骤摘要】
一种肺癌电子鼻数据分类方法
[0001]本专利技术涉及传感器数据分类技术,特别涉及一种肺癌电子鼻数据的分类方法
。
技术介绍
[0002]肺癌
(lung cancer,LC)
是危害人类生命的最常见癌症之一
。
每年造成的死亡人数占所有癌症相关死亡人数的
28
%
。
全球每年有超过
160
万人死于肺癌
。
然而,目前的肺癌诊断技术在可靠性
、
简便性
、
经济性
、
快速性和无创筛查方面很难同时满足要求
。
最近,电子鼻技术被引入肺癌的诊断中,该技术利用人体呼吸中的挥发性有机化合物
(volatile organic compounds,VOCs)
进行肺癌筛查,具备简单易用
、
高灵敏度
、
价格合理和无侵入性的特点
。
[0003]多变量时间序列
(Multivariate Time Series,MTS)
分类是肺癌电子鼻
(LC detection E
‑
nose)
的基本任务之一
。
多年来,研究人员已经提出了许多
MTS
分类方法
。
这些方法可分为两种类型:传统方法和深度学习
(Deep Learning,DL)
方法
。
常用的传统方法包括
【技术保护点】
【技术特征摘要】
1.
一种肺癌电子鼻数据分类方法,其特征在于:包括步骤:
(1)
对采集不同气体数据的
D
个气体传感器执行线性判别分析:
g(F)
=
W
T
F
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
其中
F
=
[f1,f2,
…
,f
i
,
…
,f
D
]
T
,
1≤i≤D
,
f
i
表示气体传感器
i
的特征,样本
M
l
=
[X1,X2,
…
,X
D
]
为多变量时间序列;样本
M
l
中的
X
i
=
[x1,x2,
…
,x
d
]
T
为单变量时间序列,单变量时间序列
X
i
由第
i
个气体传感器按设定采样时间间隔顺序采集的
d
个数据构成;函数
h(M
l
,i)
返回样本
M
l
中的单变量时间序列
X
i
,函数
max(
·
)
返回
X
i
中所有元素中的最大值;
W
=
[w1,w2,
…
,w
i
,
…
,w
D
]
T
是权重向量,
W
中
w
i
的绝对值表示第
i
个气体传感器对线性判别分析的贡献;
|w
i
|
越大,第
i
个气体传感器的贡献越大;根据
|w
i
|
的大小对气体传感器排序;
(2)
将贡献排在前位的每个气体传感器所采集的单变量时间序列转换为一张最大轨迹矩阵图像,由此得到张最大轨迹矩阵图像;
(3)
通过空间信息重组方法重组步骤
(2)
中所述的张最大轨迹矩阵图像,包括:
1)
计算样本的归一化互信息矩阵:设
Θ
s
=
{
θ1,
θ2,
…
,
θ
H
×
L
}
是从单变量时间序列
X
s
转换得到的最大轨迹矩阵图像,其中
θ1,
θ2,
…
,
θ
H
×
L
分别表示最大轨迹矩阵图像中的像素值,
H
和
L
分别表示
Θ
s
的高度和宽度;在所述的张最大轨迹矩阵图像中,任意两张最大轨迹矩阵图像
Θ
s
和
Θ
t
的归一化互信息表示为:
MI(
Θ
s
,
Θ
t
)
表示
Θ
s
和
Θ
t
之间的互信息:其中,
p(
θ
s
,
θ
t
)
表示
【专利技术属性】
技术研发人员:刘然,王仕丹,毛虎,田逢春,钱君辉,任席伟,陈鑫,陈宇泽,吕迪,
申请(专利权)人:广东鸿芯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。