【技术实现步骤摘要】
一种时变数据的特征提取与追踪方法
[0001]本专利涉及可视化和可视分析领域,涉及一种利用最佳化高斯混合模型(Gaussian Mixture Model,简称GMM)准则和全局追踪图来对时变数据进行特征提取与追踪的方法。
技术介绍
[0002]科学模拟常常会产生各种各样的时变数据,这是因为这些科学模拟所研究的自然或者技术现象是与时间相关的。这类模拟的例子有很多,例如天气预报、计算流体力学、燃烧科学、计算宇宙学、气候模式研究等。这些产生的时变数据往往是复杂的、大规模的、包含许多的变量和特征、跨越巨大的空间和时间。这些数据原本对科学家来说是无用的,但只要我们能够发现和揭示它们背后所隐藏的趋势和特征,那么就可以帮助科学家理解和洞察这些复杂的时变现象。这便是时变数据可视化的研究目标。然而,对这些时变数据进行有效地特征提取、特征追踪以及特征可视化并不是一件简单的工作。在过去的二十年中,许多学者都在不断地提出各种各样的方法来尝试解决这一问题。
[0003]在最近的一项研究综述中,Bai等人系统地回顾了大量的有关时变数据的可视化技术(参考文献1Z.H.Bai,Y.B.Tao,H.Lin.Time
‑
varying volume visualization:a survey.Journal of Visualization,23:745
‑
761,2020.即Z.H.Bai,Y.B.Tao,H.Lin.时变体可视化:综述.可视化期刊,23:745
‑
761,2020.) ...
【技术保护点】
【技术特征摘要】
1.一种时变数据的特征提取与追踪方法,其特征在于:所述方法包括如下步骤:1)最佳化GMM准则产生,过程如下:1.1,对于原始时变数据,应用基于直方图的自动对比度增强方法增强它们的对比度,并利用全局最大值和最小值将它们归一化至[0,1]范围内;1.2,用户需要观察对比度增强的时变数据,从中选择一个包含他们感兴趣的特征的时间步,并从该时间步任选两张切片且利用鼠标自由地在这些切片上标记出他们感兴趣的特征;1.3,对于每个被用户标记为特征的体素,找到以它为中心,以11
×
11为窗口大小的邻域,并利用离线Expectation Maximization(EM)算法来计算出该邻域内数据的GMM,该GMM能够简洁地表示出该体素邻域内的数据分布情况;所有这些标记为特征的体素所产生的高斯混合模型构型了一个集合,称之为候选GMM准则;1.4,将遗传算法应用于候选GMM准则,以过滤掉那些可能产生假阳的GMM准则,从而保留了一组可以产生真阳的GMM准则,称这组GMM准则为最佳化GMM准则;2)全局特征提取,过程如下:2.1,利用公式(3)和(4)计算出每个前景体素邻域的GMM与最佳化GMM准则的巴氏距离d(v):(v):其中,w,w
′
分别代表两个高斯分量权重;μ,μ
′
代表两个高斯分量的平均值;Σ,Σ
′
代表两个高斯分量的方差;2.2,用公式(5)将巴氏距离转换成概率:其中,exp()表示指数函数,p(v)表示体素v属于特征的概率,p(v)值越大,说明体素v属于特征的概率越大;反之,如果p(v)值越小,说明体素v属于特征的概率越低,D由公式(6)计算:这里,MD代表匹配度参数,它由用户指定,用来控制一个前景体素v属于特征的严格程度,MD值越大,则拥有较大d(v)的前景体素也可以属于特征;反之,如果MD值越小,则拥有较大d(v)的前景体素不可能属于特征;2.3,采用阈值法来过滤掉那些概率值p(v)较小的前景体素;至此,对于时变数据的每个时间步,从中提取出了与用户标记相似的特征;3)全局特征追踪,过程如下:3.1,将3D连通域分析应用于每个时间步所对应的概率数据p(v)上,从而过滤掉那些连通域较小的特征,即如果某特征连通域<阈值,则将其概率设置为0;同时,在应用3D连通域过程中,我们将每个时间步的所有特征相应地贴上标签;3.2,对于每两个连续时间步的任意两个特征,如时间步t的某个特征f
t
和时间步t+1的
某个特征f
t+1
,我们计算它们形心之间的欧氏距离d
c
:其中,表示特征f
t
的形心向量,表示特征f
t+1
的形心向量;3.3,利用如公式(8)所示的Chi
‑
Squared直方图距离来计算它们直方图之间的相似性d
h
:其中和分别代表直方图hf
t
和hf
t+1
的第i个柱子;此外,使用公式(9)来归一化d
h
:其中,sf
t
和sf
t+1
表示特征f
t
和f
t+1
的体素集合;3.4,在特征f
t
和f
t+1
之间建立一条有向边e(f
t
,f
t+1
),并令该边的权重we(f
t
,f
t+1
)=d
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。