基于非参数球形变分自编码器的ECG数据聚类方法技术

技术编号：40507664 阅读：6 留言：0更新日期：2024-03-01 13:22

本发明专利技术涉及机器学习和医疗数据分析领域，具体为基于非参数球形变分自编码器的ECG数据聚类方法。本技术方案所要解决的技术问题为：针对数据聚类和分析方法，解决对心脏疾病的识别准确性和预测能力提高的问题。该方法是一种基于深度变分自编码器的端到端心电图数据聚类方法，采用基于Pitman‑Yor过程混合模型的贝叶斯非参数模型框架，构建基于von Mises‑Fisher(VMF)概率分布的无限混合模型。本技术方案的有益效果为：通过结合深度学习和贝叶斯非参数模型的优势，为心电图数据的聚类分析提供了一种更加高效、准确且灵活的解决方案。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及机器学习和医疗数据分析领域，特别是心电图(ecg)数据的处理和分析，具体为基于非参数球形变分自编码器的ecg数据聚类方法。

技术介绍

1、在现有技术中，心电图数据分析通常依赖于传统的机器学习方法和基本的统计模型，如简单的分类算法、时间序列分析及基本的聚类技术。然而，这些方法在处理大规模或复杂心电图数据时面临挑战，尤其是在准确识别和分类多样化心脏状况方面。相较之下，变分自编码器(variational auto-encoder,vae)作为一种先进的深度生成模型，在图像和语音处理领域已展现出卓越的数据生成和特征提取能力，但在心电图数据分析方面的应用仍然相对有限。

2、因此，本专利技术基于非参数球形变分自编码器的ecg数据聚类方法，能够更有效地应对复杂和大规模的心电图数据分析任务。

技术实现思路

1、为实现以上目的，本专利技术创造采用的技术方案：通过结合深度学习和贝叶斯非参数模型的优势，为心电图数据的聚类分析提供了一种更加高效、准确且灵活的解决方案。

2、进一步的，该方法是一种基于深度变分自编码器的端到端心电图数据聚类方法，采用基于pitman-yor过程混合模型的贝叶斯非参数模型框架，构建了一个以vmf概率分布为基础的无限混合模型，该方法包括以下步骤：步骤1)收集ecg数据集、步骤2)使用球形非参数球形变分自编码器对ecg数据机型建模。

3、进一步的，vmf混合模型包括，一个同样服从vmf概率分布的概率解码器、深度生成模型和基于超球面潜在空间的深度生成模型。

4、本技术方案改进后的有益效果为：结合了变分自编码器的强大特征提取能力和非参数模型的灵活性，从而提高了聚类的准确性和效率。基于pitman-yor过程混合模型的贝叶斯非参数方法来构建变分自编码器的模型架构，允许模型自动调整其潜在空间的复杂性，根据数据本身的特征动态调整聚类的数量。vmf概率分布提供了一种与传统高斯分布相比，在特定数据类型上更为有效的聚类机制。

5、进一步的，步骤1)收集ecg数据集：另为所收集到的含有n条ecg数据的数据集，其中每条数据为d维的ecg数据向量。

6、进一步的，步骤2)使用球形非参数球形变分自编码器对ecg数据机型建模：一个由无限个vmf分布所构成的非参数混合模型，其定义如下：

7、

8、其中，πk为簇k的混合系数，并满足条件πk＞0和

9、进一步的，混合系数πk的先验概率是基于采用stick-breaking表示方法的pitman-yor过程混合模型构建而成的，所述的混合模型，混合系数πk的表示如下：

10、

11、其中服从beta分布，表达形式如下：

12、

13、其中pb(·)为beta分布，ζk为pitman-yor过程模型中的折扣参数并满足条件0≤ζk≤1，ξk为密度参数满足条件ξk＞-ζk。

14、进一步的，贝叶斯非参数模型是潜在空间先验服从非参数vmf混合模型，在选定k的情况下，的潜在表示可以从该潜在分布中采样得出，过程如下：

15、

16、其中，为vmf分布，和κk分别为非参数vmf混合模型中第k个vmf概率分布的位置参数和浓度参数，函数id/2(κ)为修正的第一类d/2阶bessel函数。

17、进一步的，一个同样服从vmf概率分布的概率解码器去生成样本如下式所示：

18、

19、其中，参数和κx可以通过训练一个输入为

20、进一步的，深度生成模型定义如下：

21、

22、其中，深度生成模型的目标函数为的变分下界，可以通过下式获得：

23、

24、其中，e[·]表示期望计算，为真实后验分布的近似变分后验。

25、进一步的，基于超球面潜在空间的深度生成模型的目标函数可以重新定义为：

26、

27、其中，为变分后验与之间的kl散度。

28、进一步的，基于vmf概率分布的无限混合模型，通过计算关于变分后验的期望将数据指派到具有最大概率的簇中而完成聚类。

29、本专利技术的有益效果为：

30、1、端到端的ecg数据聚类方法:本专利技术提出了一种基于深度变分自编码器的端到端心电图数据聚类方法。这种方法通过利用深度学习技术，实现从原始数据输入到聚类输出的直接转换，大大简化了数据处理流程。

31、2、贝叶斯非参数混合模型的应用:所提出的方法采用了贝叶斯非参数混合模型作为潜在空间的先验分布。这种模型的一个关键优势在于其能够自动调整簇的数量，避免了传统聚类方法中需要手动设定簇数量的限制。这一特性使得模型更加灵活，能够适应各种不同规模和复杂性的数据集。

32、3、采用vmf概率分布以提高聚类性能:在非参数混合模型中，本专利技术采用vmf概率分布作为基本分布，而非传统的高斯分布。vmf分布特别适用于处理分布在高维球面上的数据，这使得它在处理归一化的高维数据时，如心电图数据，表现出更佳的聚类性能。此外，vmf分布还有助于减轻过拟合问题，提高模型的泛化能力。

本文档来自技高网...

【技术保护点】

1.基于非参数球形变分自编码器的ECG数据聚类方法，其特征在于：该方法基于非参数球形变分自编码器模型，采用基于Pitman-Yor过程混合模型的贝叶斯非参数模型框架，构建了一个以VMF概率分布为基础的无限混合模型；所述的方法包括以下步骤：步骤1)收集ECG数据集，步骤2)使用球形非参数球形变分自编码器对ECG数据机型建模，所述的VMF混合模型包括，一个同样服从VMF概率分布的概率解码器、深度生成模型和基于超球面潜在空间的深度生成模型。

2.根据权利要求1所述的基于非参数球形变分自编码器的ECG数据聚类方法，其特征在于：所述的步骤1)收集ECG数据集，另为所收集到的含有N条ECG数据的数据集，其中每条数据为D维的ECG数据向量。

3.根据权利要求2所述的基于非参数球形变分自编码器的ECG数据聚类方法，其特征在于：所述的步骤2)使用球形非参数球形变分自编码器对ECG数据机型建模，一个由无限个VMF分布所构成的非参数混合模型，其定义如下：

4.根据权利要求3所述的基于非参数球形变分自编码器的ECG数据聚类方法，其特征在于：所述的混合系数πk的先验概率

5.根据权利要求1所述的基于非参数球形变分自编码器的ECG数据聚类方法，其特征在于：所述的贝叶斯非参数模型是潜在空间先验服从非参数VMF混合模型，在选定k的情况下，的潜在表示可以从该潜在分布中采样得出，过程如下：

6.根据权利要求1所述的基于非参数球形变分自编码器的ECG数据聚类方法，其特征在于：所述的一个同样服从VMF概率分布的概率解码器用去生成样本如下式所示：

7.根据权利要求1所述的基于非参数球形变分自编码器的ECG数据聚类方法，其特征在于：所述的深度生成模型定义如下：

8.根据权利要求7所述的基于非参数球形变分自编码器的ECG数据聚类方法，其特征在于：所述的基于超球面潜在空间的深度生成模型的目标函数可以重新定义为：

9.根据权利要求8所述的基于非参数球形变分自编码器的ECG数据聚类方法，其特征在于：所述的基于VMF概率分布的无限混合模型，通过计算关于变分后验的期望将数据指派到具有最大概率的簇中而完成聚类。

...

【技术特征摘要】

1.基于非参数球形变分自编码器的ecg数据聚类方法，其特征在于：该方法基于非参数球形变分自编码器模型，采用基于pitman-yor过程混合模型的贝叶斯非参数模型框架，构建了一个以vmf概率分布为基础的无限混合模型；所述的方法包括以下步骤：步骤1)收集ecg数据集，步骤2)使用球形非参数球形变分自编码器对ecg数据机型建模，所述的vmf混合模型包括，一个同样服从vmf概率分布的概率解码器、深度生成模型和基于超球面潜在空间的深度生成模型。

2.根据权利要求1所述的基于非参数球形变分自编码器的ecg数据聚类方法，其特征在于：所述的步骤1)收集ecg数据集，另为所收集到的含有n条ecg数据的数据集，其中每条数据为d维的ecg数据向量。

3.根据权利要求2所述的基于非参数球形变分自编码器的ecg数据聚类方法，其特征在于：所述的步骤2)使用球形非参数球形变分自编码器对ecg数据机型建模，一个由无限个vmf分布所构成的非参数混合模型，其定义如下：

4.根据权利要求3所述的基于非参数球形变分自编码器的ecg数据聚类方法，其特征在于：所述的混合系数πk的先验概率是基于采用s...

【专利技术属性】
技术研发人员：范文涛，苏伟峰，王田，
申请(专利权)人：北京师范大学香港浸会大学联合国际学院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人