【技术实现步骤摘要】
本专利技术主要涉及大数据特征提取,具体涉及基于拓扑数据分析的大数据特征提取和降维方法。
技术介绍
1、大数据技术能够在统一的平台对大量的数据进行统一处理,利用大数据技术,能够整合处理资源,将零散的数据集中处理,从而提高了数据处理的效率。
2、而现有方法通常使用固定的滤波函数对数据进行排序和划分,而不考虑数据本身的分布特征和变化趋势,导致划分结果不够合理和稳定;同时现有方法通常使用固定的复形类型(如vietoris-rips复形或alpha复形)来构造每个子集中的拓扑空间,而不考虑不同子集中数据点之间的相似性和差异性,导致复形结构不够灵活和适应性;现有方法通常使用固定的持续同调维度来计算每个子集中的条形码图,而不考虑不同维度上的拓扑特征对数据表示的贡献和重要性,导致特征提取不够充分和有效;现有方法通常使用固定的特征向量长度来表示每个子集中的拓扑特征,而不考虑不同子集中的拓扑复杂度和信息量,导致特征向量不够均衡和精确;
3、这些不足之处都会影响基于拓托数据分析的大数据特征提取和降维方法的性能和效果,限制了其在实际应用
...【技术保护点】
1.基于拓扑数据分析的大数据特征提取和降维方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于拓扑数据分析的大数据特征提取和降维方法,其特征在于,所述步骤一的具体操作方法为:设原始数据点集为X={x1,x2,…,xn},其中每个数据点xi是一个d维向量,即xi=(xi1,xi2,…,xid)T,则核密度估计的步骤如下:
3.根据权利要求2所述的基于拓扑数据分析的大数据特征提取和降维方法,其特征在于,所述步骤一中的S2过程中,还需统计该区域内的数据点个数ni,即
4.根据权利要求1所述的基于拓扑数据分析的大数据特征提取和降维
...【技术特征摘要】
1.基于拓扑数据分析的大数据特征提取和降维方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于拓扑数据分析的大数据特征提取和降维方法,其特征在于,所述步骤一的具体操作方法为:设原始数据点集为x={x1,x2,…,xn},其中每个数据点xi是一个d维向量,即xi=(xi1,xi2,…,xid)t,则核密度估计的步骤如下:
3.根据权利要求2所述的基于拓扑数据分析的大数据特征提取和降维方法,其特征在于,所述步骤一中的s2过程中,还需统计该区域内的数据点个数ni,即
4.根据权利要求1所述的基于拓扑数据分析的大数据特征提取和降维方法,其特征在于,所述步骤二的具体操作方法为:设每个子集中的数据点为y={y1,y2,…,ym},其中每个数据点yi是一个d维向量,即yi=(yi1,yi2,…,yid)t,则局部线性重构的步骤如下:
5.根据权利要求4所述的基于拓扑数据分析的大数据特征提取和降维方法,其特征在于,所述步骤二中的s1过程中,参数k是一个正整数,称为最近邻数,它决定了每个数据点所考虑的邻域范围,同时k越大,邻域范围越大,局部线性重构...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。