【技术实现步骤摘要】
一种数据特征提取方法、装置、终端设备及介质
本申请属于大数据处理
,尤其涉及一种数据特征提取方法、装置、终端设备及计算机可读存储介质。
技术介绍
文本特征指的是最能代表文本主旨的词汇集合,文本特征不仅可以很好的概括文本主要内容和主旨,而且可以降低文本处理的复杂程度。而文本特征学习包含了高维的词库信息,因此,根据样本信息学习文本的特征表达就是一个高维稀疏向量的优化问题。对于时空数据的地图特征学习问题中,地图数据的表达往往也是一个高维稀疏向量,根据样本信息学习地图的特征也是一个高维稀疏向量的优化问题。因此,高维稀疏向量的优化问题的求解是机器学习应用中特征提取的一个关键应用。目前对高维稀疏向量的优化算法主要有梯度下降方法和经验方法(例如模拟退火算法和蚁群算法等等)。然而现有的求解方法存在求解效率低的缺陷。且在很多高维稀疏向量的优化问题中,求解的向量是带有约束条件的,因此高维稀疏向量的优化问题的求解的难度较高。可见,现有的特征提取过程中,存在特征提取效率较低的问题。
技术实现思路
有鉴于此,本申请提 ...
【技术保护点】
1.一种数据特征提取方法,其特征在于,包括:/n根据样本数据构建高维稀疏向量;/n基于预设函数对所述高维稀疏向量进行迭代求解,得到所述高维稀疏向量的支撑点向量;/n基于约束条件对所述支撑点向量进行约束映射,以修正所述支撑点向量;其中,所述约束条件为单流形约束条件;/n基于目标函数对修正后的支撑点向量进行验证,若验证通过,则将修正后的支撑点向量确定为目标特征向量。/n
【技术特征摘要】
1.一种数据特征提取方法,其特征在于,包括:
根据样本数据构建高维稀疏向量;
基于预设函数对所述高维稀疏向量进行迭代求解,得到所述高维稀疏向量的支撑点向量;
基于约束条件对所述支撑点向量进行约束映射,以修正所述支撑点向量;其中,所述约束条件为单流形约束条件;
基于目标函数对修正后的支撑点向量进行验证,若验证通过,则将修正后的支撑点向量确定为目标特征向量。
2.根据权利要求1所述的数据特征提取方法,其特征在于,所述基于预设函数对所述高维稀疏向量进行迭代求解,得到所述高维稀疏向量的支撑点向量,包括:
将所述高维稀疏向量输入所述预设函数中进行计算,以获取预支撑点向量;
基于各预支撑点向量的属性对各预支撑点向量的权重进行权重映射;
基于映射后的支撑点向量的权重以及支撑点向量出现的次数确定各个支撑点向量的向量系数;
基于各个支撑点向量的向量系数及上一次迭代的求解结果确定本次迭代的支撑点向量。
3.根据权利要求1或2所述的数据特征提取方法,其特征在于,所述预设函数基于支撑函数构建。
4.根据权利要求1所述的数据特征提取方法,其特征在于,所述基于目标函数对修正后的支撑点向量进行验证,包括:
根据修正后的支撑点向量求解所述目标函数;
若所述目标函数的求解值小于求解精度,则验证通过。
5.根据权利要求1所述的数据特征提取方法,其特征在于,所述样本数据为文本样本数据,所述根据样本数据构建高维稀疏向量,包括:
基于文本样本数据的字数确定高维稀疏向量的维度;
基于预先构建的字典将所述文本样本数据映射到与所述维度对应的向量中,得到...
【专利技术属性】
技术研发人员:余晓填,杨天宝,
申请(专利权)人:深圳云天励飞技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。