一种数据分析方法及装置制造方法及图纸

技术编号：29676097 阅读：20 留言：0更新日期：2021-08-13 21:58

本发明专利技术公开了一种数据分析方法及装置，包括;获取包含历史数据的训练集：对所述训练集进行训练，将所述训练集中的数据进行分类；对各个分类下的数据进行可逆变换，去除所述训练集中数据的非重要特征，以获取包含重要特征的数据；获取所述包含重要特征的数据中与特征向量相同的数据；对所述训练集训练完成后，通过输出的多个重要特征的数据，构成所述数据对应的特征树；将特征树每个节点的特征，通过与所述节点维度相同的向量进行描述，构建预测函数，使用所述预测函数对待识别的数据进行分析，解决了机器学习在数据因果分析中遇到的样本数量少、时变的数据分布和高复杂度的数据不能有效的分析的问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种数据分析方法及装置
本申请涉及人工智能
，具体涉及一种数据分析方法，同时涉及一种数据分析装置。
技术介绍
已有的机器学习算法对样本数量少、时变的数据分布和高复杂度的问题并不能有效的解决。比如在论文NIPS2018《Idiosyncrasiesandchallengesofdatadrivenlearninginelectronictrading》（数据驱动的学习在电子交易中的特质和难题）中讨论了随着复杂度的提升，学习空间会变得很大以致于难以识别。其次，机器学习对于小数据集进行预测十分困难，为了消除对模型质量的干扰，通常需要大量的监督学习。
技术实现思路
为解决上述问题，本申请提供一种数据分析方法，包括：获取包含历史数据的训练集；对所述训练集进行训练，将所述训练集中的数据进行分类；对各个分类下的数据进行可逆变换，去除所述训练集中数据的非重要特征，以获取包含重要特征的数据；获取所述包含重要特征的数据中与特征向量相同的数据；对所述训练集训练完成后，通过输出的多个重要特征的数据，构成所述数据对应的特征树；将特征树每个节点的特征，通过与所述节点维度相同的向量进行描述，构建预测函数，使用所述预测函数对待识别的数据进行分析。优选的，将所述训练集中的数据进行分类，包括：计算所述训练集中数据的熵，将熵作为分类的标志，对数据进行分类。优选的，对各个分类下的数据进行可逆变换，去除所述训练集中数据的非重要特征，以获取包含重要特征的数据，包括：定义可逆变换的...

【技术保护点】
1.一种数据分析方法，其特征在于，包括：/n获取包含历史数据的训练集；/n对所述训练集进行训练，将所述训练集中的数据进行分类；对各个分类下的数据进行可逆变换，去除所述训练集中数据的非重要特征，以获取包含重要特征的数据；获取所述包含重要特征的数据中与特征向量相同的数据；对所述训练集训练完成后，通过输出的多个重要特征的数据，构成所述数据对应的特征树；/n将特征树每个节点的特征，通过与所述节点维度相同的向量进行描述，构建预测函数，使用所述预测函数对待识别的数据进行分析。/n

【技术特征摘要】
1.一种数据分析方法，其特征在于，包括：
获取包含历史数据的训练集；
对所述训练集进行训练，将所述训练集中的数据进行分类；对各个分类下的数据进行可逆变换，去除所述训练集中数据的非重要特征，以获取包含重要特征的数据；获取所述包含重要特征的数据中与特征向量相同的数据；对所述训练集训练完成后，通过输出的多个重要特征的数据，构成所述数据对应的特征树；
将特征树每个节点的特征，通过与所述节点维度相同的向量进行描述，构建预测函数，使用所述预测函数对待识别的数据进行分析。

2.根据权利要求1所述的方法，其特征在于，将所述训练集中的数据进行分类，包括：
计算所述训练集中数据的熵，将熵作为分类的标志，对数据进行分类。

3.根据权利要求1所述的方法，其特征在于，对各个分类下的数据进行可逆变换，去除所述训练集中数据的非重要特征，以获取包含重要特征的数据，包括：
定义可逆变换的目标函数，将各个分类下的数据根据特征变换，在变换空间中搜索数据的可逆变换，以去除所述训练集中数据的非重要特征；
由可逆变换的数据构成可逆变换矩阵；所述可逆变换矩阵为包含重要特征的数据。

4.根据权利要求1所述的方法，其特征在于，获取所述包含重要特征的数据中与特征向量相同的数据，包括：
获取包含重要特征的数据训练集中，各个分类下数据的特征向量；
去除所述包含重要特征的训练集中，各个分类下数据中包含无关特征向量的数据。

5.根据权利要求1所述的方法，其特征在于，通过输出的包含各个重要特征的数据，构成所述数据对应的特征树，包括：
通过对训练集进行重复多次的训练，获得每个重要特征对应的数据；
将多个重要特征的数据，根据各个数据特征的关系，构建所述数据对应的特征树。

6.根据权利要求1或5所述的方法，其特征在于，所述特征树的每个节点的特征用一个与向量x维度相同的向...

【专利技术属性】
技术研发人员：文凯，马寅，郭普拓，
申请(专利权)人：北京玻色量子科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人