多维大数据特征属性的处理方法、装置、终端及存储介质制造方法及图纸

技术编号:24171105 阅读:19 留言:0更新日期:2020-05-16 02:59
本申请提供多维大数据特征属性的处理方法、装置、终端及存储介质,本发明专利技术旨在提供一种同时利用多种数据挖掘技术以及文本关联方法自动求解多维大数据特征属性的web端程序。本发明专利技术的优点与功能在于,能够更全面严密地求解大数据的特征属性,并且帮助数据挖掘的非专业人士快速读取大数据特征属性;此外该web端程序自动进行了权重文本关联来给出属性的解释,使各行业的科研、产品及市场等方面的相关人士只需将数据导入web程序或者提供爬取的数据,便可透析数据特征属性及逻辑,从而有效地解决了现有技术中的难题。

【技术实现步骤摘要】
多维大数据特征属性的处理方法、装置、终端及存储介质
本申请涉及数据处理
,特别是涉及多维大数据特征属性的处理方法、装置、终端及存储介质。
技术介绍
当今社会是一个高速发展的社会,信息流通且科技发达,大数据已然是这个高科技时代的产物。随着数据量的迅速增长,数据挖掘已成为数据处理领域极为重要的一项技术。大数据普遍存在于各行各业,但是现有的可应用于大数据的分析及挖掘技术的专业化程度非常高,数据挖掘的非专业人士无法从当前的业务中快速读取多维大数据的特征属性,导致很多数据未能被及时有效地挖掘,大大阻碍了大数据分析挖掘技术的发展进程,对各行各业来说都是巨大损失。因此,本专利技术亟需一种能够更全面严密地求解大数据的特征属性,并能帮助数据挖掘的非专业人士快速读取大数据特征属性的技术解决方案。申请内容鉴于以上所述现有技术的缺点,本申请的目的在于提供多维大数据特征属性的处理方法、装置、终端及存储介质,用于解决现有技术中的问题。为实现上述目的及其他相关目的,本申请的第一方面提供一种多维大数据特征属性的处理方法,其包括:获取待处理的多维大数据及其对应的特征属性所需解释数据变动的比例数据;利用至少两种降维算法提取所述多维大数据的特征属性,并分析各所述降维算法之间的关联程度;根据所述特征属性所需解释数据变动的比例选取对应的特征属性,并设定每个特征属性的标签释义;将所述至少两种降维算法的特征属性构成、标签释义以及各所述降维算法之间的关联程度向外展示。于本申请的第一方面的一些实施例中,所述利用至少两种降维算法提取所述多维大数据的特征属性,并分析各所述降维算法之间的关联程度,其包括:利用主成分分析法和因子分析法提取所述多维大数据的特征属性,并分析所述主成分分析法和因子分析法之间的关联程度。于本申请的第一方面的一些实施例中,所述方法包括:利用所述主成分分析法获取对应的主成分系数,并利用所述因子分析法获取对应的正交因子权重;获取所述主成分系数与正交因子权重之间的相关系数矩阵,并计算所述相关系数矩阵的所有项之和,以根据所述所有项之和的计算结果来分析所述主成分分析法和因子分析法之间的关联程度。于本申请的第一方面的一些实施例中,所述根据所述特征属性所需解释数据变动的比例选取对应的特征属性,其包括:根据所述特征属性所需解释数据变动的比例来确定主成分分析法中所采用的主成分数量;以及/或者,根据所述特征属性所需解释数据变动的比例来确定正交因子法中所采用的正交因子数量。于本申请的第一方面的一些实施例中,所述设定每个特征属性的标签释义,其包括:根据不同维度变量在主成分上的权重得分数据来设定特征属性的标签释义;和/或,根据不同维度变量在不同因子上的得分数据来设定特征属性的标签释义。于本申请的第一方面的一些实施例中,所述方法包括:在利用至少两种降维算法提取所述多维大数据的特征属性之前,先对所述多维大数据进行用于消除不同维度数据量级影响的标准化处理。于本申请的第一方面的一些实施例中,所述获取待处理的多维大数据,其包括:获取经过预处理的多维大数据;其中,所述预处理包括数据整理、提取、清洗或者自动爬取相关数据的操作。为实现上述目的及其他相关目的,本申请的第二方面提供一种多维大数据特征属性的处理装置,其包括:数据获取模块,用于获取待处理的多维大数据及其对应的特征属性所需解释数据变动的比例数据;算法处理模块,用于利用至少两种降维算法提取所述多维大数据的特征属性,并分析各所述降维算法之间的关联程度;标签释义模块,用于根据所述特征属性所需解释数据变动的比例选取对应的特征属性,并设定每个特征属性的标签释义;展示模块,用于将所述至少两种降维算法的特征属性构成、标签释义以及各所述降维算法之间的关联程度向外展示。为实现上述目的及其他相关目的,本申请的第三方面提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述多维大数据特征属性的处理方法。为实现上述目的及其他相关目的,本申请的第四方面提供一种电子终端,包括:处理器及存储器;所述存储器用于存储计算机程序,所述处理器用于执行所述存储器存储的计算机程序,以使所述终端执行所述多维大数据特征属性的处理方法。如上所述,本申请的多维大数据特征属性的处理方法、装置、终端及存储介质,具有以下有益效果:本专利技术旨在提供一种同时利用多种数据挖掘技术以及文本关联方法自动求解多维大数据特征属性的web端程序。本专利技术的优点与功能在于,能够更全面严密地求解大数据的特征属性,并且帮助数据挖掘的非专业人士快速读取大数据特征属性;此外该web端程序自动进行了权重文本关联来给出属性的解释,使各行业的科研、产品及市场等方面的相关人士只需将数据导入web程序或者提供爬取的数据,便可透析数据特征属性及逻辑,从而有效地解决了现有技术中的难题。附图说明图1显示为本申请一实施例中的多维大数据特征属性的处理方法的流程示意图。图2显示为本申请一实施例中的多维大数据特征属性的处理系统的结构示意图。图3显示为本申请一实施例中的多维大数据特征属性的处理装置的结构示意图。图4显示为本申请一实施例中电子终端的结构示意图。具体实施方式以下通过特定的具体实例说明本申请的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本申请的其他优点与功效。本申请还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本申请的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。需要说明的是,在下述描述中,参考附图,附图描述了本申请的若干实施例。应当理解,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。此处使用的术语“或”和“和/或”被解释为包括性的,或意味着任一个或任何组合。因此,“A、B或C”或者“A、B和/或C”意味着“以下任一个:A;B;C;A和B;A和C;B和C;A、B和C”。仅当元件、功能或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。现有的可应用于大数据的分析及挖掘技术的专业化程度非常高,数据挖掘的非专业人士无法从当前的业务中快速读取多维大数据的特征属性,导致很多数据未能被及时有效地挖掘,大大阻碍了大数据分析挖掘技术的发展进程,对各行各业来说都是巨大损失。有鉴于此,本专利技术提供多维大数据特征属性的处理方法、装置、终端及存储介质,旨在提供一种同时利用多种数据挖掘技术以及文本关联方法自动求解多维大数据特征属性的web端程序。本专利技术的优点与功能在于,能够更全面严密地求解大数据的特征属性,并且帮助数据挖掘的非专业人士快速读取大数据特征属性;此外该web端程序自动进本文档来自技高网...

【技术保护点】
1.一种多维大数据特征属性的处理方法,其特征在于,包括:/n获取待处理的多维大数据及其对应的特征属性所需解释数据变动的比例数据;/n利用至少两种降维算法提取所述多维大数据的特征属性,并分析各所述降维算法之间的关联程度;/n根据所述特征属性所需解释数据变动的比例选取对应的特征属性,并设定每个特征属性的标签释义;/n将所述至少两种降维算法的特征属性构成、标签释义以及各所述降维算法之间的关联程度向外展示。/n

【技术特征摘要】
1.一种多维大数据特征属性的处理方法,其特征在于,包括:
获取待处理的多维大数据及其对应的特征属性所需解释数据变动的比例数据;
利用至少两种降维算法提取所述多维大数据的特征属性,并分析各所述降维算法之间的关联程度;
根据所述特征属性所需解释数据变动的比例选取对应的特征属性,并设定每个特征属性的标签释义;
将所述至少两种降维算法的特征属性构成、标签释义以及各所述降维算法之间的关联程度向外展示。


2.根据权利要求1所述的方法,其特征在于,所述利用至少两种降维算法提取所述多维大数据的特征属性,并分析各所述降维算法之间的关联程度,其包括:
利用主成分分析法和因子分析法提取所述多维大数据的特征属性,并分析所述主成分分析法和因子分析法之间的关联程度。


3.根据权利要求2所述的方法,其特征在于,所述方法包括:
利用所述主成分分析法获取对应的主成分系数,并利用所述因子分析法获取对应的正交因子权重;
获取所述主成分系数与正交因子权重之间的相关系数矩阵,并计算所述相关系数矩阵的所有项之和,以根据所述所有项之和的计算结果来分析所述主成分分析法和因子分析法之间的关联程度。


4.根据权利要求1所述的方法,其特征在于,所述根据所述特征属性所需解释数据变动的比例选取对应的特征属性,其包括:
根据所述特征属性所需解释数据变动的比例来确定主成分分析法中所采用的主成分数量;以及/或者
根据所述特征属性所需解释数据变动的比例来确定正交因子法中所采用的正交因子数量。


5.根据权利要求1所述的方法,其特征在于,所述设定每个特征属性的标签释义,其包括:
根...

【专利技术属性】
技术研发人员:李敏张嘉锐周喆王茜朱悦徐旻昕袁晓夏赵燕刘晋元孙虎
申请(专利权)人:上海科技发展有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1