改进KNN方法的数据处理方法和装置制造方法及图纸

技术编号：34833992 阅读：21 留言：0更新日期：2022-09-08 07:28

本发明专利技术公开一种改进KNN方法的数据处理方法和装置，涉及数据处理技术领域，解决的技术问题是数据处理，采用的技术方案是，一种改进KNN方法的数据处理方法和装置，包括以下步骤：步骤一、从数据库信息中获取数据信息，并对获取的数据信息进行降维处理，以获取低维度数据信息；步骤二、通过改进KNN算法模型对降维后的数据信息进行数据信息处理；步骤三、通过改进型误差评估函数对处理后的数据信息进行评估；步骤四、数据信息应用与分享，对获取的数据信息进行远程数据信息处理和数据分享。本发明专利技术通过数据降维、数据预处理、数据挖掘、误差分析和处理，大大提高了数据信息处理能力。大大提高了数据信息处理能力。大大提高了数据信息处理能力。

全部详细技术资料下载

【技术实现步骤摘要】
改进KNN方法的数据处理方法和装置

[0001]本专利技术涉及数据处理领域，且更确切地涉及一种改进KNN方法的数据处理方法和装置。

技术介绍

[0002]数据处理，数据处理是系统工程和自动控制的基本环节。数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度，极大地影响了人类社会发展的进程。数据（Data）是对事实、概念或指令的一种表达形式，可由人工或自动化装置进行处理。数据经过解释并赋予一定的意义之后，便成为信息。数据处理（data processing）是对数据的采集、存储、检索、加工、变换和传输。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
[0003]现有技术通常采用数据统计的方法实现数据信息的处理，这种方法虽然在一定程度上提高数据处理能力，但在对数据信息进行分析和计算时，很难实现其分类和数据信息处理，整体数据信息处理能力较差，数据信息处理方法滞后。

技术实现思路

[0004]针对上述技术的不足，本专利技术公开一种改进KNN方法的数据处理方法和装置，通过数据降维、数据预处理、数据挖掘、误差分析和处理，大大提高了数据信息处理能力。
[0005]为了实现上述技术效果，本专利技术采用以下技术方案：一种改进KNN方法的数据处理方法，其中包括以下步骤：步骤一、从数据库信息中获取数据信息，并对获取的数据信息进行降维处理，以获取低维度数据信息；步骤二、通过改进KNN算法模型对降维后的数据...

【技术保护点】

【技术特征摘要】
1.一种改进KNN方法的数据处理方法，其特征在于：包括以下步骤：步骤一、从数据库信息中获取数据信息，并对获取的数据信息进行降维处理，以获取低维度数据信息；步骤二、通过改进KNN算法模型对降维后的数据信息进行数据信息处理，改进KNN算法模型包括数据预处理步骤、数据分层步骤、数据KNN算法计算步骤和卷积分故障诊断步骤；步骤三、通过改进型误差评估函数对处理后的数据信息进行评估；步骤四、数据信息应用与分享，对获取的数据信息进行远程数据信息处理和数据分享。2.根据权利要求1所述的一种改进KNN方法的数据处理方法，其特征在于：降维处理的方法包括以下步骤：（S11）通过重构矩阵数据信息的方式实现降维处理，并设置重构矩阵数据个数、数据维度和时间延迟；（S12）通过平均交互信息法求解不同元素库的分布概率，并通过关联算法模型分析数据特征；（S13）通过虚假邻点法计算数据信息的维数，通过比较不同数据信息的维数进而选择不同的数据分类，两个不同维度之间的序列通过特征对度量法实现数据库信息内不同元素之间的比较，公式为：
ꢀꢀꢀ
（1）在公式（1）中，R表示数据维度，n表示向量，表示重构前的矩阵数据信息，表示重构后的矩阵数据信息；与表示重构矩阵数据之间的虚假邻点的关系，r 表示重构后增加的数据信息，u为重构矩阵数据信息最佳维度，重构后，重构矩阵数据的元素数据维度和降维后的数据维度之差大于10；（S14）降维判断，当降维数据信息满足当前需求时，则输出数据信息，当降维数据信息不满足当前需求时，则重新进行降维计算。3.根据权利要求1所述的一种改进KNN方法的数据处理方法，其特征在于：数据分层为差分分层，差分分层的方法为：将数据属性按照数量和种类划分为不同的属性，属性数据量从顶层到底层从少至多依次排列和分布；计算不同数据属性之间的距离，假设数据集合中的某个数据信息为，数据属性类别划分为、、和，则数据信息距离数据属性类别、、和之间的距离为、；将计算出的不同数据属性数据信息进行差分计算；当时，其中为常数，则数据信息划分到类。4.根据权利要求1所述的一种改进KNN方法的数据处理方法，其特征在于：数据KNN算法包括以下步骤：（S21）选择大数据信息测试集合，根据不同的数据属性选择测试大数据信息向量集合；
（S22）训练大数据信息测试集合，通过分层类别，构建成 n 层树状形式；并通过最佳搜索算法实现大数据信息测试集合的数据搜索；（S23）依次计算大数据信息测试集合与第 1
‑
n 层大数据信息测试集合训练集中每个大数据信息的文本相似度；通过欧式距离计算公式如下：（2）在公式（2）中，表示大数据信息测试集合中测试信息的特征向量，表示大数据信息测试集合中测试信息的特征向量的序列；为第 1 层第j类的大数据信息测试集合中心向量，表示大数据信息的类；M为大数据信息测试集合特征向量的维数；为大数据信息测试集合向量的第 k 维；表示第 k 维中第一层第j类的大数据信息测试集合向量；（S24）按照文本相似度，在训练文本集中选出与测试文本最相似的个文本；（S25）在测试文本的个近邻中，依次计算每类的权重，表示权重值公式，计算式为，其中为数据信息，表示第类的大数据信息测...

【专利技术属性】
技术研发人员：李国权，
申请(专利权)人：晨达广州网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人