改进KNN方法的数据处理方法和装置制造方法及图纸

技术编号:34833992 阅读:21 留言:0更新日期:2022-09-08 07:28
本发明专利技术公开一种改进KNN方法的数据处理方法和装置,涉及数据处理技术领域,解决的技术问题是数据处理,采用的技术方案是,一种改进KNN方法的数据处理方法和装置,包括以下步骤:步骤一、从数据库信息中获取数据信息,并对获取的数据信息进行降维处理,以获取低维度数据信息;步骤二、通过改进KNN算法模型对降维后的数据信息进行数据信息处理;步骤三、通过改进型误差评估函数对处理后的数据信息进行评估;步骤四、数据信息应用与分享,对获取的数据信息进行远程数据信息处理和数据分享。本发明专利技术通过数据降维、数据预处理、数据挖掘、误差分析和处理,大大提高了数据信息处理能力。大大提高了数据信息处理能力。大大提高了数据信息处理能力。

【技术实现步骤摘要】
改进KNN方法的数据处理方法和装置


[0001]本专利技术涉及数据处理领域,且更确切地涉及一种改进KNN方法的数据处理方法和装置。

技术介绍

[0002]数据处理,数据处理是系统工程和自动控制的基本环节。数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度,极大地影响了人类社会发展的进程。数据(Data)是对事实、概念或指令的一种表达形式,可由人工或自动化装置进行处理。数据经过解释并赋予一定的意义之后,便成为信息。数据处理(data processing)是对数据的采集、存储、检索、加工、变换和传输。数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。
[0003]现有技术通常采用数据统计的方法实现数据信息的处理,这种方法虽然在一定程度上提高数据处理能力,但在对数据信息进行分析和计算时,很难实现其分类和数据信息处理,整体数据信息处理能力较差,数据信息处理方法滞后。

技术实现思路

[0004]针对上述技术的不足,本专利技术公开一种改进KNN方法的数据处理方法和装置,通过数据降维、数据预处理、数据挖掘、误差分析和处理,大大提高了数据信息处理能力。
[0005]为了实现上述技术效果,本专利技术采用以下技术方案:一种改进KNN方法的数据处理方法,其中包括以下步骤:步骤一、从数据库信息中获取数据信息,并对获取的数据信息进行降维处理,以获取低维度数据信息;步骤二、通过改进KNN算法模型对降维后的数据信息进行数据信息处理,改进KNN算法模型包括数据预处理步骤、数据分层步骤、数据KNN算法计算步骤和卷积分故障诊断步骤;步骤三、通过改进型误差评估函数对处理后的数据信息进行评估;步骤四、数据信息应用与分享,对获取的数据信息进行远程数据信息处理和数据分享。
[0006]作为本专利技术进一步的技术方案,降维处理的方法包括以下步骤:(S11)通过重构矩阵数据信息的方式实现降维处理,并设置重构矩阵数据个数、数据维度和时间延迟;(S12)通过平均交互信息法求解不同元素库的分布概率,并通过关联算法模型分析数据特征;(S13)通过虚假邻点法计算数据信息的维数,通过比较不同数据信息的维数进而选择不同的数据分类,两个不同维度之间的序列通过特征对度量法实现数据库信息内不同
元素之间的比较,公式为:
ꢀꢀ
(1)在公式(1)中,R表示数据维度,n表示向量,表示重构前的矩阵数据信息,表示重构后的矩阵数据信息;与表示重构矩阵数据之间的虚假邻点的关系,r 表示重构后增加的数据信息,u为重构矩阵数据信息最佳维度,重构后,重构矩阵数据的元素数据维度和降维后的数据维度之差大于10;(S14)降维判断,当降维数据信息满足当前需求时,则输出数据信息,当降维数据信息不满足当前需求时,则重新进行降维计算。
[0007]作为本专利技术进一步的技术方案,数据分层为差分分层,差分分层的方法为:将数据属性按照数量和种类划分为不同的属性,属性数据量从顶层到底层从少至多依次排列和分布;计算不同数据属性之间的距离,假设数据集合中的某个数据信息为,数据属性类别划分为、、和,则数据信息距离数据属性类别、、和之间的距离为、;将计算出的不同数据属性数据信息进行差分计算;当时,其中为常数,则数据信息划分到类。
[0008]作为本专利技术进一步的技术方案,数据KNN算法包括以下步骤:(S21)选择大数据信息测试集合,根据不同的数据属性选择测试大数据信息向量集合;(S22)训练大数据信息测试集合,通过分层类别,构建成 n 层树状形式;并通过最佳搜索算法实现大数据信息测试集合的数据搜索;(S23)依次计算大数据信息测试集合与第 1

n 层大数据信息测试集合训练集中每个大数据信息的文本相似度;通过欧式距离计算公式如下:
ꢀꢀꢀꢀ
(2)在公式(2)中, 表示大数据信息测试集合中测试信息的特征向量,表示大数据信息测试集合中测试信息的特征向量的序列;为第 1 层第j类的大数据信息测试集合中心向量,表示大数据信息的类;M为大数据信息测试集合特征向量的维数;为大数据信息测试集合向量的第 k 维;表示第 k 维中第一层第j类的大数据信息测试集合向量;
(S24)按照文本相似度,在训练文本集中选出与测试文本最相似的个文本;(S25)在测试文本的个近邻中,依次计算每类的权重,表示权重值公式,计算式为,其中为数据信息,表示第类的大数据信息测试集合中测试信息的特征向量,表示杰卡德相似系数,为相似度计算公式,表示相似度程度值,其中的取值为1 或者0,如果属于,则函数值为 1,否则为 0;(S26)对计算的权重进行排序,对排序后的权重进行差分比较,当时,其中表示特征的数据集,则测试文本属于第 1 类,在对第二层进行相似度比较的时候,只需要比较第二层中第 1 类的子类;如果,则继续进行判断,存在,当时,则测试本文属于1

类中的其中一类,在对第二层进行比较时,只需要比较第二层中第 1 类中第类的子类 ;如果时,则继续进行判断;其中表示排序后的向相邻权重的差分值,表示设置的大数据信息测试集合阈值差分值,表示存在类大数据信息测试集合距离值的差分值。
[0009]作为本专利技术进一步的技术方案,卷积分故障诊断方法包括以下步骤:通过扩张因果卷积与残差块构成故障诊断体系结构,残差块如公式(3)所示:(3)在公式(3)中,O是卷积分故障诊断模型输出层的输出变量,表示分故障诊断模型输出层的输入变量,表示深度学习的残差映射,在权重层之后,添加设置退出层,扩张因果卷积函数F(t)定义为:(4)公式(4)中,是过滤器;是神经网络的层级;表示输入的时间序列信息;为空洞参数,空洞间隔大小;表示空洞卷积算子;故障诊断体系结构的评估公式为:(5)公式(5)中,表示大数据信息故障评估指标均值,T表示预测持续周期,表示预测大数据信息故障体系结构的评估持续周期参数,表示深度学习模型各项超参数,θ表示故障诊断体系结构评价指标,表示大数据信息故障诊断体系结构评价指标的参数,通过建立正交化的评估矩阵将大数据信息故障评估指标进行信息交叠,不同信息之间相互影响迭代过程为:
(6)公式(6)中,α表示大数据信息故障评估指标相互交叠函数,β表示大数据信息之间相互影响迭代过程,根据大数据信息故障评估指标之间的迭代公式,对公式(6)矩阵建立算法程序,即:(7)公式(7)中,表示大数据信息故障评估正交化安全矩阵,μ表示正交化矩阵编辑参数;然后将各项大数据信息故障评估指标数据通过施密特公式应用在数据信息智能预测平台中,在线测试获得最佳评估效果输出为:(8)公式(8)中,表示验算的各项数据信息评估指标效果,m表示大数据信息架构节点数量,表示大数据信息架构节点数量的变量值,通过判定评估指标效果,进而计算权重公式,权重公式为:(9)公式(9)中,表示大数据信息故障评估指标权重。
[0010]作为本专利技术进一步的技术方案,改进型误差评估函数为(10)公式(10)中,包含有组数据,其中表示为大数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种改进KNN方法的数据处理方法,其特征在于:包括以下步骤:步骤一、从数据库信息中获取数据信息,并对获取的数据信息进行降维处理,以获取低维度数据信息;步骤二、通过改进KNN算法模型对降维后的数据信息进行数据信息处理,改进KNN算法模型包括数据预处理步骤、数据分层步骤、数据KNN算法计算步骤和卷积分故障诊断步骤;步骤三、通过改进型误差评估函数对处理后的数据信息进行评估;步骤四、数据信息应用与分享,对获取的数据信息进行远程数据信息处理和数据分享。2.根据权利要求1所述的一种改进KNN方法的数据处理方法,其特征在于:降维处理的方法包括以下步骤:(S11)通过重构矩阵数据信息的方式实现降维处理,并设置重构矩阵数据个数、数据维度和时间延迟;(S12)通过平均交互信息法求解不同元素库的分布概率,并通过关联算法模型分析数据特征;(S13)通过虚假邻点法计算数据信息的维数,通过比较不同数据信息的维数进而选择不同的数据分类,两个不同维度之间的序列通过特征对度量法实现数据库信息内不同元素之间的比较,公式为:
ꢀꢀꢀ
(1)在公式(1)中,R表示数据维度,n表示向量,表示重构前的矩阵数据信息,表示重构后的矩阵数据信息;与表示重构矩阵数据之间的虚假邻点的关系,r 表示重构后增加的数据信息,u为重构矩阵数据信息最佳维度,重构后,重构矩阵数据的元素数据维度和降维后的数据维度之差大于10;(S14)降维判断,当降维数据信息满足当前需求时,则输出数据信息,当降维数据信息不满足当前需求时,则重新进行降维计算。3.根据权利要求1所述的一种改进KNN方法的数据处理方法,其特征在于:数据分层为差分分层,差分分层的方法为:将数据属性按照数量和种类划分为不同的属性,属性数据量从顶层到底层从少至多依次排列和分布;计算不同数据属性之间的距离,假设数据集合中的某个数据信息为,数据属性类别划分为、、和,则数据信息距离数据属性类别、、和之间的距离为、;将计算出的不同数据属性数据信息进行差分计算;当时,其中为常数,则数据信息划分到类。4.根据权利要求1所述的一种改进KNN方法的数据处理方法,其特征在于:数据KNN算法包括以下步骤:(S21)选择大数据信息测试集合,根据不同的数据属性选择测试大数据信息向量集合;
(S22)训练大数据信息测试集合,通过分层类别,构建成 n 层树状形式;并通过最佳搜索算法实现大数据信息测试集合的数据搜索;(S23)依次计算大数据信息测试集合与第 1

n 层大数据信息测试集合训练集中每个大数据信息的文本相似度;通过欧式距离计算公式如下:(2)在公式(2)中, 表示大数据信息测试集合中测试信息的特征向量,表示大数据信息测试集合中测试信息的特征向量的序列;为第 1 层第j类的大数据信息测试集合中心向量,表示大数据信息的类;M为大数据信息测试集合特征向量的维数;为大数据信息测试集合向量的第 k 维;表示第 k 维中第一层第j类的大数据信息测试集合向量;(S24)按照文本相似度,在训练文本集中选出与测试文本最相似的个文本;(S25)在测试文本的个近邻中,依次计算每类的权重,表示权重值公式,计算式为,其中为数据信息,表示第类的大数据信息测...

【专利技术属性】
技术研发人员:李国权
申请(专利权)人:晨达广州网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1