System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种通信数据的聚类方法、系统、终端及介质技术方案_技高网

一种通信数据的聚类方法、系统、终端及介质技术方案

技术编号:40016060 阅读:6 留言:0更新日期:2024-01-16 16:01
一种通信数据的聚类方法、系统、终端及介质,其特征在于,方法包括:步骤1,采用智能设备SD将用户数据处理为待聚类数据集X,并根据终端用户U的聚类用户请求获取聚类簇数K和迭代轮次T;步骤2,通过智能设备SD和终端用户U分别将X、K、T发送给边缘节点EN,并向边缘节点EN提交聚类服务请求;步骤3,利用边缘节点EN调用范式距离计算协议,会同工业云IC迭代计算聚类中心μ<subgt;k</subgt;与样本点x<subgt;i</subgt;之间的距离,调用求最小值协议根据所述距离为所述样本点x<subgt;i</subgt;分配对应的聚类中心;步骤4,获取每一个所述样本点x<subgt;i</subgt;的聚类中心后,生成聚类结果E(μ<subgt;k</subgt;),并将所述聚类结果E(μ<subgt;k</subgt;)转发至提交过所述聚类用户请求的终端用户U进行解密。

【技术实现步骤摘要】

本专利技术涉及通信领域,更具体的,涉及一种通信数据的聚类方法、系统、终端及介质


技术介绍

1、物联网(iot)为智能城市的各个领域带来了巨大的好处(例如,智能交通系统、5g和虚拟现实)。其快速发展为城市居民带来了更加便捷、高效和个性化的服务,提高了城市的生活质量和竞争力。然而,物联网产生的数据量急剧增加,对计算和存储资源提出了更高的要求。仅通过云服务器存储和处理海量数据将带来严重的带宽和功耗问题。通过使用边缘节点,可以将一部分计算任务从中央数据中心转移到边缘节点,以减少延迟、节省带宽并提高数据隐私。边缘节点通常用于支持一些特殊的应用场景,如智能城市和物联网应用。

2、在智能城市中,机器学习被用于通过物联网分析复杂的数据和行业预测。由于其简单易实现,k-means已成为最常见的机器学习模型之一,并被广泛应用于图像分割、社交网络分析、医疗诊断和风险评估等领域。简而言之,聚类算法可以从大量数据中获得有用的知识,并找出数据之间的潜在关系。当收集到足够的训练数据时,模型可以更好地学习数据之间的关系和规则,从而提高其泛化能力和准确性。

3、外包的k-means服务可以通过将数据上传到云上为远程机器学习服务提供商进行培训。这些服务提供商通常拥有强大的计算和存储资源,可以提供专门的算法、模型优化和参数调整服务,以更好地训练高质量的模型。用户在使用外包的机器学习服务时,需要注意数据安全和隐私保护,避免敏感数据泄露。此外,边缘的数据很容易被窃取和篡改,导致工业系统的丢失和损坏。因此,有必要提高数据处理过程中的安全性,并引入加密机制。然而,由于资源限制,这意味着数据收集框架不仅必须维护安全和隐私,还必须确保低能耗。

4、在外包机器学习中,同态加密(he)可以用于保护数据隐私,同时允许在不暴露原始数据的情况下进行计算和分析。例如,数据可以被加密并上传到云,云提供商可以对数据进行加密和计算,然后将结果返回给用户。通过这种方式,可以实现数据共享和外包计算等需求。

5、同态加密的主要优点是可以在不暴露原始数据的情况下进行计算,从而保护数据的隐私和安全。然而,同态加密技术也存在两个问题。首先,he将计算任务分配给云服务,用户需要参与计算过程。中国专利“cn202210609601.7-基于同态加密的数据聚类方法及装置与流程”提出的外包聚类联邦方法中,大多数计算和数据处理技术都需要使用云计算资源进行处理和分析,这导致了云服务器的负担。同时,用户需要参与计算过程,如数据加密、解密、计算等操作,这些操作需要使用本地计算资源进行处理。

6、其次,中国专利“cn2019104519960-基于向量同态加密的隐私保护k-means聚类方法”使用相同的公钥进行加密,这导致了数据泄露的风险。在he中,通常采用公钥加密和私钥解密来实现数据的机密性和安全性。在这种情况下,使用相同的公钥加密数据是不安全的。具体而言,如果使用相同的公钥对数据进行加密,则加密后的数据将集中分布在密文空间中,这使其容易受到攻击者的有针对性的攻击。攻击者可以试图通过破解加密算法或暴力破解来获取加密数据,从而导致数据泄露和安全风险。

7、第三,现有技术中虽然存在聚类与同态加密同时应用,在克服安全风险的同时支持多方训练与隐私学习的技术方案,但是,现有技术中并没有适应性的提供具体的通信协议,以从协议层、数据处理、电路实现等的具体实施方式上提供任何具体方案或参考方法。在此基础上,涉及的数学模型,无法考虑到通信过程、数据处理过程中噪声的影响程度,也无法考虑到通信协议实施过程中的运算代价和电路复杂度。

8、针对上述问题,亟需一种通信数据的聚类方法、系统、终端及介质。


技术实现思路

1、为解决现有技术中存在的不足,本专利技术提供一种既能保护数据拥有者的隐私信息,又能支持多方共同训练模型的方法,以提升模型准确率。

2、本专利技术采用如下的技术方案。

3、本专利技术第一方面,涉及一种通信数据的聚类方法,方法包括以下步骤:步骤1,采用智能设备sd将用户数据处理为待聚类数据集x,并根据终端用户u的聚类用户请求获取聚类簇数k和迭代轮次t;步骤2,通过智能设备sd和终端用户u分别将x、k、t发送给边缘节点en,并向边缘节点en提交聚类服务请求;步骤3,利用边缘节点en调用范式距离计算协议,会同工业云ic迭代计算聚类中心μk与样本点xi之间的距离,随后调用求最小值协议根据距离为样本点xi分配对应的聚类中心;步骤4,获取每一个样本点xi的聚类中心后,生成聚类结果e(μk),并将聚类结果e(μk)转发至提交过聚类用户请求的终端用户u进行解密。

4、优选的,步骤3中,会同工业云ic迭代计算聚类中心μk与样本点xi之间的距离还包括:ic向每个en发送聚类算法所需要初始模型参数;每个en与ic合作,对加密数据进行局部k-means聚类,并将加密的局部聚类中心发送给ic;ic将加密的本地参数聚合到每个en,每个en重复上述聚类,直到结束迭代。

5、优选的,范式距离计算协议还包括:针对样本点和聚类中心中的每一个维度特征,分别将样本点和聚类中心的维度特征转化为二进制数据,并按位加密;基于二进制数据中每一位数据之间的距离计算每一个对应位的距离,并合成总距离;根据最高位的取值结果,确认是否需要对总距离进行取反操作,最终输出范式距离;对样本点和聚类中心中的所有维度特征求解范式距离,并采用曼哈顿距离计算每一个维度特征的范式距离的和,以得到样本点和聚类中心之间的总距离。

6、优选的,求最小值协议还包括:调用比较协议对范式距离结果e(dis[k])中的每一个距离值dis[1],dis[2],……,dis[k]进行比较得到数组e(a[i][k]);其中,每一个距离值为当前数据点xi,对应于k个聚类中心c1,c2,……,ck的距离;数组e(a[i][k])中取值为1的项即为距离最小值所对应的聚类中心的索引。

7、优选的,比较协议还包括:比较两个二进制逐位加密数据e(a)=e(an)e(an-1)...e(a0)和e(b)=e(bn)e(bn-1)...e(b0),计算其中,e(c)=select(e(temp),e(c),e(bi)),若res=1,则表示a<b;若res=0,则a≥b。

8、优选的,选择协议还包括:en将添加有噪声的选择条件e(z)传输给ic后,ic经过私钥对所述选择条件进行解密,并基于噪声和传输条件生成选择结果;当存在噪声r时,选择结果为其中,e(x)和e(y)为待选择项,e(z)通过r⊙z′实现恢复;其中,z′为ic接收、十进制转换和解密后得到的选择条件。

9、优选的,智能设备sd、边缘节点en和终端用户u之间通过同态加密算法实现数据交换。

10、本专利技术第二方面,涉及一种通信数据的聚类系统,系统用于实现本专利技术第一方面中的方法;并且,系统包括工业云ic、多个边缘节点en,通过多个边缘节点en连接至工业云的多个智能设备sd,连接至工业云ic的多个本文档来自技高网...

【技术保护点】

1.一种通信数据的聚类方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种通信数据的聚类方法,其特征在于:

3.根据权利要求1所述的一种通信数据的聚类方法,其特征在于:

4.根据权利要求1所述的一种通信数据的聚类方法,其特征在于:

5.根据权利要求4所述的一种通信数据的聚类方法,其特征在于:

6.根据权利要求5所述的一种通信数据的聚类方法,其特征在于:

7.根据权利要求5所述的一种通信数据的聚类方法,其特征在于:

8.一种通信数据的聚类系统,其特征在于:

9.一种终端,包括处理器及存储介质;其特征在于:

10.计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-8任一项所述方法的步骤,,以及所述方法中的范式距离计算协议、求最小值协议、比较协议和选择协议中的一种或多种。

【技术特征摘要】

1.一种通信数据的聚类方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种通信数据的聚类方法,其特征在于:

3.根据权利要求1所述的一种通信数据的聚类方法,其特征在于:

4.根据权利要求1所述的一种通信数据的聚类方法,其特征在于:

5.根据权利要求4所述的一种通信数据的聚类方法,其特征在于:

6.根据权利要求5所述的一种通信数据的聚类方法,...

【专利技术属性】
技术研发人员:马斌栗维勋栗会峰孙广辉王亚军袁龙王丹王琛李勃王伟涛王炎冯思博任佳月
申请(专利权)人:国网河北省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1