【技术实现步骤摘要】
本专利技术涉及数据处理
,具体而言,涉及一种数据生成方法和装置。
技术介绍
随着信息技术和计算机网络技术的迅速发展,传统的制造模式已经不能适应现代化生产的制造要求。为了响应市场的快速变化和提高企业的核心竞争力,工业界和学术界研究提出了一批先进制造技术或模式,如:制造网格(MGrid)、全球化制造(Globalmanufacturing)、虚拟制造(VM)、敏捷制造(AM)等。当前对网络化制造的研究主要是基于在各企业间建立信息共享技术,通过企业间的协同合作以及制造资源的集成与共享,从而生产出能够适应市场变化的高质量产品。虽然网络化制造已经有了较大的发展,但是在技术上还存在着一定的问题,如没有很好地解决制造资源的动态共享与智能分配以及制造资源在网络通信、数据传输中的安全性等,这些问题严重阻碍了网络化制造的推广应用。针对这些问题,研究人员提出了一种基于云计算服务模式的网络化制造新模式—云制造(Cloudmanufacturing,CMfg)。云制造技术是一种基于网络的、面向服务的制造新模式,融合与发展了现有信息化制造技术(信息化设计、生产、实验、仿真、集成)及新兴信息技术(云计算、物联网、服务计算、智能科学、高效能计算等)。将各类制造资源和制造能力虚拟化、服务化,构成服务云池,并进行统一集中的管理和经营通过网络实现随时按客户需求获取制造资源与能力服务,以完成其制造全生命周期的各类活动。随着云制造概念及相关技术的发展,相关的云制造仿真平台也不断更新迭代。云制造仿真平台主要用于针对云制造相关的模式、规则、算法、通信等技术做仿真,对相关技术进行验证。然而,由于 ...
【技术保护点】
一种数据生成方法,应用于仿真平台中,其特征在于,包括:确定实际样本数据的向量总数和向量维度;根据所述向量维度计算所述实际样本数据中的所有向量之间的欧氏距离,将欧氏距离最大的两个向量作为所述实际样本数据的初始质心;对于所述实际样本数据中的每个向量依次进行下述处理:计算当前向量与所述实际样本数据的当前各个质心的欧氏距离,根据三角形法则和所述欧氏距离判断所述当前向量是否存在所归属的簇;如果是,将所述当前向量添加至所归属的簇,并根据所述簇内的所有向量计算所述簇的新的质心;如果否,将所述当前向量作为所述实际样本数据的新的质心;当所述实际样本数据中的每个向量均完成上述处理时,获取每个簇中向量的个数,去掉向量个数小于预设值的簇;根据得到的所有簇和质心,计算簇内的向量数量与所述实际样本数据的向量总数的数据比例和噪声数据比;将所述实际样本数据的质心、每个簇的数据比例及噪声数据比,作为仿真模板;根据所述仿真模板生成所述实际样本数据的实验仿真数据。
【技术特征摘要】
1.一种数据生成方法,应用于仿真平台中,其特征在于,包括:确定实际样本数据的向量总数和向量维度;根据所述向量维度计算所述实际样本数据中的所有向量之间的欧氏距离,将欧氏距离最大的两个向量作为所述实际样本数据的初始质心;对于所述实际样本数据中的每个向量依次进行下述处理:计算当前向量与所述实际样本数据的当前各个质心的欧氏距离,根据三角形法则和所述欧氏距离判断所述当前向量是否存在所归属的簇;如果是,将所述当前向量添加至所归属的簇,并根据所述簇内的所有向量计算所述簇的新的质心;如果否,将所述当前向量作为所述实际样本数据的新的质心;当所述实际样本数据中的每个向量均完成上述处理时,获取每个簇中向量的个数,去掉向量个数小于预设值的簇;根据得到的所有簇和质心,计算簇内的向量数量与所述实际样本数据的向量总数的数据比例和噪声数据比;将所述实际样本数据的质心、每个簇的数据比例及噪声数据比,作为仿真模板;根据所述仿真模板生成所述实际样本数据的实验仿真数据。2.根据权利要求1所述的数据生成方法,其特征在于,根据所述向量维度计算所述实际样本数据中的所有向量之间的欧氏距离,包括:采用公式计算两个向量之间的欧氏距离;其中,a、b为向量,m为向量维度,ai为向量a的第i维的值、bi为向量b的第i维的值。3.根据权利要求1所述的数据生成方法,其特征在于,根据三角形法则和所述欧氏距离判断所述当前向量是否存在所归属的簇,包括:找到与所述当前向量欧氏距离最小的两个质心;若公式Dist(a,K1)+Dist(a,K2)>Dist(K1,K2)不成立,则所述当前向量存在所归属的簇,所述当前向量所归属的簇为与所述当前向量欧氏距离最小的质心所在的簇;若公式Dist(a,K1)+Dist(a,K2)>Dist(K1,K2)成立,则所述当前向量不存在所归属的簇;式中,a为所述当前向量,K1、K2为与所述当前向量a欧氏距离最小的两个质心。4.根据权利要求1所述的数据生成方法,其特征在于,根据所述簇内的所有向量计算所述簇的新的质心,包括:以所述簇的当前质心作为圆心,簇内与所述圆心欧氏距离最大的向量到圆心的距离作为半径,建立一个高维球;计算所述高维球内所有的向量与圆心之间的距离向量,采用公式将所有距离向量全部相加,得到概率密度向量;其中,Mh为概率密度向量,x为当前质心,xi为高维球内的向量,Sk为高维球内所有向量的集合,K为高维球内的向量数量;以概率密度向量的终点为圆心,再建立一个高维球,重复计算Mh;当Mh收敛到预定范围内时,视为收敛,Mh收敛后的圆心为所述簇的新的质心。5.根据权利要求1所述的数据生成方法,其特征在于,根据得到的所有簇和质心,计算簇内的向量数量与所述样本数据的向量总数的数据比例和噪声数据比,包括:根据得到的所有簇和质心,计算每个簇内的向量数量与所述实际样本数据的向量总数的数据比例qn;以簇内向量距所述...
【专利技术属性】
技术研发人员:张霖,赵淳,任磊,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。