【技术实现步骤摘要】
【国外来华专利技术】用于电子设计自动化(EDA)应用的数据集的基于超空间的处理
技术介绍
[0001]随着现代技术的进步,计算系统可以访问、生成、和处理越来越多的数据。复杂数据集可以包括许多数据点,并且数量可以容易地达到数亿、数十亿、数万亿或更多的数据样本。在集成电路技术变得越来越复杂的电子设计自动化(Electronic Design Automation,EDA)技术中,EDA过程可以生成、消耗、或者以其他方式处理越来越大的数据集。
附图说明
[0002]在以下具体描述中并参考附图描述了某些示例。
[0003]图1示出了支持超空间生成和对数据集进行基于超空间的处理的计算系统的示例。
[0004]图2示出了由超空间生成引擎进行的示例超空间生成。
[0005]图3示出了由超空间生成引擎针对从主成分空间量化的超空间确定超盒维度的示例。
[0006]图4示出了使用所生成的超空间对数据集进行下采样的基于超空间的处理的示例。
[0007]图5示出了使用所生成的超空间对数据集进行分类的基于超空间的处理的示例。
[0008]图6示出了系统可以实施以支持超空间生成和对数据集进行基于超空间的处理的逻辑的示例。
[0009]图7示出了支持超空间生成和对数据集进行基于超空间的处理的计算系统的示例。
具体实施方式
[0010]现代计算系统和应用可生成大量数据。对这种数据的处理可能需要密集的计算资源,特别是当大数据集中的数据点的数量为数亿、数十亿、数万亿以及可能更多时。示例数据集分析可以包括分类或下 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:通过计算系统(100):访问(602)特征向量集(210、420、520),其中,所述特征向量集中的给定特征向量表示数据集中的给定数据点的多个参数的值;对所述特征向量集(210、420、520)执行(604)主成分分析,其中,所述主成分分析将所述特征向量集(210、420、520)的特征空间(220)变换成由从所述特征空间(220)旋转的主成分轴组成的主成分空间(230、310),并且其中,所述主成分轴从所述特征空间(220)的旋转基于针对所述主成分空间(230、310)的所述主成分而确定的本征值(304);将所述主成分空间(230、310)量化(606)成由超盒组成的超空间(240、340、410、510);以及根据所述特征向量集(210、420、520)到所述超空间(240、340、410、510)的所述超盒的映射来处理(608)所述数据集。2.根据权利要求1所述的方法,其中,所述超空间(240、340、410、510)中的每个超盒具有等于所述主成分空间(230、310)中的主成分的数量的维度数量,并且其中,沿给定主成分轴的每个超盒的维度大小是所述给定主成分轴的特定主成分的所确定的本征值的函数。3.根据权利要求2所述的方法,其中,将所述主成分空间(230、310)量化成所述超空间(240、340、410、510)包括:将所述特征向量集(210、420、520)映射到所述主成分空间(230、310)中以获得经变换的特征向量集;识别所述主成分中具有最高确定的本征值的第一主成分;确定所述第一主成分的所述经变换的特征向量集的值范围(320);以及将沿着所述第一主成分的主成分轴的每个超盒的维度大小设置为所述第一主成分的所述值范围(320)和预定的除数值(302)的函数。4.根据权利要求3所述的方法,其中,包括:将所述第一主成分的所述值范围(320)确定为所述经变换的特征向量集中的所述第一主成分的最小值(321)与所述经变换的特征向量集中的所述第一主成分的最大值(322)之间的差;以及将沿着所述第一主成分的所述主成分轴的每个超盒的所述维度大小设置为所确定的值范围(320)除以所述预定的除数值(302)。5.根据权利要求3或4所述的方法,其中,将所述主成分空间(230、310)量化成所述超空间(240、340、410、510)还包括:识别所述主成分中具有所确定的本征值比所述第一主成分的所确定的本征值更小的第二主成分;确定所述第二主成分的所述经变换的特征向量集的值范围(330);以及将沿着所述第二主成分的主成分轴的每个超盒的所述维度大小设置为所述第二主成分的所述值范围(330)、所述预定除数值(302)、以及所述第一主成分和所述第二主成分的所述确定的本征值之间的比率的函数。6.根据权利要求1至5中任一项所述的方法,其中,进一步处理包括获得下采样数据集(430),包括通过从每个超盒中选择代表性特征向量,所述代表性特征向量包括映射到所述超盒中的至少一个特征向量。
7.根据权利要求1至6中任一项所述的方法,还包括:访问包括与所述数据集的所述特征向量不同的特征向量的不同数据集;以及使用从所述特征向量集确定的所述超空间(240、340、410、510)处理所述不同数据集,包括通过将所述不同数据集的特征向量映射到所述超空间(240、340、410、510)中。8.一种系统(100),包括:超空间生成引擎(110),其被配置为:访问特征向量集(210、420、520),其中,所述特征向量集中的给定特征向量表示数据集中的给定数据点的多个参数的值;对所述特征向量集(210、420、520)执行主成...
【专利技术属性】
技术研发人员:马远升,洪乐,
申请(专利权)人:西门子工业软件有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。