用于电子设计自动化(EDA)应用的数据集的基于超空间的处理制造技术

技术编号:36900146 阅读:14 留言:0更新日期:2023-03-18 09:20
一种计算系统(100)可以包括超空间生成引擎(110)和超空间处理引擎(112)。超空间生成引擎(110)可以被配置来访问特征向量集(210、420、520),并且特征向量集中的特征向量可以表示数据集中的数据点的多个参数的值。超空间生成引擎(110)还可以被配置为对特征向量集(210、420、520)执行主成分分析,并且将主成分空间(230、310)量化成由超盒组成的超空间(240、340、410、510)。超空间处理引擎(112)可以被配置为根据特征向量集(210、420、520)到超空间(240、340、410、510)的超盒的映射来处理数据集。集。集。

【技术实现步骤摘要】
【国外来华专利技术】用于电子设计自动化(EDA)应用的数据集的基于超空间的处理

技术介绍

[0001]随着现代技术的进步,计算系统可以访问、生成、和处理越来越多的数据。复杂数据集可以包括许多数据点,并且数量可以容易地达到数亿、数十亿、数万亿或更多的数据样本。在集成电路技术变得越来越复杂的电子设计自动化(Electronic Design Automation,EDA)技术中,EDA过程可以生成、消耗、或者以其他方式处理越来越大的数据集。
附图说明
[0002]在以下具体描述中并参考附图描述了某些示例。
[0003]图1示出了支持超空间生成和对数据集进行基于超空间的处理的计算系统的示例。
[0004]图2示出了由超空间生成引擎进行的示例超空间生成。
[0005]图3示出了由超空间生成引擎针对从主成分空间量化的超空间确定超盒维度的示例。
[0006]图4示出了使用所生成的超空间对数据集进行下采样的基于超空间的处理的示例。
[0007]图5示出了使用所生成的超空间对数据集进行分类的基于超空间的处理的示例。
[0008]图6示出了系统可以实施以支持超空间生成和对数据集进行基于超空间的处理的逻辑的示例。
[0009]图7示出了支持超空间生成和对数据集进行基于超空间的处理的计算系统的示例。
具体实施方式
[0010]现代计算系统和应用可生成大量数据。对这种数据的处理可能需要密集的计算资源,特别是当大数据集中的数据点的数量为数亿、数十亿、数万亿以及可能更多时。示例数据集分析可以包括分类或下采样过程,并且对大数据集的有意义的分类、下采样或其他处理可能对现代计算系统和应用带来不可接受的性能损失。虽然可以对大数据集执行简化的处理技术(例如随机混洗淘汰选择(down selection)),但是这样的处理技术可能不适合于一致地捕获对数据集的准确处理所必需的离群数据点。一些分类技术(如K均值聚类或马氏(Mahalanobis)聚类计算)可以提供分类能力,但是具有O(n2)复杂度。对于数以百万计或更多的数据集,使用具有O(n2)复杂度的这种技术的数据集分类可能花费过多的时间或者需要不切实际的大型或复杂的计算系统。
[0011]在EDA背景下,由于集成电路(IC)复杂度的增加,为EDA过程生成或使用的数据集的大小正在增加。使用具有O(n2)复杂度的现有技术对这种巨大EDA数据集进行有意义的分类、下采样、或其他处理可能是具有挑战性的、耗时的、不准确的,或者需要不切实际量的计算资源。例如,光学的或抗蚀的模型校准流程可能要求对所制造的芯片进行扫描电子束显
微镜(SEM)测量的准确度,但是SEM技术可能在测量带宽方面受到限制,并且需要从数千万(或更多)个潜在的兴趣点芯片位置进行淘汰选择。作为另一个示例,当训练集超过数百万个训练数据样本时,基于机器学习(ML)的光学邻近修正(OPC)模型校准的有效性可能受到限制,但是EDA应用可能容易地获得数千万或数亿个OPC样本点。以类似的方式,用于面向制造的设计(DFM)、热点预测、或其它EDA过程的电路部分的模糊模式匹配可能需要数千万或数亿的电路图像比较,并且使用具有O(n2)复杂度的现有技术对这种大EDA数据集的分类分析在计算时延和必要的计算资源方面对于现有EDA系统可能是不切实际的。
[0012]本文的公开内容可以提供用于超空间生成和对数据集进行基于超空间的处理的系统、方法、设备、和逻辑。如本文所用,超空间可以指或包括具有多个维度的坐标空间,以映射数据集中的数据点的多个参数值(无论是直接映射还是作为经变换的参数映射),并且其中坐标系的至少一部分被分割成多个超盒(hyperbox)。所生成的超空间的超盒可以用于以高效且准确的方式处理大数据集。如本文更详细描述的那样,超空间可以通过变换数据集的特征空间并且将经变换的特征空间量化成一组超盒来生成。对数据集的处理可以通过处理包含数据集的至少一个或多个映射特征向量的超空间的量化超盒来执行。对超盒的维度确定可以考虑数据集的数据点中的数据差异,并且对数据集进行基于超空间的处理可以增加下采样数据集中的范围一致性、分类准确度、或两者的组合。
[0013]本文描述的超空间生成和基于超空间的处理特征可具有O(n)复杂度,并且所描述的超空间特征可因此展现与其他O(n2)处理技术相比增加的计算效率和速度,无论是在执行时延方面还是在所需计算资源方面。具体地,在EDA背景下,本公开的超空间特征可以提高处理EDA数据集的计算效率,以用于基于ML的OPC模型校准、用于DFM过程的模糊模式匹配、用于SEM测量目标的淘汰选择等等。附加地或替代性地,本文描述的超空间特征可支持对数据集中的离群数据点的识别、采样、或其它处理,与简化的随机淘汰选择技术相比,这可提高EDA热点预测分析、SEM测量、或其它EDA数据集分析的准确度或覆盖范围。
[0014]根据本公开的这些和其它超空间特征和技术益处在本文中更详细地描述。
[0015]图1示出了支持超空间生成和对数据集进行基于超空间的处理的计算系统100的示例。计算系统100可以采取单个或多个计算设备(例如应用服务器、计算节点、台式或膝上型计算机、智能电话或其他移动设备、平板设备、嵌入式控制器等)的形式。计算系统100可以实施任何类型的应用、电路或数据处理系统,来生成、消耗、分析、或以其他方式处理数据。仅作为几个说明性示例,计算系统100可以采取以下形式:实施EDA应用特征的EDA系统、被配置来分析DNA链或其他复杂生物数据集的医学分析系统、具有对由复杂物联网(IoT)传感器系统捕获的数据点的分析能力的过程自动化系统、被配置来处理车辆交通数据点的实时测量结果并对其作出反应的交通控制器系统,以及采取近乎无数的更多的形式。
[0016]计算系统100可以实施本文描述的任何超空间特征。在这样做时,计算系统100可以生成用于数据集的超空间,包括通过变换表示数据集的特征向量集的特征空间。特征空间的变换可以通过任何数量的多变量分析来执行,并且计算系统100可以通过将经变换的特征空间(或其至少一部分)分割成一组超盒来进一步量化经变换的特征空间。超盒的维度值可以由计算系统100确定,以具体地考虑经变换的特征空间的参数之间的方差(例如基于可归因于经变换的特征空间的主成分的数据集方差)。通过这种生成的超空间,计算系统100可以支持对从其生成超空间的原始数据集、与原始数据集不同的其他数据集、或两者的
组合进行基于超空间的处理。
[0017]作为支持本文描述的超空间特征的任何组合的示例实施方式,图1所示的计算系统100包括超空间生成引擎110和超空间处理引擎112。计算系统100可以以各种方式实施引擎110和引擎112(包括其组件),例如作为硬件和编程。用于引擎110和引擎112的编程可以采取存储在非瞬态机器可读存储介质上的处理器可执行指令的形式,并且用于引擎110和11引擎2的硬件可以包括执行这些指令的处理器。处理器可以采取单处理器或多处理器系统的形式,并且在一些示例中,计算系统100使用同一计算系统本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法,包括:通过计算系统(100):访问(602)特征向量集(210、420、520),其中,所述特征向量集中的给定特征向量表示数据集中的给定数据点的多个参数的值;对所述特征向量集(210、420、520)执行(604)主成分分析,其中,所述主成分分析将所述特征向量集(210、420、520)的特征空间(220)变换成由从所述特征空间(220)旋转的主成分轴组成的主成分空间(230、310),并且其中,所述主成分轴从所述特征空间(220)的旋转基于针对所述主成分空间(230、310)的所述主成分而确定的本征值(304);将所述主成分空间(230、310)量化(606)成由超盒组成的超空间(240、340、410、510);以及根据所述特征向量集(210、420、520)到所述超空间(240、340、410、510)的所述超盒的映射来处理(608)所述数据集。2.根据权利要求1所述的方法,其中,所述超空间(240、340、410、510)中的每个超盒具有等于所述主成分空间(230、310)中的主成分的数量的维度数量,并且其中,沿给定主成分轴的每个超盒的维度大小是所述给定主成分轴的特定主成分的所确定的本征值的函数。3.根据权利要求2所述的方法,其中,将所述主成分空间(230、310)量化成所述超空间(240、340、410、510)包括:将所述特征向量集(210、420、520)映射到所述主成分空间(230、310)中以获得经变换的特征向量集;识别所述主成分中具有最高确定的本征值的第一主成分;确定所述第一主成分的所述经变换的特征向量集的值范围(320);以及将沿着所述第一主成分的主成分轴的每个超盒的维度大小设置为所述第一主成分的所述值范围(320)和预定的除数值(302)的函数。4.根据权利要求3所述的方法,其中,包括:将所述第一主成分的所述值范围(320)确定为所述经变换的特征向量集中的所述第一主成分的最小值(321)与所述经变换的特征向量集中的所述第一主成分的最大值(322)之间的差;以及将沿着所述第一主成分的所述主成分轴的每个超盒的所述维度大小设置为所确定的值范围(320)除以所述预定的除数值(302)。5.根据权利要求3或4所述的方法,其中,将所述主成分空间(230、310)量化成所述超空间(240、340、410、510)还包括:识别所述主成分中具有所确定的本征值比所述第一主成分的所确定的本征值更小的第二主成分;确定所述第二主成分的所述经变换的特征向量集的值范围(330);以及将沿着所述第二主成分的主成分轴的每个超盒的所述维度大小设置为所述第二主成分的所述值范围(330)、所述预定除数值(302)、以及所述第一主成分和所述第二主成分的所述确定的本征值之间的比率的函数。6.根据权利要求1至5中任一项所述的方法,其中,进一步处理包括获得下采样数据集(430),包括通过从每个超盒中选择代表性特征向量,所述代表性特征向量包括映射到所述超盒中的至少一个特征向量。
7.根据权利要求1至6中任一项所述的方法,还包括:访问包括与所述数据集的所述特征向量不同的特征向量的不同数据集;以及使用从所述特征向量集确定的所述超空间(240、340、410、510)处理所述不同数据集,包括通过将所述不同数据集的特征向量映射到所述超空间(240、340、410、510)中。8.一种系统(100),包括:超空间生成引擎(110),其被配置为:访问特征向量集(210、420、520),其中,所述特征向量集中的给定特征向量表示数据集中的给定数据点的多个参数的值;对所述特征向量集(210、420、520)执行主成...

【专利技术属性】
技术研发人员:马远升洪乐
申请(专利权)人:西门子工业软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1