当前位置: 首页 > 专利查询>司光亚专利>正文

一种大规模虚拟个体基础属性逆向生成方法技术

技术编号:4252643 阅读:211 留言:0更新日期:2012-04-11 18:40
提出了一种大规模虚拟个体基础属性逆向生成方法。该方法包括步骤:A、抽取并定义虚拟个体的属性集合;B、确定各个属性的属性值集合;C、确定属性集合中任意两个属性值集合的统计分布F(xi)以及其联合概率分布f(xi);D、进行属性自选择。通过本发明专利技术,很好的保持了仿真社会中虚拟个体初始属性数据在宏观与微观两个方面与现实数据的一致性,从而使社会仿真运行时结果更加理想。

【技术实现步骤摘要】

本专利技术涉及社会仿真领域,尤其是涉及一种社会仿真中大规模虚拟个体基础属性的逆向生成方法(Attribute Utility Choice Model简称AUCM)。
技术介绍
在大型综合社会仿真系统、大规模群体行为建模等复杂大系统建模仿真中,初始数据产生问题是人们长期关注的问题。比如,要建立一个虚拟北京,虚拟北京中的人口数据我们只能从社会抽样调查或相关部门的普查结果中获得一些宏观统计数据,如年龄、职业、居住地等的统计分布情况,但是具体到一个虚拟个体,如何为他取定具体的年龄、职业、居住地、婚因状况、学历、收入情况等等的初始值?我们不可能去调查现实社会中的每个北京人,只能根据这些宏观统计分布反过来产生相对应的虚拟个体初始数据。目前人们普遍采用的是迭代比例拟合(IPF)技术。然而,迭代比例拟合只能使生成的虚拟人口总体上符合现实社会的宏观统计分布,但生成的虚拟人口个体的多个属性之间有时会出现一些不协调,例如IPF可能会生成的某个这样的虚拟个体年龄15-19岁,婚姻状况已婚...在这个年龄段结婚的个体显然不符合现实。这通常会导致虚拟人在仿真运行过程中表现出一些异乎寻常的行为。 国内外现有的大规模虚拟个体基础属性初始数据生成的技术主要是迭代比例拟合IPF(Iterative Proportional Fitting)方法。该技术是由Deming和Stephan提出的,主要思想在二维表(或多维表)行列边际值的约束下,快速调整求得单元格值,是从两个或多个数据集中得到联合数据(分布)的迭代计算过程。例如表1所示,已知年龄和婚姻状况(未婚、已婚和离婚寡居)的边际分布(统计规律),需要计算所有格子(个体属性)。表中虚线框为边际约束,是某地区人口统计部门得到的真实值,右图中实线框内为经IPF法求出的各个格子的数据。再逐一生成相应的个体,例如,我们得出30-44岁的未婚人数(即第三行第一列V(4,2)格子的值)是165,那么就将165个虚拟个体的年龄设为30-44岁之间、婚姻状况设为未婚,如此逐步生成所有的个体及其所有属性。 表1已知边际分布求联合分布的示例 (1.1) (1.2) 此后,IPF法经Finberg、Bishop和wong分别针对具体应用进行了研究和改进。其符号描述如下 符号约定用θ表示所有足标的全集,用θq表示某一具体的轮廓下标。 表示多维表的s个轮廓(边际),该值应为已获取的值。 表示格子内的值(边际值)。mθ(0)表示初始估计值,通常取为1或者平均数。 表示初值mθ(0)的某一边际值。其具体过程如下 步骤1将初始值依次匹配到每一个边际约束,按下述比例进行处理 然后依次处理所有的边际约束(2,…,s),总处理完共s步,为一个周期。一般的,在第t步有 步骤2然后进行迭代,当计算完第r周期后,有 步骤3在第r个周期的最后一步时(步数为t=rs),拟合计算 如果δθ上限小于给定的停止条件δ,便终止计算,否则转到步骤1,进行新一周期的迭代,新的迭代的初始值就是上一周期结果值。 IPF技术目前得到了广泛应用。由Purdue大学Krannert管理学院的SEAS实验室开发的基于Agent的大规模分布式建模与仿真环境(SyntheticEnvironment for Analysis and Simulation简称SEAS)中融合了政治、经济、军事、社会、信息、基础设施的多领域模型支持政治、经济、军事、国家安全、社会突发应急事件等领域的多方对抗与协作推演。目前已经被广泛应用于商业企业、经济、国土安全仿真分析、军事领域的非军事仿真分析(EBO,ONA)、社会突发危机事件决策分析,反恐怖作战等。其中,人口生成算法采用的就是IPF技术。 但IPF技术的迭代比例拟合的过程是一个只关注宏观统计分布的数学过程。其成功的方面是所生成的大量虚拟个体数据的宏观统计规律与外部现实世界能较好的逼近,比如,就表一而言,最后生成18324个虚拟个体,其年龄段与婚姻状况的分布规律与已知数据基本吻合。但是,却有86.7个已婚的15-19岁之间的虚拟个体,如果再增加虚拟个体的属性,例如教育程度、职业、收入情况等等,还会出现更多的类似于“小学文化月收入800元已婚的15-19岁的大学教授”这样的“怪异虚拟个体”,出现这种情况的原因在于IPF法的只是像摊面饼一样使大量个体在宏观统计上符合现实,却没有考虑单个个体的内部多个属性之间的联系是否合理、是否现实。这通常会对仿真结果产生影响。 为此,我们需要在实际的社会仿真系统开发过程中解决这一突出问题,即如何生成即符合统计分布,又符合实际情况的个体基础属性数据。
技术实现思路
本专利技术是鉴于上述技术问题而产生的。本专利技术的一个目的是提出。 在一个方面中,根据本专利技术的大规模虚拟个体基础属性逆向生成方法包括步骤A、抽取并定义虚拟个体Agent的属性集合A={A1,A2,...,An};B、确定各个属性的属性值集合;C、确定属性集合中任意两个属性值集合Ai={a1,a2,...,am}和Aj={b1,b2,...,bn}的统计分布F(xi)以及其联合概率分布f(xi);D、进行属性自选择。 在这个方面中,其中步骤C进一步包括对属性按类型进行分组以描述诸多属性的内在依赖关系,即联合概率分布函数。 在这个方面中,其中在步骤D中对属性全集中的第i个属性执行以下处理,i从0开始D1、对第j个虚拟个体进行效用评估,其中j初始化等于0;D2、使j加1,并且判断j是否等于虚拟个体数目,若等于则转入步骤D3,否则转到步骤D1;D3、通过全局统计得到属性临时统计分布 D4、按下式进行宏观约束,如果 则i增加1,并转到步骤D1处理下一个属性,否则进行步骤D5,如果i等于属性总数,即属性全集中所有属性处理完,则该处理结束;D5、按下式对效用评估函数U(x(a,b))进行调整,并转到步骤D2 在这个方面中,其中 其中 为外部属性效用, 为内部效用。 在这个方面中,其中 其中预定边界值 指属性A的取值集合中取an时对应的边界值, 为已经取该值的Agent个数。 在这个方面中,其中 为联合概率分布。 通过本专利技术,克服了IPF技术的不足,很好的保持了仿真社会中虚拟个体初始属性数据在宏观与微观两个方面与现实数据的一致性,从而使社会仿真运行时结果更加理想,提高社会仿真的现实意义。 附图说明 结合随后的附图,从下面的详细说明中可显而易见的得出本专利技术的上述及其他目的、特征及优点。在附图中 图1示出了根据本专利技术的AUCM逆向生成方法的流程图; 图2示出了根据本专利技术的AUCM逆向生成方法的子流程图; 图3示出了根据本专利技术的AUCM方法生成数据与IPF算法生成数据及现实宏观统计数据对比图。 具体实施例方式 为了更全面地理解本专利技术及其优点,下面结合附图及具体实施例对本专利技术做进一步详细地说明。 为了便于理解,首先对几个定义进行简单地描述。 定义一属性全集定义,A={A1,A2,A3,....An}是由虚拟社会中所有的虚拟个体本文档来自技高网
...

【技术保护点】
一种大规模虚拟个体基础属性逆向生成方法包括步骤:A、抽取并定义虚拟个体Agent的属性集合A={A↓[1],A↓[2],...,A↓[n]};B、确定各个属性的属性值集合;C、确定属性集合中任意两个属性值集合A↓[i]={a↓[1],a↓[2],...,a↓[m]}和A↓[j]={b↓[1],b↓[2],...,b↓[n]}的统计分布F(x↓[i])以及其联合概率分布f(x↓[i]);D、进行属性自选择。

【技术特征摘要】
1.一种大规模虚拟个体基础属性逆向生成方法包括步骤A、抽取并定义虚拟个体Agent的属性集合A={A1,A2,...,An};B、确定各个属性的属性值集合;C、确定属性集合中任意两个属性值集合Ai={a1,a2,...,am}和Aj={b1,b2,...,bn}的统计分布F(xi)以及其联合概率分布f(xi);D、进行属性自选择。2.根据权利要求1的方法,其中步骤C进一步包括对属性按类型进行分组以描述诸多属性的内在依赖关系,即联合概率分布函数。3.根据权利要求2的方法,其中在步骤D中对属性全集中的第i个属性执行以下处理,i从0开始D1、对第j个虚拟个体进行效用评估,其中j初...

【专利技术属性】
技术研发人员:司光亚胡晓峰杨志谋罗批张明智李志强
申请(专利权)人:司光亚胡晓峰杨志谋罗批张明智李志强
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1