基于选择题型调查问卷的结果可视化实现方法技术

技术编号:2822318 阅读:197 留言:1更新日期:2012-04-11 18:40
本发明专利技术公开一种基于选择题型调查问卷的结果可视化实现方法,解决常规的调查问卷结果分析技术不能区分被调查对象之间的差异,而且分析结果也不够直观,本发明专利技术的方法:对调查问卷结果进行处理,获取高维向量调查问卷结果;在保持高维向量调查问卷结果间距离基本不变的前提下,将高维向量调查问卷结果降为3维以下的低维向量调查问卷结果;根据降维后的低维向量调查问卷结果,在选定的坐标系中标示出坐标点,获得调查问卷结果显示图。本发明专利技术利用非线性的降维技术,将高维向量转化为低维向量用于坐标显示,并能直观反映被调查对象之间差异,并基于视觉对被调查人员进行分类和聚类。实现调查问卷结果可视化显示。

【技术实现步骤摘要】

本专利技术属于信息
,涉及高维数据可视化的实现方法,具体地说涉及如何将大于3维的高维数据转化为3维以下的低维数据并进行 可视化的实现方法。
技术介绍
选择题型调查问巻是目前市场调查中一种常用的调查问巻,它通过 设计选择题,直接调查单位或个人。由于它简明、通俗、客观、真实、 反馈快、保密性好,已被越来越多的企业、公司和咨询机构所采用。现 在常用的调查问巻结果分析方法是,由人对问巻中每个选项的总选择次 数逐个统计,然后用该统计次数除以调査问巻的份数,就得到在这次调 查中持该种意见的人所占被调查人群的百分比,将这些百分比数值列写 成表格形式来表示问巻调查结果。但这种结果分析方法只能从总体上显 示调查结果,难以区分被调査对象之间的差异,更无法对被调查对象进 行直观地分类和聚类。
技术实现思路
常规的调查问巻结果分析技术不能区分被调查对象之间的差异,而 且分析结果也不够直观,为了解决现有技术的缺陷和不足,本专利技术的目 的在于提供一种能够实现调査问巻结果可视化显示,并能直观反映被调 查对象之间差异的基于非线性降维技术选择题型调查问巻的结果可视化 实现方法。为达到上述目的,本专利技术提供的基于选择题型调査问巻的结果可视化实现方法技术方案如下步骤S1:对调查问巻结果进行处理,获取高维向量调査问巻结果;步骤S2:在保持高维向量调查问巻结果间距离基本不变的前提下, 将高维向量调查问巻结果降为3维以下的低维向量调查问巻结果;步骤S3:根据降维后的低维向量调查问巻结果,在选定的坐标系中 标示出坐标点,获得调查问巻结果显示图。根据本专利技术的实施例,步骤S1所述高维向量调査问巻结果获取,还 包括步骤如下步骤S11:获取调查问巻结果;步骤S12:用高维向量量化调査问巻结果;步骤S13:计算高维向量调查问巻结果之间的欧式距离;步骤S14:根据欧式距离建立高维向量调查问巻结果的高维向量连 线步骤S15:计算高维向量连线图中任意两点最短高维向量连线距离。根据本专利技术的实施例,步骤S2所述低维向量调査问巻结果获取,还包括步骤如下将最短高维向量连线距离降为低于三维向量,获得低维向量调查问 巻结果。根据本专利技术的实施例,步骤S3所述调查问巻结果显示图获取,还包括步骤如下步骤S3h设定某个低维向量调査问巻结果为中心对所有低维向量 调査问巻结果作坐标变换;步骤S32:在坐标系中标示出坐标点,用于获取调査问巻结果显示图。根据本专利技术的实施例,在步骤Sll为每份调査问巻设定一个维数等 于总选项数的高维向量,高维向量中的每个分量对应一个选项,如果该选 项被选择,则该分量的值设为l,否则设为0。根据本专利技术的实施例,在步骤S13所述的欧式距离是(公式1)Y二(乂, y2,,凡)X表示一个高维向量调査问巻结果,X中的每一个分量:c,对应调査问巻中一个选项的选择状态,如果该选项被选中,则x,值设为l,反之设为0。 Y的含义与X相同,i=l,2,3……n。根据本专利技术的实施例,在步骤S21所述最短高维向量连线距离,如 果两个高维向量间的欧式距离不大于预设值"则连接高维向量的两个 节点,形成连线图G。根据本专利技术的实施例,计算高维向量各节点间最短距离的矩阵步骤 如下在连线图G中,计算高维向量所有节点i通过连线连接到其它所有 节点j的最短距离,组成最短距离矩阵A:<formula>formula see original document page 8</formula>其中n为高维向量维数;^(U)表示节点1与节点1之间的最短连线距 离,A(l,2)表示节点l与节点2之间的最短连线距离,其它符号表示的 含义依此类推;每条连线的距离是它所连接两点的欧式距离,同一个节 点间的连线距离为0;如果无法通过连线连接两点,则将该距离设为一 个远远大于其它距离的极大值;根据本专利技术的实施例,构造降维向量步骤如下 利用上述最短距离矩阵A计算平方距离矩阵S为<formula>formula see original document page 8</formula>再选取辅助矩阵H为:<formula>formula see original document page 9</formula>计算最短距离矩阵A的特征矩阵r(Z^)为<formula>formula see original document page 9</formula>然后计算r(Z^)的特征值,选取其中最大的3个值 顺序排列为A、 A和^,并分别计算它们对应的特征向 如果要将高维向量调査结果降为3维或者2维、1维,则第 量调查问巻结果^所对应的3维或2维、1维向量分别为<formula>formula see original document page 9</formula>其中^、 ^和]^分别表示特征向量K 、 ^和^的第i个分(公式2)按从大到小的^ J2和^ ; 第i个高维向(公式3)(公式4) (公式5)根据本专利技术的实施例,在步骤S2中任取一个三维向量(Z, / , ?),对包括该向量在内的所有向量按下面公式作相应的坐标变换<formula>formula see original document page 9</formula>(公式6)其中(x,少,z)为向量的原始坐标,(;c', /, ?)为其它向量 变换后的坐标。本专利技术的优点或积极效果:由于本专利技术使用向量表示问巻的调査结果,所以能使调查问巻结果 以向量形式表达,利用非线性的降维技术,可以在保证向量间距基本不 变的条件下,将高维向量转化为低维向量用于坐标显示,使研究人员能 清晰明了地比较被调查人员之间的差异,并基于视觉对被调查人员进行 分类和聚类。附图说明图l是本专利技术所述方法的流程图; 图2是本专利技术实施例的流程图; 图3是本专利技术的连线图; 图4是本专利技术的实例演示图。具体实施例方式下面将结合附图对本专利技术加以详细说明,应指出的是,所描述的实 施例仅旨在便于对本专利技术的理解,而对其不起任何限定作用。人们期待能用一种更直接的方式来显示调査问巻结果,例如可视化 方式等。所述的可视化显示方法是先将调査问巻结果用高维向量表示, 然后用向量间距表示被调査对象之间的差异,在保证向量间距不变的前 提下将高维向量降为三维向量,最后在三维坐标系中标出各个坐标点, 坐标点之间的距离就表示被调査对象之间的差异。非线性降维技术 (IS0MAP)能在保持数据内在属性不变的前提下实现数据的降维。它基 于高维变换技术(MDS),通过滤除高维数据中的非本质维数,将本质维 数较低的高维数据投影到低维空间,从而能直接观察高维数据。但目前 对于非线性降维技术(IS0MAP)的研究,理论研究偏多,应用研究还不 很完善。对调查问巻结果实现三维可视化,可以直观地显示问巻的统计 结果,并根据图形对被调查者进行分类和聚类。为可视化显示调查问巻结果,先将调査问巻结果用高维向量表示, 然后将高维向量降为三维以下向量,最后在坐标系中标出坐标点。在具 体实施中要用到一台个人计算机和一套数学软件MATLAB编制算法程序, 具体的算法程序编制技术属于已公开技术,所以不予本文档来自技高网...

【技术保护点】
一种基于选择题型调查问卷的结果可视化实现方法,其特征在于:实现步骤如下:步骤S1:对调查问卷结果进行处理,获取高维向量调查问卷结果;步骤S2:在保持高维向量调查问卷结果间距离基本不变的前提下,将高维向量调查问卷结果降为3维以下的低维向量调查问卷结果;步骤S3:根据降维后的低维向量调查问卷结果,在选定的坐标系中标示出坐标点,获得调查问卷结果显示图。

【技术特征摘要】

【专利技术属性】
技术研发人员:吴龙庭崔霞李耀东王春恒戴汝为
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有1条评论
  • 来自[美国] 2015年01月19日 13:33
    查问,指查究追问或调查询问。语出清李渔《蜃中楼·阃闹》:“且待夫人出来,查问一番。”
    0
1