基于图像的性格测试调查问卷生成方法及调查交互的方法技术

技术编号:13585225 阅读:114 留言:0更新日期:2016-08-24 15:25
本发明专利技术公开了一种基于图像的性格测试调查问卷生成方法和调查交互的方法。其中,性格测试调查问卷生成方法包括获取用户喜欢的图像集及所述用户的性格属性真值集合,并构建图像与用户的第一关系;进行概念提取,构建图像与概念的关系;提取图像集中各图像的图像特征,构建图像与用户的第二关系;根据图像与概念的关系和图像与用户的第二关系,确定给定用户集合下用户集共有概念集合;然后筛选出具体性格区分度的概念集合;从各概念下的图像集合里筛选具有性格代表性的图像,作为可视化问题的图像选项;通过筛选出的概念和概念下的图像选项,生成调查问卷。通过本发明专利技术实施例能够在较短时间内得到较为准确的用户性格,具有更好的跨语言性能。

【技术实现步骤摘要】

本专利技术实施例涉及图像处理、数据挖掘和心理学
,具体涉及一种基于图像的性格测试调查问卷生成方法及调查交互的方法
技术介绍
性格是一个心理学特征,致力于将人类复杂多样的行为,用少量的、稳定的、可以度量的独特特征去解释。跟人口统计学中的属性相比,性格特征从人的内在心理学角度去解释和预测人类行为的不同。目前使用最广泛的性格模型是:大五模型(Big Five,BF),也叫五因素模型(Five-Factor Model,FFM)。大五模型(Big Five,BF)将人的性格,分成五个方面:开放(openness)、自觉(Conscientiousness)、外向(Extraversion)、亲和(Agreeableness)和神经质(Neuroticism)。基于大五模型(Big Five,BF)的性格研究,目前已经有很多的应用,如:职业辅助、定向广告、个性化推荐系统、疾病识别和预防,甚至人机交互。传统性格测试,如:大五性格测试调查问卷(Big-Five Inventory,BFI),等标准性格调查问卷,是通过测定个体在性格的五个维度的分数来调查个体性格。这一类调查问卷,问卷的一系列问题由心理学专家设定;问卷的测试方式是:受试者阅读并理解文本形式的题目的含义,然后思考自身表现出的性格属性,并根据自身属性和文本题目的含义之间的相似程度打分,从非常不同意到非常同意。尽管大五性格测试调查问卷(Big-Five Inventory,BFI)已经被广泛使用,但是现有的基于文本的性格测试调查问卷,却有着如下局限:(1)每回答一个问题,受试者都要先阅读和理解该问题的含义,当问题较多的时候,会对受试者造成很大的负担,特别是标准的大五性格调查问卷一般是240道题的NEO-PI-R-240
(Neuroticism-Extraversion-Openness Personality Inventory Revised)。做这样的调查问卷的时候,受试者需要思考自身表现出的性格属性,然后评估自己的属性和问题的含义之间的相似程度,然而,受试者并不是对性格有研究的学者或专家,更一般地,受试者并不太清楚自身的性格属性,这为调查性格属性造成了很大的误差。(2)基于文本的调查问卷,传达出了明显的调查意图,出于提升自我的心态,受试者倾向于使他们的回答更加符合主流价值观,更讨人喜欢。比如在BFI-10调查问卷中有一个问题:“我比较懒”,大部分受试者会选择“不同意”。这非常容易引起调查的误差,影响调查的准确性。(3)基于文本的调查问卷是语言敏感的,心理学专家在针对自己国家进行调查问卷的引入的时候,不能直接的翻译题干的意思,还需要考虑具体题干的性格含义,如:在英语版的BFI中,“calm”是用来度量神经质(Neuroticism)这一维度性格的,如果直接把“calm”翻译成德语,对应的单词是“ruhlg”,然而“ruhlg”在德语中不仅和神经质(Neuroticism)这一维度有关系,还跟外向(Extraversion)这一维度有关。有鉴于此,特提出本专利技术。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种至少部分地解决上述问题的一种基于图像的性格测试调查问卷生成方法。此外,还提供一种调查交互的方法。为了实现上述目的,根据本专利技术的一个方面,提供了以下技术方案:一种基于图像的性格测试调查问卷生成方法,所述方法至少包括:获取用户喜欢的图像集及所述用户的性格属性真值集合,并构建所述图像与所述用户的第一关系;对所述用户喜欢的所述图像集中的图像进行基于深度学习的概念提取,构建所述图像与所述概念的关系;提取所述图像集中各图像的图像特征,并根据所述图像特征确定图像特征向量和用户特征集合,以及利用所述图像特征向量扩充所述图像与用户的第一关系,构建图像与用户的第二关系;根据所述图像与概念的关系和所述图像与用户的第二关系,确定给定用户集合下用户集共有概念集合;将所述用户特征集合和所述用户集共有概念集合作为训练集,并以所述用户的性格属性真值集合作为目标,训练回归器,并采用基于视角的梯度提升决策树算法,筛选出具体性格区分度的概念集合;使用聚类算法,利用所述筛选出的具体性格区分度的概念集合,从各概念下的图像集合里筛选具有性格代表性的图像,作为可视化问题的图像选项;通过所述筛选出的概念和所述概念下的所述图像选项,生成所述基于图像的性格测试调查问卷。优选地,所述对所述用户喜欢的所述图像集中的图像进行基于深度学习的概念提取,具体包括:采用深度神经网络对所述用户喜欢的所述图像集中的图像进行概念提取。优选地,所述采用基于视角的梯度提升决策树算法,筛选出具体性格区分度的概念集合,具体包括:根据以下公式初始化强回归器:F0=1NΣi=1Npi]]>其中,所述F0表示初始强回归器;所述pi表示用户经基于文本的性格测试得到的性格属性真值;所述N表示训练样本个数;根据以下公式计算残差ri:ri=pi-Fm-1(xi)其中,所述m表示迭代次数;所述所述K表示性格概念角度个数;所述d表示所述图像的特征维度;根据以下公式对残差回归得到弱回归器:(Vm,Rm,Am)=argminV,R,AΣi=1N||ri-T(xi;V,R,A)||22;]]>将弱回归器添加到强回归器中,得到新的强回归器:Fm(x)=Fm-1(x)+vT(x;Vm,Rm,Am)其中,所述v表示权重;确定最终的回归器为:F(x;θ)=F0+vΣm=1MT(x;Vm,Rm,Am)]]>其中,所述所述T表示基回归器;所述I(·)表示指示函数;所述J表示叶子结点数
量;所述Vm表示选中的概念角度的特征;所述Rm表示学习到的分类模式;所述Am表示输出的叶子结点值;所述M表示使用的基回归器的个数;所述θ表示训练集;通过确定的所述最终的回归器,来筛选出所述具体性格区分度的概念集合。为了实现上述目的,根据本专利技术的另一个方面,还提供了一种利用上述技术方案所述方法生成的调查问卷进行调查交互的方法。所述调查交互的方法包括:设定所述调查问卷的调查形式为:给定一组问题,设定含有相应概念的图像作为问题的选项;设定所述调查问卷的交互形式为:所述用户根据自身对所述图像的理解,选择符合调查题干的图像;根据用户答案,利用所述回归器,计算所述用户的大五性格特征。与现有技术相比,上述技术方案至少具有以下有益效果:本专利技术实施例通过采用上述任一技术方案,使用图像作为调查问卷的选项,提供能准确有效且用户友好的性格测试调查问卷,可以有效地减轻填写问卷时用户的负担,提升用户友好度,能够在较短时间内得到较为准确的用户性格,具有更好的跨语言性能,降低了性格测试的误差。解决了文本性格测试方法的偏差问题,以及语言敏感问题。相比现有的基于文本的性格测试调查问卷的生成方法:心理学专家设定文本描述的题目和选项,一方面通过图像能够让受试者迅速无负担的理解,无需进行针对语言的翻译,让受试者在短时间内完成调查问
卷;另一方面,通过数据驱动的调查问卷问题设置,能够使性格调查具有可解释性。当然,实施本专利技术的任一产品不一定需要同时实现以上所述的所有优点。本专利技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从本文档来自技高网
...

【技术保护点】
一种基于图像的性格测试调查问卷生成方法,其特征在于,所述方法至少包括:获取用户喜欢的图像集及所述用户的性格属性真值集合,并构建所述图像与所述用户的第一关系;对所述用户喜欢的所述图像集中的图像进行基于深度学习的概念提取,构建所述图像与所述概念的关系;提取所述图像集中各图像的图像特征,并根据所述图像特征确定图像特征向量和用户特征集合,以及利用所述图像特征向量扩充所述图像与用户的第一关系,构建图像与用户的第二关系;根据所述图像与概念的关系和所述图像与用户的第二关系,确定给定用户集合下用户集共有概念集合;将所述用户特征集合和所述用户集共有概念集合作为训练集,并以所述用户的性格属性真值集合作为目标,训练回归器,并采用基于视角的梯度提升决策树算法,筛选出具体性格区分度的概念集合;使用聚类算法,利用所述筛选出的具体性格区分度的概念集合,从各概念下的图像集合里筛选具有性格代表性的图像,作为可视化问题的图像选项;通过所述筛选出的概念和所述概念下的所述图像选项,生成所述基于图像的性格测试调查问卷。

【技术特征摘要】
1.一种基于图像的性格测试调查问卷生成方法,其特征在于,所述方法至少包括:获取用户喜欢的图像集及所述用户的性格属性真值集合,并构建所述图像与所述用户的第一关系;对所述用户喜欢的所述图像集中的图像进行基于深度学习的概念提取,构建所述图像与所述概念的关系;提取所述图像集中各图像的图像特征,并根据所述图像特征确定图像特征向量和用户特征集合,以及利用所述图像特征向量扩充所述图像与用户的第一关系,构建图像与用户的第二关系;根据所述图像与概念的关系和所述图像与用户的第二关系,确定给定用户集合下用户集共有概念集合;将所述用户特征集合和所述用户集共有概念集合作为训练集,并以所述用户的性格属性真值集合作为目标,训练回归器,并采用基于视角的梯度提升决策树算法,筛选出具体性格区分度的概念集合;使用聚类算法,利用所述筛选出的具体性格区分度的概念集合,从各概念下的图像集合里筛选具有性格代表性的图像,作为可视化问题的图像选项;通过所述筛选出的概念和所述概念下的所述图像选项,生成所述基于图像的性格测试调查问卷。2.根据权利要求1所述的方法,其特征在于,所述对所述用户喜欢的所述图像集中的图像进行基于深度学习的概念提取,具体包括:采用深度神经网络对所述用户喜欢的所述图像集中的图像进行
\t概念提取。3.根据权利要求1所述的方法,其特征在于,所述采用基于视角的梯度提升决策树算法,筛选出具体性格区分度的概念集合,具体包括:根据以下公式初始化强回归器:F0=1NΣi=1Npi...

【专利技术属性】
技术研发人员:桑基韬徐常胜张怀文
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1