当前位置: 首页 > 专利查询>西南大学专利>正文

基于语义分析的心理测评系统及方法、信息数据处理终端技术方案

技术编号:20273813 阅读:23 留言:0更新日期:2019-02-02 04:07
本发明专利技术属于计算机软件技术领域,公开了基于语义分析的心理测评系统及方法、信息数据处理终端,包括信息及参数设置模块、题库和题目呈现模块、数据采集模块、数据处理模块、语料库和常模模块、语义网络计算模块和可视化反馈模块等。本发明专利技术将语义网络理论、文本挖掘等方法应用于创造力测评,并开发适用于在线测评和计算机计分的测评软件,一定程度上优于传统的纸笔测验。得到实验证据支持、个体评价基于大样本常模数据、测评简洁且友好,可广泛运用于创造力的科学研究、学校的创新教育、企业研发人员的选拔与评估等,为服务于“创新型国家”的建设提供支持。

【技术实现步骤摘要】
基于语义分析的心理测评系统及方法、信息数据处理终端
本专利技术属于计算机软件
,尤其涉及基于语义分析的心理测评系统及方法、信息数据处理终端。
技术介绍
目前,业内常用的现有技术是这样的:创新是国家科技进步,经济发展的源泉,是个体适应生活,解决问题的基础。我国正在全面推进创新型国家建设,其中创新人才教育和培养至关重要。而如何准确评估和预测个体的创新能力在教育和培育环节显得尤为重要。目前个体创造性潜能测评的方法大体可分为三种:纸笔测验、作品评价和主观报告。纸笔测验是最为流行的测验方式,主要的测量工具包括发散思维测试、托兰斯创造性思维测验以及聚合思维测验等。但这类测验多基于智力的三维理论,其外部效度备受争议。此外,传统创造力评估还存在如下不足:一是,这类测验较为突出个体的加工流畅性和灵活性能力,因此掩蔽了个体创造力的核心特质:远距离语义连接力。二是,传统纸笔测验对受试者的时程控制不足,操作程序复杂,且评分耗时耗力,因此测试反馈慢使得难以应用于实践中;三是,无论发散思维测验还是作品评价,都受到评分者或专家的经验以及他们自身创造力水平的影响,因此评分主观性较强;四是,传统的问卷测量等主观报告方式,无法避免社会赞许效应和个体自身的主观性。此外,创造力的核心是创造性思维认知能力,问卷测量无法卷入认知过程。综上所述,传统创造力评估技术的主要问题包括评估程序复杂、评估主观性强、施测成本高,导致难以在学校教育、企业人才选拔等应用推广。基于此,本专利技术结合语义层级理论和原型启发中的语义相似性理论,以及基于语义距离评估创造性的方法,提出通过自然语言处理技术来计算语义距离和语义相似性并构建语义网络,从而客观地量化个体创造性潜能。由于传统语义距离计算依赖于文本库,而现有文本库是否可以作为个体创造力评估的基础还有待考量,因此本专利技术基于前期建立的发散思维、聚合思维、科学专利技术、故事创作测试的文本库,以此保证评估指标的有效性。此外,借助计算机辅助技术,结合文本挖掘技术和计算机交互技术,开发创造力在线评分和反馈系统。克服了传统的测评方法的繁杂操作,多用户可以通过计算机、手机等媒介随时随地在线评估个体创新能力,因此可适用于大规模创新教育情景中的测试,也可以用于公司企业的人力资源测评。此外,该系统自带的算法程序可以快捷地提供用户反馈,克服传统测评耗时耗力的评估环节。最为重要的是基于语义距离和语义网络的评估方案,可以更为客观的反应个体的创新潜能。
技术实现思路
针对现有技术存在的问题,本专利技术提供了基于语义分析的心理测评系统及方法、信息数据处理终端。本专利技术是这样实现的,一种基于语义分析的心理测评系统,所述基于语义分析的心理测评系统包括:基本信息及参数设置模块,用于实现采集使用者基本信息,根据录入的年龄和学历信息生成与之相匹配的题库,根据测评目的产生相应的题目;题库和题目呈现模块,用于具有存放各类型题目及其相应指导语的功能,受到参数设置模块的调控;数据采集模块,用于具有收集使用者反应信息的功能;数据预处理模块,用于接收数据采集和文本转录模块的输入文本,并对文本进行分词,对文本的名词、形容词、动词进行分析;语料库和常模模块,用于根据发散思维、科学专利技术材料库编制,并收集500名被试的答案进行汇总并进行文本分析后建立的创造性语料库;语义网络计算模块,用于对新输入文本进行语义距离计算和语义网络进行度量;可视化反馈模块,用于为使用者提供结果反馈和建议的功能。进一步,所述数据采集模块包括:文字作答单元,用于为电脑键盘输入解决方案或手机录入解决方案,对于无法键入文字的使用者可以他人替代输入;语音作答单元,用于为采集使用者的口头回答,并收集为语音信息,并使用开源的语音识别软件将语音信息转录为文字信息并储存。进一步,所述数据预处理模块包括:分词模块,利用Python语言,根据自然语言处理方法,采用结巴中文分词库并利用双向最大匹配法和特征扫描法,识别和切分待分析字符串中带有明显特征的词,以词作为断点,将原字符串分为较小的串再进行机械分词。所述语料库和常模模块进一步包括:答案相对赋值单元,用于在语料库中答案赋值;语义赋值单元,用于根据以建立的文本语料库计算任意2个词语的语义距离。所述语义网络计算模块进一步包括:语义网络单元,由词语为节点,词语间语义距离为边构成矩阵,计算词语的度,即某个词语在语义网络中的重要程度;网络的集群系数单元,用于描述语义网络集团化程度;语义距离算法单元,用于根据LSA和Word2vec以及TF-IDF算法词进行向量的构建,并结合余弦相似度,构建语义向量空间,求得文本的词语相似。本专利技术的另一目的在于提供一种应用所述基于语义分析的心理测评系统的基于语义分析的心理测评方法,所述基于语义分析的心理测评方法包括:设置基本参数:系统初始化时需要进行基本参数设置,管理员登录系统后台管理界面后,根据指导语,完成如分词词典的设置、题目标签设置、题库匹配规则设置、算法相关阈值参数设置等。后期可以根据具体情况对参数进行修改。采集使用者基本信息:信息的录入方式分为管理员后台批量导入和使用者前端自行注册填写两种方式:批量导入,针对已获取的基本信息的录入,导入后自动生成使用者的账户信息,分配给使用者进行系统登录;自行填写为使用者在系统注册后自行填写个人基本信息。录入的信息存入后台数据库中进行数据持久化。生成题库包括:(1)题目的录入,创造力测评的题目是以创造力相关理论为依据编制。题目信息由通过后台管理员进行录入,分为批量导入和页面填写录入两种方式;批量导入是在数据量较多的情况下,通过Excel表、Word、TXT等格式的文档上传到系统数据库中;页面填写,则是在数据量较小的情况下由管理员直接在页面填写题目内容信息。录入时根据测试目的和测试题型等因素,对题目进行标签设置和分类并保存在数据库中。后台系统提供对已有题目的增删改查和附件上传等功能。(2)题库生成,根据录入的年龄和学历信息,按照匹配规则找到相匹配的题目标签,生成题库基本信息(题库标签、题型模板等),存入数据库中。根据测评目的,在题目数据表中查找对应类型标签的题目,并与题库标签按照一定规则进行关联,生成题库具体内容;测评数据采集:使用者进入系统后,根据使用者的基本信息和测试目的。直接在题库表中自动为使用者选择对应的题库,在页面上呈现。使用者根据指导语录入测试内容(包括文本、语音等形式),完成后将信息提交由后台程序保存到数据库中;数据预处理:1、文本转录。对于非文本数据,利用文本转录工具转化为文本数据,并在原始文本数据表中保存。2、文本分词。利用结巴分词工具对原始文本数据进行粗分词,过滤掉标点符号等非中文符号,保存成txt格式文件。文件目录信息保存在数据库中。3、词性标注。对第一次分词获取的数据,进行再次清洗,过滤掉停用词,对剩余词汇进行词性标注。并将该信息按一定格式保存在txt文件中。文件目录信息保存在数据库中。4、关键词提取。采用TF-IDF词频-逆向文件频率构建法计算权重。根据设置的关键词阈值,提取出所有关键词,将关键词信息(权重、词性等)保存在数据库中。语料库构建:该语料库分为两部分。一是根据发散思维、科学专利技术材料库编制,基于前期收集500名被试的答案进行汇总并进行文本分析后建立的创造性语料库,为初期系统本文档来自技高网
...

【技术保护点】
1.一种基于语义分析的心理测评系统,其特征在于,所述基于语义分析的心理测评系统包括:基本信息及参数设置模块,用于实现采集使用者基本信息,根据录入的年龄、学历和职业信息生成与之相匹配的题库,根据测评目的产生相应的题目;题库和题目呈现模块,用于具有存放各类型题目及其相应指导语的功能,受到参数设置模块的调控;数据采集模块,用于具有收集使用者反应信息的功能;数据预处理模块,用于接收数据采集和文本转录模块的输入文本,并对文本进行分词,对文本的名词、形容词、动词进行分析的功能;语料库和常模模块,用于根据发散思维、科学专利技术材料库编制,并收集500名被试的答案进行汇总并进行文本分析后建立的创造性语料库;语义网络计算模块,用于对新输入文本进行语义距离计算和语义网络进行度量;可视化反馈模块,用于为使用者提供结果反馈和建议的功能。

【技术特征摘要】
1.一种基于语义分析的心理测评系统,其特征在于,所述基于语义分析的心理测评系统包括:基本信息及参数设置模块,用于实现采集使用者基本信息,根据录入的年龄、学历和职业信息生成与之相匹配的题库,根据测评目的产生相应的题目;题库和题目呈现模块,用于具有存放各类型题目及其相应指导语的功能,受到参数设置模块的调控;数据采集模块,用于具有收集使用者反应信息的功能;数据预处理模块,用于接收数据采集和文本转录模块的输入文本,并对文本进行分词,对文本的名词、形容词、动词进行分析的功能;语料库和常模模块,用于根据发散思维、科学发明材料库编制,并收集500名被试的答案进行汇总并进行文本分析后建立的创造性语料库;语义网络计算模块,用于对新输入文本进行语义距离计算和语义网络进行度量;可视化反馈模块,用于为使用者提供结果反馈和建议的功能。2.如权利要求1所述的基于语义分析的心理测评系统,其特征在于,所述数据采集模块包括:文字作答单元,用于为电脑键盘输入解决方案或手机录入解决方案,对于无法键入文字的使用者可以他人替代输入;语音作答单元,用于为采集使用者的口头回答,并收集为语音信息,并使用开源的语音识别软件将语音信息转录为文字信息并储存。3.如权利要求1所述的基于语义分析的心理测评系统,其特征在于,所述数据预处理模块包括:分词模块,利用Python语言,根据自然语言处理方法,采用结巴中文分词库并利用双向最大匹配法和特征扫描法,识别和切分待分析字符串中带有明显特征的词,以词作为断点,将原字符串分为较小的串再进行机械分词。4.如权利要求1所述的基于语义分析的心理测评系统,其特征在于,所述语料库和常模模块进一步包括:答案相对赋值单元,用于在语料库中答案赋值;语义赋值单元,用于根据以建立的文本语料库计算任意2个词语的语义距离。5.如权利要求1所述的基于语义分析的心理测评系统,其特征在于,所述语义网络计算模块进一步包括:语义网络单元,由词语为节点,词语间语义距离为边构成矩阵,计算词语的度,即某个词语在语义网络中的重要程度;网络的集群系数单元,用于描述语义网络集团化程度;语义距离算法单元,用于根据LSA和Word2vec以及TF-IDF算法词进行向量的构建,并结合余弦相似度,构建语义向量空间,求得文本的词语相似。6.一种应用权利要求1所述基于语义分析的心理测评系统的基于语义分析的心理测评方法,其特征在于,所述基于语义分析的心理测评方法包括:采集使用者基本信息,根据录入的年龄和学历信息生成与之相匹配的题库,根据测评目的产生相应的题目;存放各类型题目及其相应指导语的功能,受到参数设置模块的调控;收集使用者反应信息的功能;接收数据采集和文本转录模块的输入文本,并对文本进行分词,对文本的名词、形容词、动词进行分析;根据发散思维、科...

【专利技术属性】
技术研发人员:陈群林邱江唐浩陈锦斌张庆林
申请(专利权)人:西南大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1