一种基于文本分析的心理弹性预测方法及系统技术方案

技术编号:31486709 阅读:19 留言:0更新日期:2021-12-18 12:22
本申请提供了一种基于文本分析的心理弹性预测方法及系统,在本申请提供的方法中,先获取目标对象针对多个提问问题进行答复的语音信息,并利用自动语音识别技术将语音信息转换为对应的待分析文本信息;再构建并训练得到用于对任一对象进行心理弹性预测的心理弹性预测模型,识别并输出所述目标对象的心理弹性预测分值;最后基于目标对象的心理弹性预测分值获取目标对象的心理弹性水平。基于本申请提供的基于文本分析的心理弹性预测方法及系统,采用了BigBird预训练模型的结构,支持文本序列长度扩展至4096个字,因此系统更适合用户较长回复的应用场景。该发明专利技术可以避免社会赞许性、个体掩饰及主观评判因素的影响缺陷,成本低、效率高且节省时间。效率高且节省时间。效率高且节省时间。

【技术实现步骤摘要】
一种基于文本分析的心理弹性预测方法及系统


[0001]本申请涉及大数据
,特别是涉及一种基于文本分析的心理弹性预测方法及系统。

技术介绍

[0002]在现代生活中,诸多工作往往要求个体有较高的抗压能力。特殊职业群体所经历的事件则涉及国计民生和国家安全,如宇航员的在轨飞行、狙击手的斩首行动、战斗机飞行员的空战、重要谈判中的博弈等。因此在人员面试或者选择过程中,较高心理弹性的个体会更适合此类型的工作。
[0003]问卷是目前测量个体心理弹性水平的主要方式之一,在学术研究或实际应用中都有较为广泛的使用,在个体心理弹性水平的测量上表现了很好的有效性和稳定性。然而问卷测量也有一些不可忽视的缺陷,例如由于问卷依赖自我报告,在某些场景下,个体可能会因为社会赞许性或希望获得更多机会等原因掩饰真实想法,而选择更贴近提供问卷者需求的答案。此外,除了问卷方法,实际应用中,个体的抗压能力通常由面试官的主观判断来进行,缺乏一定的客观性。

技术实现思路

[0004]本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
[0005]根据本申请的第一方面,提供了一种基于文本分析的心理弹性预测方法,包括:
[0006]获取目标对象针对多个提问问题进行答复的语音信息,并利用自动语音识别技术将所述语音信息转换为对应的待分析文本信息;
[0007]构建并训练得到用于对任一对象进行心理弹性预测的心理弹性预测模型;
[0008]将所述待分析文本信息输入所述心理弹性预测模型,利用所述心理弹性预测模型识别并输出所述目标对象的心理弹性预测分值;
[0009]基于所述目标对象的心理弹性预测分值获取所述目标对象的心理弹性水平。
[0010]可选地,所述获取目标对象针对多个提问问题进行答复的语音信息,包括:
[0011]获取预先设置的与指定应激场景相关的多个提问问题,获取目标对象针对所述提问问题进行答复的语音信息;
[0012]其中,所述指定应激场景包括面试场景;
[0013]所述提问问题至少包括提问所述目标对象相关的问题和/或与所述指定应激场景所关联领域相关的问题。
[0014]可选地,所述构建并训练得到用于对任一对象进行心理弹性预测的心理弹性预测模型,包括:
[0015]基于至少一交互应用程序采集与指定应激场景相关的多条文本信息,作为预训练语料;
[0016]搭建Big Bird模型,利用所述预训练语料对所述Big Bird模型进行遮词预训练,
得到与所述指定应激场景所关联领域的Big Bird预训练模型;所述Big Bird模型处理文字的最大长度为4096;
[0017]收集多个参考对象的回答所述提问问题时的参考语音信息,并利用自动语音识别技术将所述参考语音信息转换为对应的参考文本信息;
[0018]利用心理弹性量表获得各所述参考对象的心理弹性分值;
[0019]以各所述参考对象作为训练样本,结合各所述参考对象对应的参考文本信息和心理弹性分值组建对应各所述参考对象的训练集;
[0020]基于所述训练集,以均方误差作为损失函数对所述Big Bird预训练模型进行回归微调训练,得到用于对任一对象进行心理弹性预测的心理弹性预测模型。
[0021]所述利用所述预训练语料对所述Big Bird模型进行遮词预训练,得到与所述指定应激场景所关联领域的Big Bird预训练模型包括:
[0022]按照Big Bird模型结构,随机初始化模型权重;
[0023]统计所述预训练语料中包含的所有字,以生成预设字典;
[0024]设定超参数以及损失函数,所述超参数包括轮数、每捆样本个数、学习率作为超参数,所述损失函数包括交叉熵误差;依据所述每捆样本个数对应的多条语料为单位变成一组训练样本;其中,每组训练样本中每条语料随机选出部分字替换成遮挡符号;
[0025]将每组所述训练样本分别输入所述Big Bird模型进行遮词预训练,每组所述训练样本全部训练完成为一轮,经过与所述轮数匹配的模型训练后,得到与所述指定应激场景所关联领域的Big Bird预训练模型。
[0026]可选地,对于任意一组所述训练样本,将所述训练样本输入所述Big Bird模型进行遮词预训练时,每个所述遮挡符号对应的位置均映射至所述预设字典中的每个字;
[0027]预测所述遮挡符号对应位置的字被替换前是所述预设字典中每个字的概率;
[0028]根据该组所有遮挡符号位置预测正确的概率,计算交叉熵损失函数值;再通过该损失函数值反向传播调整模型权重参数,以实现模型训练。
[0029]可选地,所述得到与所述指定应激场景所关联领域的Big Bird预训练模型之后还包括:对所述Big Bird预训练模型进行微调。
[0030]可选地,所述对所述Big Bird预训练模型进行微调包括:
[0031]以所述Big Bird预训练模型为基础,设置微调超参数,以均方误差作为损失函数,对所述Big Bird预训练模型进行回归微调训练。
[0032]根据本申请的第二方面,提供了一种基于文本分析的心理弹性预测方法系统,包括:
[0033]文本信息获取模块,其配置成获取目标对象针对多个提问问题进行答复的语音信息,并利用自动语音识别技术将所述语音信息转换为对应的待分析文本信息;
[0034]预测模型构建模块,其配置成构建并训练得到用于对任一对象进行心理弹性预测的心理弹性预测模型;
[0035]预测分值识别模块,其配置成将所述待分析文本信息输入所述心理弹性预测模型,利用所述心理弹性预测模型识别并输出所述目标对象的心理弹性预测分值;
[0036]心理弹性水平获取模块,其配置成基于所述目标对象的心理弹性预测分值获取所述目标对象的心理弹性水平。
[0037]可选地,所述文本信息获取模块,其还配置成:
[0038]获取预先设置的与指定应激场景相关的多个提问问题,获取目标对象针对所述提问问题进行答复的语音信息;
[0039]其中,所述指定应激场景包括面试场景;
[0040]所述提问问题至少包括提问所述目标对象相关的问题和/或与所述指定应激场景所关联领域相关的问题。
[0041]可选地,所述预测模型构建模块,其还配置成:
[0042]基于至少一交互应用程序采集与指定应激场景相关的多条文本信息,作为预训练语料;
[0043]搭建Big Bird模型,利用所述预训练语料对所述Big Bird模型进行遮词预训练,得到与所述指定应激场景所关联领域的Big Bird预训练模型;
[0044]收集多个参考对象的回答所述提问问题时的参考语音信息,并利用自动语音识别技术将所述参考语音信息转换为对应的参考文本信息;
[0045]利用心理弹性量表获得各所述参考对象的心理弹性分值;
[0046]以各所述参考对象作为训练样本,结合各所述参考对象本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文本分析的心理弹性预测方法,包括:获取目标对象针对多个提问问题进行答复的语音信息,并利用自动语音识别技术将所述语音信息转换为对应的待分析文本信息;构建并训练得到用于对任一对象进行心理弹性预测的心理弹性预测模型;将所述待分析文本信息输入所述心理弹性预测模型,利用所述心理弹性预测模型识别并输出所述目标对象的心理弹性预测分值;基于所述目标对象的心理弹性预测分值获取所述目标对象的心理弹性水平。2.根据权利要求1所述的方法,其特征在于,所述获取目标对象针对多个提问问题进行答复的语音信息,包括:获取预先设置的与指定应激场景相关的多个提问问题,获取目标对象针对所述提问问题进行答复的语音信息;其中,所述指定应激场景包括面试场景;所述提问问题至少包括提问所述目标对象相关的问题和/或与所述指定应激场景所关联领域相关的问题。3.根据权利要求2所述的方法,其特征在于,所述构建并训练得到用于对任一对象进行心理弹性预测的心理弹性预测模型,包括:基于至少一交互应用程序采集与指定应激场景相关的多条文本信息,作为预训练语料;搭建Big Bird模型,利用所述预训练语料对所述Big Bird模型进行遮词预训练,得到与所述指定应激场景所关联领域的Big Bird预训练模型;所述Big Bird模型处理文字的最大长度为4096;收集多个参考对象的回答所述提问问题时的参考语音信息,并利用自动语音识别技术将所述参考语音信息转换为对应的参考文本信息;利用心理弹性量表获得各所述参考对象的心理弹性分值;以各所述参考对象作为训练样本,结合各所述参考对象对应的参考文本信息和心理弹性分值组建对应各所述参考对象的训练集;基于所述训练集,对所述Big Bird预训练模型进行回归微调训练,得到用于对任一对象进行心理弹性预测的心理弹性预测模型。4.根据权利要求3所述的方法,其特征在于,所述利用所述预训练语料对所述Big Bird模型进行遮词预训练,得到与所述指定应激场景所关联领域的Big Bird预训练模型包括:按照Big Bird模型结构,随机初始化模型权重;统计所述预训练语料中包含的所有字,以生成预设字典;设定超参数以及损失函数,所述超参数包括轮数、每捆样本个数、学习率作为超参数,所述损失函数包括交叉熵误差;依据所述每捆样本个数对应的多条语料为单位变成一组训练样本;其中,每组训练样本中每条语料随机选出部分字替换成遮挡符号;将每组所述训练样本分别输...

【专利技术属性】
技术研发人员:李曼杨海波徐战胜
申请(专利权)人:天津师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1