一种基于语义向量构建神经网络预测心理健康的系统和装置制造方法及图纸

技术编号:22419150 阅读:26 留言:0更新日期:2019-10-30 02:17
本发明专利技术提出了一种基于语义向量构建神经网络预测心理健康的系统和装置。本发明专利技术的技术方案,基于被测用户的客观心理语义文本建立神经网络模型进行预测评估。不同于现有技术需要用户参与的不全面非客观样本,本发明专利技术利用的心理语义文本体现的是用户自身的真实情感表达,不需要用户主动参与;并且,为了保证建模样本的准确性,引入分层抽样的方法对样本进行了预处理,并且将未被分层抽样的个人心理文本作为模型输入向量集,从而保证输出的结果客观的反应用户的心理状态;采用心理测试合成量与预定阈值的欧几里得范数差异,能够客观的体现用户心理健康的严重程度。

【技术实现步骤摘要】
一种基于语义向量构建神经网络预测心理健康的系统和装置
本专利技术属于健康监测与管理
,尤其涉及一种基于语义向量构建神经网络预测心理健康的系统和装置。
技术介绍
随着现代社会中生活压力的日益增长,心理疾病成为一个越来越普遍的现象。常见的心理疾病包括抑郁症、焦虑症、强迫症等。这些心理疾病不仅影响患者的正常生活,严重时甚至会使患者产生自杀企图,因而引起了社会对心理疾病的关注和担忧。据世界卫生组织报告,抑郁症在全世界发病率约11%,已成为危害人类健康的第四大疾病,到2020年可能成为仅次于心脏病的第二大疾病。在我国,抑郁症发病率高达7%,而且由于发现不及时与认识不足,治疗率仅为20%。因抑郁导致的自杀死亡事件频发。然而,当前大部分心理健康服务还停留在″被动″模式,主要通过传统问卷发放方式或用户向心理健康咨询中心咨询或到医院就诊发现心理异动个体。但由于人力物力所限,长期以来心理学研究者无法获取覆盖研究对象全体的数据,也不便对个体心理健康状态变化进行跟踪研究,难以对心理行为异动个体进行及时主动干预。现有分析心理状态测试设备有很多,但现有技术设备大而复杂,设备、测试对象的情绪波动容易影响分析结果,且无法直观、简单地表现受试者的心理状态。心理健康测试,一般均为问卷式测试,也即是将纸件的问卷发到被评估人员手中,被评估人员完成问卷回答后,回收问卷,再由评估人员根据每份问卷的答复情况做出评估。这种测试方式的缺陷在于,不能在被评估人员作问卷填写的时候同时监测被评估人员的血压,心率等体征信息,也就不能对被评估人员作出更准确的心理健康测试分析,另一方面被评估人员需在接近睡眠状态下测试各项指标时,现有设备存在缺陷,且不具有显示器显示。专利″一种基于互联网的心理健康评估系统″(CN201610808709.3)提出了一种基于互联网的心理健康评估系统。系统中,云端数据库用于存储已知的样本中心理测试量表的因子得分;利用RBF神经网络算法建立心理健康评估模型。RBF神经网络模型对新个体心理健康状态进行评估后,将评估结果上传至云端。该系统还是基于传统的心理测试表结果,无法对对心理健康状态进行客观评估和追踪研究。专利US2005/0236004A1公开了一种人体健康状况的监测方法,其中一个非线性的输入向量模块包含神经网络,但其同样需要新个体填写心理测量表,且不是通过文本分析的方法对心理健康状态进行评估。CN109524085A公开了一种基于交互的认知分析方法及系统,能够分析得到用户的个人认知信息,从而为用户心理健康服务提供更加有力的帮助。通过至少一种预设交互方式输出交互输出信息与用户进行交互,可以获得用户的交互输入信息,然后对交互输入信息进行内容识别与分析,获得认知分析数据,之后,根据认知分析数据,便可以构建用户的个人认知结构模型。可见,实施本专利技术实施例,可以以认知心理学为基础,通过与用户进行交互,分析与用户往来的交互信息(包括输出用于与用户进行交互的输出交互信息、用户针对输出交互信息而输入的交互输入信息),获得用户的个人认知信息,从而建立用户的个人认知结构模型,基于该个人认知结构模型可以分析与解决用户的心理问题,为用户心理健康服务提供更加有力的帮助;并且,采取基于自然语言处理(NaturalLanguageProcessing,NLP)技术的人机对话式交互方式,使交流更加真实自然。然而,上述不管是哪种方案,都需要用户主动参与并且配合,检测结果的准确性很大程度上取决于用户的配合度和正确率,如果用户随意选择或故意选择错误答案、或者随意输入交互性信息,上述方案无法进行处理,也无法保证结果的准确和客观性。
技术实现思路
为解决上述技术问题,本专利技术提出了一种基于语义向量构建神经网络预测心理健康的系统和装置。本专利技术的技术方案,基于被测用户的客观心理语义文本建立神经网络模型进行预测评估。不同于现有技术,本专利技术利用的心理语义文本体现的是用户自身的真实情感表达,不需要用户主动参与;并且,为了保证建模样本的准确性,引入分层抽样的方法对样本进行了预处理,并且将未被分层抽样的个人心理文本作为模型输入向量集,从而保证输出的结果客观的反应用户的心理状态;采用心理测试合成量与预定阈值的欧几里得范数差异,能够客观的体现用户心理健康的严重程度。尤其重要的是,本专利技术不需要通过用户手动做题或和用户面对面接触,而是通过分析用户的心情文本或说说对用户的心理状态进行评测,这种方式不会对用户造成压力,并能获取到用户最新的真实心理状态,最后可以通过文本分析得到评估结果和相应的对策建议,这样可以使用户可以直观的了解到自己当前的心理状态,并根据建议进行自我调整或即使进行就医以便达到心理健康的状态。本专利技术的技术方案具体实现如下:一种基于语义向量构建神经网络预测心理健康的系统,所述系统包括语义文本采集模块、语义文本抽样模块、语义文本向量化模块、神经网络训练模块、神经网络评估模块以及心理测试量合成模块;所述语义文本采集模块,用于采集被测用户的历史心理测试文本数据以及个人心理描述文本数据。其中采集被测用户的历史心理测试文本数据,主要包括采集专业心理测量表及其相关评估结果、建议等:专业心理测量数据的采集可以从心理治疗机构或医疗机构等专业机构进行收集,数据主要包括测试数据时间、心理测量表及其得分、评估结果、对策建议等;作为本专利技术的第一个重要创新点,所述语义文本采集模块还要采集个人心理描述文本数据。不同于现有技术提到的需要用户主动参与提供的″问卷调查″数据,本专利技术的技术方案首次利用个人心理文本进行心理健康监测。这里的个人心理文本的采集方式完全是被动的,不需要用户主动提供,因此,其不受用户是否客观回答问题、是否刻意掩盖自身状态等因素影响,结果客观。具体而言,采集个人心理描述文本数据,主要包括采集个人信息及其历史心理文本:个人信息可以通过个人注册信息来进行获取,历史心理文本可以根据个体的个人的朋友圈、微博等进行获取;对于寻求心理健康的用户来说,通过采集其过碎片化的文本(如微博、说说、朋友圈等等社交方式),可以得到大量的个人心理文本;进一步的,所述语义文本抽样模块,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样语义文本数据集;作为本专利技术的第二个重要创新点,引入语义文本抽样模块对样本数据集(历史心理测试文本数据以及个人心理描述文本数据)进行分层抽样,带来的有益效果是,一方面使得后续的语义文本向量化模块要处理的数据量大大降低,另一方面同时保证样本数据集在后续用于建模时具备代表性,保证建模的准确性;具体而言,所述分层抽样包括:对所述历史心理测试文本数据进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Tn,n=1,2,...,N,N为类别数;对个人心理描述文本进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Sm,m=1,2,...,M,M为类别数;按照如下公式确定抽样比例:对于第n类历史心理测试文本数据,抽样比例为:对于第m类个人心理描述文本,抽样比例为:接下来,所述语义文本向量化模块,用于对所述分层抽样数据集中的语义文本进行向量化处理,获得第一向量序列;抽样获得的第n类历史心理文本数据的本文档来自技高网
...

【技术保护点】
1.一种基于语义向量构建神经网络预测心理健康的系统,所述系统包括语义文本采集模块、语义文本抽样模块、语义文本向量化模块、神经网络训练模块、神经网络评估模块以及心理测试量合成模块;其特征在于:所述语义文本采集模块,用于采集被测用户的历史心理测试文本数据以及个人心理描述文本数据;所述语义文本抽样模块,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样语义文本数据集;所述语义文本向量化模块,用于对所述分层抽样数据集中的语义文本进行向量化处理,获得第一向量序列;所述神经网络训练模块,用于利用所述第一向量序列进行神经网络的训练;将不包含在所述分层抽样数据集中的个人心理描述文本,通过所述语义文本向量化模块进行向量化处理,获得第二向量序列;将所述第二向量序列输入所述训练好的神经网络,通过神经网络评估模块输出评估向量序列;心理测试量合成模块对所述输出评估向量序列进行合成处理,得到心理测试合成量;判断所述心理测试合成量与预定阈值的差异度,根据所述差异度评估被测用户的心理健康。

【技术特征摘要】
1.一种基于语义向量构建神经网络预测心理健康的系统,所述系统包括语义文本采集模块、语义文本抽样模块、语义文本向量化模块、神经网络训练模块、神经网络评估模块以及心理测试量合成模块;其特征在于:所述语义文本采集模块,用于采集被测用户的历史心理测试文本数据以及个人心理描述文本数据;所述语义文本抽样模块,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本数据进行分层抽样,获得分层抽样语义文本数据集;所述语义文本向量化模块,用于对所述分层抽样数据集中的语义文本进行向量化处理,获得第一向量序列;所述神经网络训练模块,用于利用所述第一向量序列进行神经网络的训练;将不包含在所述分层抽样数据集中的个人心理描述文本,通过所述语义文本向量化模块进行向量化处理,获得第二向量序列;将所述第二向量序列输入所述训练好的神经网络,通过神经网络评估模块输出评估向量序列;心理测试量合成模块对所述输出评估向量序列进行合成处理,得到心理测试合成量;判断所述心理测试合成量与预定阈值的差异度,根据所述差异度评估被测用户的心理健康。2.如权利要求1所述的基于语义向量构建神经网络预测心理健康的系统,其中,所述语义文本抽样模块,用于对所述语义文本采集模块采集的历史心理测试文本数据以及个人心理描述文本进行分层抽样,获得分层抽样数据集,具体包括:对所述历史心理测试文本数据进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Tn,n=1,2,...,N,N为类别数;对个人心理描述文本进行分类及标注,并根据标注结果,统计每个类别的文本数量,并计算每个类别所占的比例Sm,m=1,2,...,M,M为类别数;按照如下公式确定抽样比例:对于第n类历史心理测试文本数据,抽样比例为:对于第m类个人心理描述文本,抽样比例为:3.如权利要求2所述的基于语义向量构建神经网络预测心理健康的系统,其中,抽样获得的第n类历史心理文本数据的向量化序列为VTn,抽样获得的第m类个人心理描述文本的向量化序列为VSm;所述神经网络训练模块,用于利用所述第一向量序列进行神经网络的训练,具体包括:利用向量化序列VTn作为输入层,利用向量化序列VSm作为输出层,进行神经网络的训练。4.如权利要求1所述的基于语义向量构建神经网络预测心理健康的系统,其中,将不包含在所述分层抽样数据集中的个人心理描述文本,通过所述语义文本向量化模块进行向量化处理,获得第二向量序列,包括:第m类不包含在所述分层抽样数据集中的个人心理描述文本向量化处理后的向量为所有的构成所述第二向量序列;将所述第二向量序列输入所述训练好的神经网络,通过神经网络评估模块输出评估向量序列,具体包括:如果M>N,则将所述第二向量序列进行降维处理,得到N维向量序列后,输入所述训练好的神经网络;否则,则将所述第二向量...

【专利技术属性】
技术研发人员:王冲冲任永亮杨菲张佳李嘉懿贺同路
申请(专利权)人:北京智能工场科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1