一种基于语音识别的心理状态预测系统、方法及装置制造方法及图纸

技术编号:29053824 阅读:16 留言:0更新日期:2021-06-26 06:22
一种基于语音识别的心理状态预测系统,包括本地交互预测端(1)、心理诊断和预测云端(2)、心理医生在线诊断端(3)和异常警报端(4);所述心理诊断和预测云端(2)分别和所述本地交互预测端(1)、所述心理医生在线诊断端(3)和异常警报端(4)之间进行通信连接;其中,所述本地交互预测端(1)包括语音录入模块(5)、提示语音播放模块(6)、音频文字转换模块(7)和生理参数获取模块(11);所述语音录入模块(5)和所述音频文字转换模块(7)数据通信连接;所述心理诊断和预测云端(2)包括心理症状和心理预测数据库(8)、心理状态识别模型创建模块(9)和心理状态预测模块(10)。本发明专利技术的利用大数据和深度技术的技术手段,并结合心理医生诊断案例直接得出心理预测的模型,并进行心理治疗,同时采用抽样对建立模型的样本进行修正,以便使得模型更加准确。更加准确。更加准确。

【技术实现步骤摘要】
一种基于语音识别的心理状态预测系统、方法及装置


[0001]本专利技术涉及心理状态检测
,具体为一种基于语音识别的心理状态预测系统、方法及装置。

技术介绍

[0002]经济技术的快速的发展,给人们的物质生活带来了极大的改善。但是,经济技术的发展,带来也是社会进度节奏的加快,给人们的身心生活也带了较大的压力,容易产心理健康问题,可以说,心理健康问题是当下社会的一种普遍问题,在多元化的社会经济体系下,人们的价值观、生活方式正在急剧发生变化。不同的年龄群体都或多或少会对未来生活缺乏安全预期,对环境的快速变化无法作出适应性的改变,产生焦虑、抑郁、人际敏感甚至是自杀的心理疾病倾向,因此,为了解决这种心理问题,去及时了解人员的心理状态,进行合理的预测和进行接收心理医生的心理疏导就显得极为重要。
[0003]但是,对与患者而言,心理疾病不受生理疾病痛苦控制,很难主动去进行心理问题诊疗,同时由于自己的主观排斥意识,会故意逃避问题、隐瞒事实,这也影响最终的测评结果、判定准确性。如何让患者可以打开心扉,而又不用担心自己的心理隐私被泄露,这是患者的一直担忧和鼓励的,这也是往往心理咨询存在的问题,尽管正常情况,心理治疗的医护人员并不会去泄露患者的隐私,如何打消患者的心理顾虑这是我们心理治疗十分重要的事情。
[0004]为了避免患者对直接面对心理医生带来的心理压力,也存在不少利用智能设备进行自动心理判断和心理疏导的设备。如:
[0005]专利CN111653361A公开了一种基于语音情感识别法的职工心理体检系统,包括心理体检系统和医疗系统,所述心理体检系统包括用户层、体检核心业务层、护理基础业务层和护理数据资源层,所述心理体检系统通过语音识别收集信息,进行信息的采集、存储、传输与处理,通过对使用者的信息采集进行心理体检和健康管理,所述医疗系统包括医疗用户层、医疗核心业务层、医疗基础服务层和医疗数据资源层。该专利技术体检核心业务层包括心理体检,通过心理体检进行职工的心理诊断、设有的心理健康管理可以进行患者管理,帮助患者更好的进行心理恢复,语音识别系统用于进行患者的语音识别,通过患者的语音进行判定患者的心理问题。
[0006]专利CN 112117002A公开了一种结合虚拟现实技术的新型智能化心理评估干预系统、方法,所述结合虚拟现实技术的新型智能化心理评估干预系统包括:心理数据采集模块、主控模块、心理数据处理模块、VR场景选择模块、心理测试模块、评估模型构建模块、心理状态评估模块、评估报告生成模块、心理治疗模块、云存储模块、更新显示模块。该专利技术通过心理数据处理模块将基于生理信号确定的异常心理状态和基于量表确定的异常风险因子进行关联,为用户进行心理调节提供客观数据依据,辅助用户改善心理状态;同时,通过心理状态评估模块消除了个体主观因素对数据收集的影响,有助于更加准确地进行心理健康状态评估。
[0007]专利CN111784134A公开了本专利技术提供一种数据驱动的多模态学业水平预测方法,包括将前期采集阶的学生相关信息作为训练集进行量化输入,并采用回归分析方法分析计算各类要素对最终学业水平的影响程度,得到要素相关系数;根据要素相关系数,按比例调整数据,并借助支持向量机的算法模型进行成绩预测;将预测成绩与实际成绩对比,调整支持向量机的算法模型并调整要素相关系数,直至耦合预测成绩与实际成绩之间的误差小于等于预设值为止;获取待测学生包含各类要素的学生相关信息,根据最终的要素相关系数及支持向量机的算法模型,得到待测学生的预测成绩。实施该专利技术,能解决现有支持向量机预测所存在的问题,降低后续工作机器内存和运算时间,确保预测准确性。
[0008]另外一方面,情感识别指计算机对从传感器采集来的信号进行分析和处理,得出对方当前的情感状态。情感也被定义为关乎一个人思想、感受和表现的心理状态,情感状态是心理状态的外在表现。因此准确识别一个人的情感对分析其心理状态有着重要的意义。文本情感识别是对带有情感色彩的主观性文本进行分析、处理、归纳和推理的过程,即分析说话人的态度,推断其所包含的情感类别。传统机器学习在处理情感分类问题的时候通常是基于支持向量机、信息熵等传统算法,其优势在于具有对多种特征建模的能力,但要用人工标注的单个词作为特征,而语料的不足往往就是性能的瓶颈。对句子进行情感分类的难处在于如何抽取到句子中与情感表达紧密相关的特征,以人工标注的单个词作为特征会忽略单词所处的上下文语义信息,导致最终的分类效果不理想。为了解决特征抽取的难题,现在大部分的解决方案就是采用谷歌提出的文本预训练模型Bert(bidirectional encoder representations from transformer)。Bert利用编码器和解码器超强的特征抽取能力来学习词语的双向编码表示,融合了上下文信息的词语编码能更好地进行情感决策。
[0009]为了提供更加精细的心理咨询,如能更加准确捕捉患者的心理情况和模拟心理医生提供心理状态的判断,提供准确的诊断信息,就会带来极大的福音,另外一方面,深度学习是学习样本数据的内在规律和表示层次,它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。如果能将该技术用于心理状态的预测,那么必将给心理状态预测带来极大的福音。
[0010]语音是人与人沟通的媒介,它可以方便人们交流情感。随着智能移动电话以及网络的大量普及及应用,智能语音助手、智能音箱设备开始走进人们的日常生活,而人与智能语音助手、智能音箱设备进行对话时,就会涉及自动语音识别技术。自动语音识别技术的目标是给定一段对话者的音频,把它转化成对应的文字。语音识别技术在人机交互上扮演着重要的角色。
[0011]语音识别可以看作是音频域到文本域的转换。在研究早期,由于无法对音频到文本的转换过程直接建模,因此使用贝叶斯定理将语音识别问题转换为给定一段文字条件下求得对应音频特征的概率乘以这段文字的先验概率。随着深度神经网络的快速发展,人们开始把深度神经网络技术应用到声学模型建模上。后来随着对语音识别的认识更加深刻,人们开始从声学模型建模出发,直接构建一个分类网络,网络的输出直接为文本标签序列,比如英语是字母标签或者单个汉字标签序列,这就是最近很流行的端到端语音识别方法。这种方法不再需要发音词典,使得语言识别系统构建门槛降低。目前常用的端到端语音识别方法有基于连接时序分布的端到端语音识别方法和基于注意力机制的编解码语音识别方法。
[0012]但是,上述专利中提及的基于语音识别的心理状态预测系统和方法的解决方案与本专利技术方案存在差异化,主要差异化内容如下:
[0013]1.情感语音数据库总体语料不足,特别是自然场景下的数据库。语音情感识别指直接通过对语音进行分析,推断该语义所包含的情感类别。传统的语音情感分类方法大多使用支持向量机、高斯混合模型等机器学习算法。随着深度学习技术的逐步完善,部分研究者将其应用于语音特征的提取,取得了一定的成果。目前已基本实现安静环境下的语音情感识别,但在嘈杂环境下的语音情感识别尚不成熟。
...

【技术保护点】

【技术特征摘要】
1.一种基于语音识别的心理状态预测系统,包括本地交互预测端(1)、心理诊断和预测云端(2)、心理医生在线诊断端(3)和异常警报端(4);所述心理诊断和预测云端(2)分别和所述本地交互预测端(1)、所述心理医生在线诊断端(3)和异常警报端(4)之间进行通信连接。2.根据权利要求1所述的一种基于语音识别的心理状态预测系统,其特征在于:所述本地交互预测端(1)包括语音录入模块(5)、提示语音播放模块(6)、音频文字转换模块(7)和生理参数获取模块(11);所述语音录入模块(5)和所述音频文字转换模块(7)数据通信连接;所述心理诊断和预测云端(2)包括心理症状和心理预测数据库(8)、心理状态识别模型创建模块(9)和心理状态预测模块(10);包括心理状态识别模型创建:心理疾病患者依据所述提示语音播放模块(6)播放的指令,通过所述语音录入模块(5)录入一定时间段的语音信息,并发送给所述音频文字转换模块(7);所述音频文字转换模块(7)将语音信息转换为文字症状信息;所述生理参数获取模块(11)获取所述心理疾病患者的生理参数,从而所述本地交互预测端(1)将所述文字症状信息和生理参数发送给所述心理诊断和预测云端(2);所述心理诊断和预测云端(2)将获取的所述文字症状信息和生理参数发送给所述心理医生在线诊断端(3);所述心理医生在线诊断端(3)为包括一个心理医生的模块,从而心理医生可以在远程获取所述心理诊断和预测云端(2)发送的心理症状特征数据,并进行心理状态预测形成心理状态预测数据,并反馈给所述心理诊断和预测云端(2),所述心理诊断和预测云端(2)依据心理症状特征数据和心理状态预测数据形成心理症状

心理预测数据记录;并将所述心理症状

心理预测数据记录发送给所述心理诊断和预测云端(2),并存储于所述心理症状和心理预测数据库(8);当在所述心理症状和心理预测数据库(8)的所述心理症状

心理预测数据记录数量达到一定数量时,所述心理状态识别模型创建模块(9)依据储存于所述心理症状和心理预测数据库(8)终端所述心理症状

心理预测数据记录,采用深度学习的方法创建心理状态识别模型;心理状态预测:在完成所述心理状态识别模型创建后,当进行心理状态预测时,心理疾病患者依据所述提示语音播放模块(6)播放的指令,通过所述语音录入模块(5)录入一定时间段的语音信息,并发送给所述音频文字转换模块(7);所述音频文字转换模块(7)将语音信息转换为文字症状信息;所述生理参数获取模块(11)获取所述心理疾病患者的生理参数,从而所述本地交互预测端(1)将所述文字症状信息和生理参数发送给所述心理诊断和预测云端(2);所述心理状态预测模块(10)依据所述文字症状信息和生理参数,并利用所述创建心理状态识别模型进行大数据学习,从而得出该患者的心理预测数据,并将该心理预测数据发送至所述本地交互预测端(1),并通过所述提示语音播放模块(6)播放给心理疾病患者,同时,将该心理状态预测构成心理症状

心理预测数据记录并存储于所述心理症状和心理预测数据库(8);在所述心理医生在线诊断端(3)或所述心理状态预测模块(10)检测到所述心理疾病患者心理出现异常时,通过所述异常警报端(4)进行报警,并利用所述提示语音播放模块(6)进行缓解心理疾病患者的行为;所述生理参数获取模块(11)获取所述心理疾病患者的心率参数,当检测到所述心率参数不符合该心理疾病患者的年龄、体重、身高和性别的心率参数
时,则表明该心理疾病患者未真实反馈其心理症状参数,通过所述提示语音播放模块(6)进行播放舒缓音乐,平缓心理疾病患者的情绪后再进行心理预测。3.根据权利要求2所述的一种基于语音识别的心理状态预测系统,其特征在于:所述音频文字转换模块(7)将语音信息转换为文字症状信息时,同时,录入所述语音信息中的情绪,并将该情绪采用文字的方式表达,共同形成文字症状信息;为了准确获取心理疾病患者的语音症状,通过所述提示语音播放模块(6)选择智能化问答和交谈的形式,以便获取心理疾病患者的真实心理。4.根据权利要求2所述的一种基于语音识别的心理状态预测系统,其特征在于:心理疾病患者通过手动方式选择方言识别模式,实现所述音频文字转换模块(7)自动调整到识别某地的方言,以便准确的识别患者的语音,转换成文字;同时,也可以通过自动方言选择开关进行识别,并在进行方言识别不正确的时候,可以通过手动方式选择合适的方言模式。5.根据权利要求2所述的一种基于语音识别的心理...

【专利技术属性】
技术研发人员:贺同路李玲任永亮李嘉懿杨菲郭学栋
申请(专利权)人:北京智能工场科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1