System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及深度学习,尤其涉及一种基于深度集成学习的抑郁情绪识别方法、装置及系统。
技术介绍
1、抑郁症已成为受到全球高度关注和重视的精神健康疾病。然而,由于心理医疗资源紧等原因,抑郁症患者普遍面临“患病不知病,知病不看病”的困境。
2、传统的抑郁症临床识别主要基于icd-10或dsm-v的抑郁症标准,并结合汉密尔顿抑郁症量表等经典量表、咨询访谈录、患者面部表情、患者脑电信号以及医生的个人经验,存在效率低下、主观性和隐藏性高等问题。
3、现有技术还有针对微博、推特等传统社交媒体用户生成内容进行抑郁情绪识别,处理流程通常为:
4、1)收集社交媒体用户帖子;
5、2)数据预处理+数据标注;
6、3)特征提取(tfidf、用户特征、文本特征等等);
7、4)构建分类器(机器学习为主,例如svm,或单一的深度学习分类器,如textcnn);
8、5)模型训练和评价。
9、这些方法普遍存在抑郁情绪识别相关技术多以社交媒体为应用场景,少有研究/专利以在线健康社区作为应用场景,且目前基于社交媒体的抑郁情绪识别方法主要依赖传统机器学习模型或单一的深度学习模型,对复杂情绪的语义表征和特征提取效果较差,仍存在较大的提升空间。
10、而在线健康社区的出现和发展为抑郁用户寻求专业心理健康服务和同伴社会支持提供了新的途径,也为了解该群体及抑郁识别带来了新的研究视角。由于在线健康社区与传统社交媒体在平台性质、用户群体和用户生成内容特征等方面存在本质
11、因此,针对在线健康社区场景的抑郁情绪识别,需要提出一种新的抑郁情绪识别方法。
技术实现思路
1、本专利技术提供一种基于深度集成学习的抑郁情绪识别方法、装置及系统,用以解决现有技术中没有针对在线健康社区场景中抑郁症情绪识别的缺陷。
2、第一方面,本专利技术提供一种基于深度集成学习的抑郁情绪识别方法,包括:
3、从在线心理健康社区平台采集用户提问数据样本,对所述用户提问数据样本进行预处理得到预处理用户提问数据样本;
4、利用特征指标体系提取所述预处理用户提问数据样本中的特征信息;
5、基于stacking深度集成学习基分类器构建抑郁情绪识别原始模型,采用所述特征信息对所述抑郁情绪识别原始模型进行训练,得到抑郁情绪识别模型;
6、将待识别提问数据输入所述抑郁情绪识别模型,输出抑郁情绪识别结果。
7、根据本专利技术提供的一种基于深度集成学习的抑郁情绪识别方法,从在线心理健康社区平台采集用户提问数据样本,对所述用户提问数据样本进行预处理得到预处理用户提问数据样本,包括:
8、基于python selenium框架中的网络爬虫库requests和beautifulsoup4从所述在线心理健康社区平台中采集所述用户提问数据样本;
9、在所述用户提问数据样本中分别筛选包括抑郁症症状词语、抑郁症行为词语和抑郁症关联药物词语的基准词库,以及筛选未包含所述基准词库的随机样本,由所述基准词库和所述随机样本构建筛选语料库;
10、采用预设正则表达式对所述筛选语料库进行中文匹配,删除非中文字符,采用预设分词工具对所述筛选语料库进行分词,去除文本中停用词,并消除无意义词汇和无意义符号,得到处理后筛选语料库;
11、由预设数量的专业标注者依据交叉验证原则,将所述处理后筛选语料库划分为正类样本和负类样本;
12、按照预设比例将所述正类样本和所述负类样本划分为训练集和测试集,得到所述预处理用户提问数据样本。
13、根据本专利技术提供的一种基于深度集成学习的抑郁情绪识别方法,利用特征指标体系提取所述预处理用户提问数据样本中的特征信息,包括:
14、确定所述特征指标体系包括用户基本信息特征、行为习惯特征、文本内容特征和文本情感特征;
15、基于所述文本情感特征构建领域情感词典;
16、将所述特征指标体系转化为特征向量,输出所述特征信息。
17、根据本专利技术提供的一种基于深度集成学习的抑郁情绪识别方法,基于所述文本情感特征构建领域情感词典,包括:
18、确定所述文本情感特征中的种子词和语料库;
19、采用词语相似度算法计算所述种子词和所述语料库中任一候选词之间的点互信息值,基于所述点互信息值确定词语关联性;
20、基于所述词语关联性,计算所述任一候选词与所述种子词中积极情感词以及消极情感词之间的点互信息差值;
21、根据预设筛选阈值筛选所述点互信息差值,以筛选后的积极情感词和消极情感词构建偶数领域情感词典。
22、根据本专利技术提供的一种基于深度集成学习的抑郁情绪识别方法,将所述特征指标体系转化为特征向量,输出所述特征信息,包括:
23、将所述特征指标体系中的文本信息作为文本特征向量;
24、对所述特征指标体系中的类别信息进行独热编码,转换为类别特征向量;
25、以所述文本特征向量和所述类别特征向量构成所述特征信息。
26、根据本专利技术提供的一种基于深度集成学习的抑郁情绪识别方法,基于stacking深度集成学习基分类器构建抑郁情绪识别原始模型,包括:
27、采用textcnn深度学习模型、textrnn深度学习模型和textrcnn深度学习模型构建所述stacking深度集成学习基分类器;
28、所述textcnn深度学习模型中的卷积层采用三种不同卷积核对词向量矩阵进行卷积运算,池化层提取卷积层中生成的多列向量中每一列最大值形成一维向量,由全连接层拼接所有一维向量输出第一向量;
29、所述textrnn深度学习模型采用双向lstm层学习文本信息,依次通过全连接层、softmax层和注意力机制进行连接输出第二向量;
30、所述textrcnn深度学习模型通过双向lstm层得到隐藏层输出,与特征向量进行拼接,采用tanh激活函数,通过卷积层、池化层和全连接层输出第三向量;
31、将所述第一向量、所述第二向量和所述第三向量进行特征融合,通过softmax函数分别得到第一基分类器预测标签、第二基分类器预测标签和第三基分类器预测标签。
32、根据本专利技术提供的一种基于深度集成学习的抑郁情绪识别方法,采用所述特征信息对所述抑郁情绪识别原始模型进行训练,得到抑郁情绪识别模型,包括:
33、以所述第一基分类器预测标签、所述第二基分类器预测标签和所述第三基分类器预测标签作为训练集;
34、将所述训练集输入元分类器,得到所述抑郁情绪识别模型。
35、第二方面,本专利技术还提供一种基于深度集成学习的抑郁情绪识别装置,包括:
36、采集单元,用于从在线心理健康社区平台采集用户提问数据样本,对所本文档来自技高网...
【技术保护点】
1.一种基于深度集成学习的抑郁情绪识别方法,其特征在于,包括:
2.根据权利要求1所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,从在线心理健康社区平台采集用户提问数据样本,对所述用户提问数据样本进行预处理得到预处理用户提问数据样本,包括:
3.根据权利要求1所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,利用特征指标体系提取所述预处理用户提问数据样本中的特征信息,包括:
4.根据权利要求3所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,基于所述文本情感特征构建领域情感词典,包括:
5.根据权利要求3所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,将所述特征指标体系转化为特征向量,输出所述特征信息,包括:
6.根据权利要求1所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,基于Stacking深度集成学习基分类器构建抑郁情绪识别原始模型,包括:
7.根据权利要求6所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,采用所述特征信息对所述抑郁情绪识别原始模型进行训练,得到抑郁情绪识
8.一种基于深度集成学习的抑郁情绪识别装置,其特征在于,包括:
9.一种基于深度集成学习的抑郁情绪识别系统,其特征在于,包括:
10.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于深度集成学习的抑郁情绪识别方法。
...【技术特征摘要】
1.一种基于深度集成学习的抑郁情绪识别方法,其特征在于,包括:
2.根据权利要求1所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,从在线心理健康社区平台采集用户提问数据样本,对所述用户提问数据样本进行预处理得到预处理用户提问数据样本,包括:
3.根据权利要求1所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,利用特征指标体系提取所述预处理用户提问数据样本中的特征信息,包括:
4.根据权利要求3所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,基于所述文本情感特征构建领域情感词典,包括:
5.根据权利要求3所述的基于深度集成学习的抑郁情绪识别方法,其特征在于,将所述特征指标体系转化为特征向量,输出所述特征信息,包括:<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。