一种基于文字和非文字的情绪判断方法技术

技术编号:32830336 阅读:19 留言:0更新日期:2022-03-26 20:41
本发明专利技术涉及一种基于文字和非文字的情绪判断方法,包括:步骤(1):获取被测试人的文本,并将所述文本分成若干初始词汇,再从所述初始词汇中选出具有实际语义的词汇;步骤(2):将所述具有实际语义的词汇进行分类;步骤(3):对分类后的词汇进行赋值,并对赋值后的词汇加权求和,得到文字情感分值;步骤(4):计算所述文本中的非文字情感分值;步骤(5):将所述文字情感分值和非文字情感分值相加得到情感总分值,基于所述情感总分值判断被测试人的情绪状态值和非文字情感分值相加得到情感总分值,基于所述情感总分值判断被测试人的情绪状态。本发明专利技术能够对被测试人的情绪状态进行准确判断。能够对被测试人的情绪状态进行准确判断。能够对被测试人的情绪状态进行准确判断。

【技术实现步骤摘要】
一种基于文字和非文字的情绪判断方法


[0001]本专利技术涉及情绪感知
,特别是涉及一种基于文字和非文字的情绪判断方法。

技术介绍

[0002]抑郁症是现在最常见的一种心理疾病,以连续而长期的心情低落为主要的临床特征,是现代人心理疾病最重要的类型。抑郁症是世界第四大疾病,但我国对抑郁症的医疗防治还处在识别率低的局面,地级市以上的医院对其识别率不足20%,只有不到10%的患者接受了相关的药物治疗;而且,同时,抑郁症的发病(和自杀事件)已开始出现低龄(大学,乃至中小学生群体)化趋势。综上所述,对抑郁症的科普、防范、治疗工作亟待重视,抑郁症防治已被列入全国精神卫生工作重点。
[0003]传统的抑郁状态判断方法多是基于量表判断,如宗氏抑郁自评量表(目前精神卫生领域临床最常用的量表宗氏SDS量表是在1965年开发的),这些量表有明显的时代滞后性,且量表均为客观选择题,无法准确判断出被试人的情绪情况,只能通过传统程度量表的方式给一个相对客观的量化判定结果。
[0004]虽然有一些基于NLP(神经语言程序学)的抑郁判断方法,但这些抑郁判断方法也存在诸多问题,如忽略了非文字处理、抑郁判断准确率不高等。

技术实现思路

[0005]本专利技术所要解决的技术问题是提供一种基于文字和非文字的情绪判断方法,能够对被测试人的情绪状态进行准确判断。
[0006]本专利技术解决其技术问题所采用的技术方案是:提供一种基于文字和非文字的情绪判断方法,包括:
[0007]步骤(1):获取被测试人的文本,并将所述文本分成若干初始词汇,再从所述初始词汇中选出具有实际语义的词汇;
[0008]步骤(2):将所述具有实际语义的词汇进行分类;
[0009]步骤(3):对分类后的词汇进行赋值,并对赋值后的词汇加权求和,得到文字情感分值;
[0010]步骤(4):计算所述文本中的非文字情感分值;
[0011]步骤(5):将所述文字情感分值和非文字情感分值相加得到情感总分值,基于所述情感总分值判断被测试人的情绪状态。
[0012]所述步骤(1)中的将所述文本分成若干初始词汇,再从所述初始词汇中选出具有实际语义的词汇,具体为:基于所述文本中的标点符号将文本分成若干短句,通过N元文法模型将每个短句分为若干长度为N字段的初始词汇,再通过字符串匹配从所述若干长度为N字段的初始词汇中选出具有实际语义的词汇。
[0013]所述步骤(2)将所述具有实际语义的词汇分类为停用词、情感词、否定词和程度副
词。
[0014]所述步骤(2)还包括:
[0015]对每个所述情感词在文本中的位置进行定位,并判断每个情感词是否连接有否定词或程度副词;
[0016]将每个情感词分类为积极情感词和消极情感词;
[0017]统计积极情感词和消极情感词的数量。
[0018]所述步骤(3)具体为:将所述停用词的权重赋值为0,将所述否定词的权重赋值为

1,根据知网情感词典对程度副词、统计好数量的积极情感词和消极情感词进行权重赋值,最后将停用词的权重、情感词的权重、否定词的权重和程度副词的权重进行加权求和,得到文字情感分值。
[0019]所述步骤(4)具体为:
[0020]获取所述文本的表情符号和预设标点符号;
[0021]计算所述表情符号的情感分值和所述预设标点符号的情感分值;
[0022]将所述表情符号的情感分值和所述预设标点符号的情感分值求和得到非文字情感分值。
[0023]所述计算所述预设标点符号的情感分值,具体为:统计所述预设标点符号的数量,根据所述预设标点符号的数量计算预设标点符号的情感分值。
[0024]所述标点符号包括感叹号和问号。
[0025]所述表情符号包括emoji表情符号。
[0026]有益效果
[0027]由于采用了上述的技术方案,本专利技术与现有技术相比,具有以下的优点和积极效果:本专利技术通过字符串匹配和N元文法模型相结合的分词方法将短句分成不同的词汇,既可以体现N元文法模型速度快、效率高的优点,又能发挥字符串匹配识别生词、消除歧义的特点;本专利技术除了将被测试人文本中的文字进行评分,还对文本中的符号(包括表情符号和标点符号)进行评分能够对被测试人的情绪进行准确判定;本专利技术能够辅助心理咨询师对被测试人的情绪状态进行判定,实用性和通用性较好。
附图说明
[0028]图1是本专利技术实施方式的方法流程图。
具体实施方式
[0029]下面结合具体实施例,进一步阐述本专利技术。应理解,这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围。此外应理解,在阅读了本专利技术讲授的内容之后,本领域技术人员可以对本专利技术作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
[0030]本专利技术的实施方式涉及一种基于文字和非文字的情绪判断方法,主要包括:
[0031]步骤(1):获取被测试人的文本,并将所述文本分成若干初始词汇,再从所述初始词汇中选出具有实际语义的词汇;
[0032]步骤(2):将所述具有实际语义的词汇进行分类;
[0033]步骤(3):对分类后的词汇进行赋值,并对赋值后的词汇加权求和,得到文字情感分值;
[0034]步骤(4):计算所述文本中的非文字情感分值;
[0035]步骤(5):将所述文字情感分值和非文字情感分值相加得到情感总分值,基于所述情感总分值判断被测试人的情绪状态。
[0036]以下通过一个具体的实施方式进一步说明本专利技术:
[0037]请参阅图1,本实施方式具体包括以下步骤:
[0038]前置步骤:准备文本,该文本可以是被测试人的日记、个人社交网站记录、或者相关语音转文本。
[0039]步骤(1)文本分句分词。通过标点符号的分隔将文本分成若干短句,再将短句分成不同的词汇。本实施方式采用字符串匹配和N元文法模型相结合的分词方法,其中,N元文法模型会将一句话分为若干个N字段长的词汇,但每个词汇并不一定有实际的现实意义,因此再通过使用字符串匹配算法计算每个词汇的哈希值,并与现有词库哈希值比较,如果二者哈希值相等便可以确定是同一个词汇,最终筛选出有实际语义的词汇,完成整套逻辑分词方法。例如:“小明喜欢喝茶”,当N=2时它的N元文法模型依次为:小明,明喜,喜欢,欢喝,喝茶。通过字符串匹配算法计算每个短语哈希值后去掉不匹配的词汇,最终得到“小明”、“喜欢”、“喝茶”的分词结果。由此可见,本实施方式既可以体现N元文法模型速度快、效率高的优点,又能发挥字符串匹配识别生词、消除歧义的特点。
[0040]步骤(2)对词汇集合进行分类,分为停用词、情感词、否定词、程度副词四大类。
[0041]通过步骤(2a)对情感词进行定位,定位其在文本中的位置,是否有连接否定词或程度副词;
[0042]通过步骤(2b)对情感词进行分类,分为积极情感词和消极情感词两大类;
[0043本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于文字和非文字的情绪判断方法,其特征在于,包括:步骤(1):获取被测试人的文本,并将所述文本分成若干初始词汇,再从所述初始词汇中选出具有实际语义的词汇;步骤(2):将所述具有实际语义的词汇进行分类;步骤(3):对分类后的词汇进行赋值,并对赋值后的词汇加权求和,得到文字情感分值;步骤(4):计算所述文本中的非文字情感分值;步骤(5):将所述文字情感分值和非文字情感分值相加得到情感总分值,基于所述情感总分值判断被测试人的情绪状态。2.根据权利要求1所述的基于文字和非文字的情绪判断方法,其特征在于,所述步骤(1)中的将所述文本分成若干初始词汇,再从所述初始词汇中选出具有实际语义的词汇,具体为:基于所述文本中的标点符号将文本分成若干短句,通过N元文法模型将每个短句分为若干长度为N字段的初始词汇,再通过字符串匹配从所述若干长度为N字段的初始词汇中选出具有实际语义的词汇。3.根据权利要求1所述的基于文字和非文字的情绪判断方法,其特征在于,所述步骤(2)将所述具有实际语义的词汇分类为停用词、情感词、否定词和程度副词。4.根据权利要求3所述的基于文字和非文字的情绪判断方法,其特征在于,所述步骤(2)还包括:对每个所述情感词在文本中的位置进行定位,并判断每个情感词是否连接有否定词或程度副...

【专利技术属性】
技术研发人员:ꢀ七四专利代理机构
申请(专利权)人:好人生上海健康科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1