一种基于文本信息的幸福感智能检测方法和设备技术

技术编号:10270067 阅读:126 留言:0更新日期:2014-07-30 20:43
本发明专利技术公开了一种基于文本信息的幸福感智能检测方法和设备。该方法包括:对文本信息进行分词处理,并得到至少一个分词;根据至少一个分词来从情感词库中确定至少一个分词中包括的所有情感词,其中该情感词库中存储有情感词和该情感词在各个基本情感维度上的分量值;确定文本信息中的各个情感词在文本信息中的词频数;从情感词库中获取各个情感词在各个基本情感维度上的分量值;以及根据各个情感词在文本信息中的词频数、各个情感词在各个基本情感维度上的分量值、和各个基本情感在幸福感中所占的权重,来确定文本信息的幸福感值。本发明专利技术解决了由于被测者的记忆和自我感知等原因,导致被测者在过去时间段幸福感难以定量化地检测和比较的问题。

【技术实现步骤摘要】
一种基于文本信息的幸福感智能检测方法和设备
本专利技术涉及信息
,具体地,涉及一种基于文本信息的幸福感智能检测方法和设备。
技术介绍
2012年央视有关“幸福”的调查,将“幸福”这个千百年来人们一直不断追求的目标再次引入公众的视野,顿时在社会上引起了广泛而激烈的讨论。以往对于幸福感的研究中,以心理学方面居多,随着科技的进步逐渐出现了一些新的测量方法,如FMRI(功能磁共振成像)技术、PET(正电子发射型计算机断层显像)技术。在经济学领域,“可衡量的效用”一直作为经济学家们对幸福感测量的基础。现有的对于幸福感的研究方法有自我报告法(self-report)、知情者/观察者报告法、生理测量法和任务测量法。这些方法是通过问卷调查对被测者的幸福感进行测量,即制定幸福感测量的量表,然后根据量表选择被测对象,被测对象完成问题后,筛选出有效问卷,通过对数据进行分析,得出被测对象的幸福感。然而这种问卷调查的方法对被测者个人的记忆及当时的环境有很高的依赖性,基本上只能测量被测者最近一段时间的幸福感水平,难以定量化地测量个人在过去某个特定时间段的幸福感。而且,这种方法对被测者自我感知的依赖性较强,这大大降低了测量结果的可靠性和说服力,并可能导致错误的结果。
技术实现思路
本专利技术的目的是提供一种客观、简便的基于文本信息的幸福感定量化智能检测方法和设备。为了实现上述目的,本专利技术提供一种基于文本信息的幸福感智能检测方法,该方法包括:对所述文本信息进行分词处理,并得到至少一个分词;根据所述至少一个分词来从情感词库中确定所述至少一个分词中包括的所有情感词,其中该情感词库中存储有情感词和该情感词在各个基本情感维度上的分量值;确定所述文本信息中的各个情感词在所述文本信息中的词频数;从所述情感词库中获取所述各个情感词在所述各个基本情感维度上的分量值;以及根据所述各个情感词在所述文本信息中的词频数、所述各个情感词在各个基本情感维度上的分量值、和各个基本情感在幸福感中所占的权重,来确定所述文本信息的幸福感值。优选地,所述情感词库中还存储有情感词的词性。优选地,对所述文本信息进行分词处理,还得到所述至少一个分词的词性;以及根据所述至少一个分词和所述至少一个分词的词性,来从所述情感词库中确定所述至少一个分词中包括的所有情感词,其中,各个情感词带有词性信息。优选地,可以通过以下方式确定所述文本信息的幸福感值:根据所述各个情感词在所述文本信息中的词频数,确定所述各个情感词在所述文本信息中的所有情感词中的占比;根据所述各个情感词在所述文本信息中的所有情感词中的占比、以及所述各个情感词在各个基本情感维度上的分量值,确定所述文本信息在所述各个基本情感维度上的分量值;以及根据所述文本信息在所述各个基本情感维度上的分量值、以及各个基本情感在幸福感中所占的权重,确定所述文本信息的幸福感值。优选地,可以通过以下方式确定所述各个情感词在所有情感词中的占比:其中,pk表示第k个情感词在所述文本信息中的所有情感词中的占比;fk表示第k个情感词在所述文本信息中的词频数;n表示所述文本信息中的情感词的总数。优选地,可以通过以下方式确定所述文本信息在所述各个基本情感维度上的分量值:其中,dj表示所述文本信息在第j个基本情感维度上的分量值;pk表示第k个情感词在所述文本信息中的所有情感词中的占比;ejk表示第k个情感词在第j个基本情感维度上的分量值;n表示所述文本信息中的情感词的总数。优选地,可以通过以下方式确定所述文本信息的幸福感值:其中,H表示所述文本信息的幸福感值;dj表示所述文本信息在第j个基本情感维度上的分量值;m表示所述基本情感维度的总数;ωj表示第j个基本情感在幸福感中所占的权重。本专利技术还提供一种基于文本信息的幸福感智能检测设备,该设备包括:用于对所述文本信息进行分词处理,并得到至少一个分词的装置;用于根据所述至少一个分词来从情感词库中确定所述至少一个分词中包括的所有情感词的装置,其中该情感词库中存储有情感词和该情感词在各个基本情感维度上的分量值;用于确定所述文本信息中的各个情感词在所述文本信息中的词频数的装置;用于从所述情感词库中获取所述各个情感词在所述各个基本情感维度上的分量值的装置;以及用于根据所述各个情感词在所述文本信息中的词频数、所述各个情感词在各个基本情感维度上的分量值、和各个基本情感在幸福感中所占的权重,来确定所述文本信息的幸福感值的装置。在上述技术方案中,基于情感词库对被测者过去时间段内的文本信息(例如,在社交网络上记录的文字信息)进行分析,可以得出所述文本信息中所包含的情感词及其在各个基本情感维度上的分量值。之后,在对所述情感词进行统计分析的基础上,可以定量化地得出所述本文信息所反映的被测者的幸福感值。本专利技术解决了由于被测者的记忆和自我感知等原因,导致被测者在过去时间段的幸福感难以定量化地检测和比较的问题。本专利技术提供的检测方法对被测者个人的记忆及当时的环境依赖性较小,对被测者自我感知的依赖性也较小,从而可以更为客观、简便地、定量化地检测被测者的幸福感值,并且可以大大提高检测结果的可靠性和说服力。本专利技术的其他特征和优点将在随后的具体实施方式部分予以详细说明。附图说明附图是用来提供对本专利技术的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本专利技术,但并不构成对本专利技术的限制。在附图中:图1是根据本专利技术的实施方式的基于文本信息的幸福感智能检测方法的流程图;以及图2~图5是根据本专利技术提供的幸福感智能检测方法进行幸福感检测的检测结果示意图。具体实施方式以下结合附图对本专利技术的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本专利技术,并不用于限制本专利技术。本专利技术提供了一种基于文本信息的幸福感智能检测方法,其流程图如图1所示。该方法可以包括:步骤S101,对文本信息进行分词处理,并得到至少一个分词;步骤S102,根据至少一个分词来从情感词库中确定至少一个分词中包括的所有情感词;步骤S103,确定文本信息中的各个情感词在文本信息中的词频数;步骤S104从情感词库中获取各个情感词在各个基本情感维度上的分量值;以及步骤S105,根据各个情感词在文本信息中的词频数、各个情感词在各个基本情感维度上的分量值、和各个基本情感在幸福感中所占的权重,来确定文本信息的幸福感值。其中,该情感词库中可以存储有情感词和该情感词在各个基本情感维度上的分量值。在本专利技术中,将情感分成了几个基本情感,也就是将情感表示为一个多维向量,一个维度对应一个基本情感。在本专利技术的一个示例中,可以采用“期待”、“喜爱”、“高兴”、“惊讶”、“焦虑”、“悲伤”、“生气”和“憎恨”这八个基本情感。具体地,步骤S101,可以首先对文本信息进行分词处理,将一个文本信息拆分成至少一个分词。该步骤可以选择一些分词工具来完成,例如,SCWS(简易中文分词系统)、ICTCLAS(汉语词法分析系统)等。接下来,步骤S102,根据至少一个分词来从情感词库中确定至少一个分词中包括的所有情感词。可以将每个分词与情感词库中存储的情感词进行匹配。如果某个分词在情感词库中有记录,则该分词可以作为该文本信息的一个情感词。反之,如果没有记录,则该分词不作为该文本信息的情感词。通过将所有本文档来自技高网...
一种基于文本信息的幸福感智能检测方法和设备

【技术保护点】
一种基于文本信息的幸福感智能检测方法,该方法包括:对所述文本信息进行分词处理,并得到至少一个分词;根据所述至少一个分词来从情感词库中确定所述至少一个分词中包括的所有情感词,其中,该情感词库中存储有情感词和该情感词在各个基本情感维度上的分量值;确定所述文本信息中的各个情感词在所述文本信息中的词频数;从所述情感词库中获取所述各个情感词在所述各个基本情感维度上的分量值;以及根据所述各个情感词在所述文本信息中的词频数、所述各个情感词在各个基本情感维度上的分量值、和各个基本情感在幸福感中所占的权重,来确定所述文本信息的幸福感值。

【技术特征摘要】
1.一种基于文本信息的幸福感智能检测方法,该方法包括:对所述文本信息进行分词处理,并得到至少一个分词;根据所述至少一个分词来从情感词库中确定所述至少一个分词中包括的所有情感词,其中,该情感词库中存储有情感词和该情感词在各个基本情感维度上的分量值;确定所述文本信息中的各个情感词在所述文本信息中的词频数;从所述情感词库中获取所述各个情感词在所述各个基本情感维度上的分量值;根据所述各个情感词在所述文本信息中的词频数,确定所述各个情感词在所述文本信息中的所有情感词中的占比;根据所述各个情感词在所述文本信息中的所有情感词中的占比、以及所述各个情感词在各个基本情感维度上的分量值,通过以下方式确定所述文本信息在所述各个基本情感维度上的分量值:其中,dj表示所述文本信息在第j个基本情感维度上的分量值;pk表示第k个情感词在所述文本信息中的所有情感词中的占比;ejk表示第k个情感词在第j个基本情感维度上的分量值;n表示所述文本信息中的情感词的总数;以及根据所述文本信息在所述各个基本情感维度上的分量值、以及各个基本情感在幸福感中所占的权重,确定所述文本信息的幸福感值。2.根据权利要求1所述的方法,其特征在于,所述情感词库中还存储有情感词的词性。3.根据权利要求2所述的方法,其特征在于,对所述文本信息进行分词处理,还得到所述至少一个分词的词性;以及根据所述至少一个分词和所述至少一个分词的词性,来从所述情感词库中确定所述至少一个分词中包括的所有情感词,其中,各个情感词带有词性信息。4.根据权利要求1所述的方法,其特征在于,通过以下方式确定所述各个情感词在所有情感词中的占比:其中,pk表示第k个情感词在所述文本信息中的所有情感词中的占比;fk表示第k个情感词在所述文本信息中的词频数;n表示所述文本信息中的情感词的总数。5.根据权利要求1所述的方法,其特征在于,通过以下方式确定所述文本信息的幸福感值:其中,H表示所述文本信息的幸福感值;dj表示所述文本信息在第j个基本情感维度上的分量值;m表示所述基本情感维度的总数;ωj表示第j个基本情感在幸福感中所占的权重。6.一种基于文本信息的幸福感智能检测设备,该设备包括:用于对所述文本信息进行分词处理,并得到至少一个分词的装置;用于根据所述...

【专利技术属性】
技术研发人员:齐佳音傅湘玲陈庆曾丹
申请(专利权)人:北京邮电大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1