话题信息的情绪分析方法、装置及服务器制造方法及图纸

技术编号:17779708 阅读:42 留言:0更新日期:2018-04-22 08:13
本发明专利技术提供了话题信息的情绪分析方法、装置及服务器。该方法包括:提取预置语料库中任一目标话题信息中包含的文本信息和至少一个表情符号信息;根据文本信息,在预置的情绪词典中进行匹配,以确定文本信息中匹配到的至少一个情绪词语、以及各个情绪词语对应的情绪类别;确定文本信息在匹配到的情绪类别上的第一情绪强度,以及至少一个表情符号信息在匹配到的情绪类别上的第二情绪强度;根据第一情绪强度和第二情绪强度,确定目标话题信息中文本信息与符号表情信息在匹配到的相同的情绪类别上的情绪强度。相比于现有技术,本发明专利技术实施例实现了文本信息和表情符号信息相结合的话题评论倾向性分析方法,从而更加准确地分析出用户对该话题信息的情绪倾向。

【技术实现步骤摘要】
话题信息的情绪分析方法、装置及服务器
本专利技术涉及文本挖掘、自然语言处理领域,具体而言,本专利技术涉及话题信息的情绪分析方法、装置及服务器。
技术介绍
随着互联网技术的进步和因特网的快速普及,网络用户数量急剧增长,社交媒体、购物网站等各种能够提供用户交流的网络服务形式,带来了用户生成内容的急剧增加,这些内容包含用户对消费产品、影视娱乐、新闻时事等发表的个人观点,抒发了用户的个人情绪。通过识别用户评论中包含的积极、消极、厌恶、反对等多样的情绪,能够更好的理解用户针对具体话题、产品、政策及大众人物的个人情绪,有利于个人、商家和企业,提高服务质量,改善个人和企业形象。现有技术中对话题信息的分析方法,主要基于机器学习的方法,实现评论内容的正面和负面、褒义和贬义等分析,分析粒度比较大,有时并没有准确地反映出用户对该话题信息所表达的情绪。因此,目前需要一种话题信息的情绪分析方法,实现对话题信息进行细粒度地分析,从而更加准确地分析出用户对该话题信息的情绪倾向。。
技术实现思路
鉴于上述缺点,本专利技术提供了话题信息的情绪分析方法、装置及服务器,实现对话题信息进行细粒度地分析,从而准确地分析用户对该话本文档来自技高网...
话题信息的情绪分析方法、装置及服务器

【技术保护点】
一种话题信息的情绪分析方法,其特征在于,包括:提取预置语料库中任一目标话题信息中包含的文本信息和至少一个表情符号信息;根据所述文本信息,在预置的情绪词典中进行匹配,以确定所述文本信息中匹配到的至少一个情绪词语、以及各个情绪词语对应的情绪类别;确定所述文本信息在匹配到的情绪类别上的第一情绪强度,以及所述至少一个表情符号信息在匹配到的情绪类别上的第二情绪强度;根据所述第一情绪强度和第二情绪强度,确定所述目标话题信息中文本信息与符号表情信息在匹配到的相同的情绪类别上的情绪强度。

【技术特征摘要】
1.一种话题信息的情绪分析方法,其特征在于,包括:提取预置语料库中任一目标话题信息中包含的文本信息和至少一个表情符号信息;根据所述文本信息,在预置的情绪词典中进行匹配,以确定所述文本信息中匹配到的至少一个情绪词语、以及各个情绪词语对应的情绪类别;确定所述文本信息在匹配到的情绪类别上的第一情绪强度,以及所述至少一个表情符号信息在匹配到的情绪类别上的第二情绪强度;根据所述第一情绪强度和第二情绪强度,确定所述目标话题信息中文本信息与符号表情信息在匹配到的相同的情绪类别上的情绪强度。2.根据权利要求1所述的情绪分析方法,其特征在于,所述根据所述文本信息,在预置的情绪词典中进行匹配,以确定所述文本信息中匹配到的至少一个情绪词语、以及各个情绪词语对应的情绪类别,包括:对所述文本信息进行切词处理;将切词结果中的各个词语与预置的情绪词典中的情绪词语进行匹配,确定匹配成功的情绪词语、情绪词语对应的情绪类别和情绪强度,所述预置的情绪词典中包含多个情绪词语及各情绪词语对应的情绪类别和情绪强度。3.根据权利要求2所述的情绪分析方法,其特征在于,所述对所述文本信息进行切词处理,还包括:删除切词结果中的停用词。4.根据权利要求1所述的情绪分析方法,其特征在于,所述确定所述文本信息在匹配到的情绪类别上的第一情绪强度的步骤,包括:确定匹配成功的情绪词语中属于相同情绪类别的各个情绪词语对于所述目标话题信息的权重;根据所述各个情绪词语对于所述目标话题信息的权重、以及确定得到的所述各个情绪词语对应的情绪强度,确定所述文本信息在匹配到的情绪类别上的第一情绪强度。5.根据权利要求4所述的情绪分析方法,其特征在于,所述确定匹配成功的情绪词语中属于相同情绪类别的各个情绪词语对于所述目标话题信息的权重,包括:根据任一匹配成功的情绪词语在所述文本信息中出现的次数、所述切词结果中包括的总词数、以及所述预置语料库中包含的目标话题信息的总数、包含该情绪词语的目标话题信息的数量,确定出该情绪词语对于所述目标话题信息的权重。6.根据权利要求1所述的情绪分析方法,其特征在于,所述确定所述至少一个表情符号信息在匹配到的情绪类别上的第二情绪强度的步骤,包括:确定任一匹配到的情绪类别与所述至少一个表情符号信息的第一互信息,以及所有匹配到的情绪类别与所述至少一个表情符号信息的第二互信息;根据第一互信息和第二互信息,确定所述表情符号信息在匹配到的情绪类别上的第二情绪强度。7.根据权利要求6所述的情绪分析方法,其特征在于,所述确定任一匹配到的情绪类别与所述至少一个表情符号信息的第一互信息的步骤,包括:根据任一匹配到的情绪类别包含的任一情绪词语和任一表情符号信息在所述预置语料库中共现的频次,以及所述预置语料库中包含该情绪词语的目标话题信息的数量和包含该表情符号信息的数量,确定该情绪词语与该表情符号信息的互信息;根据任一匹配到的情绪类别下包括的各个情绪词语分别与至少一个表情符号信息的互信息,确定任一匹配到的情绪类别与所述至少一个表情符号信息的第一互信息。8.根据权利要求1所述的情绪分析方法,其特征在于,还包括:根据所述预置语料库中各个目标话题信息的情绪强度,确定该预置语料库的情绪强度分布。9.一种话题信息的情绪分析装置,其特征在于,包括:提取单元、匹配单元、第一确定...

【专利技术属性】
技术研发人员:赵立永吴新丽姚笛李云飞王文文
申请(专利权)人:新华网股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1