社交网络的用户情感分析方法及装置制造方法及图纸

技术编号:16327158 阅读:40 留言:0更新日期:2017-09-29 19:03
本发明专利技术公开了一种社交网络的用户情感分析方法通过先采集社交网络的用户数据,再分析所述用户数据的发表内容,抽取参与的主要话题,并获取正负面词集,接着分析用户对每一主要话题的主观情感集,然后根据所述正负面词集和主观情感集获得情感值技术方案,解决了现有情感分析的准确率较低问题,获得量化的情感值,利于将情感值整合进关系分析网络中获得社交网络的关系层次。

【技术实现步骤摘要】
社交网络的用户情感分析方法及装置
本专利技术涉及计算机网络领域,尤其涉及一种社交网络的用户情感分析方法及装置。
技术介绍
近些年来,情感分析技术已成为自然语言处理研究领域的热门话题,情感分析的目标是从文本中挖掘用户表达的观点以及情感极性,挖掘文本中情感倾向可用于帮助其他用户做决定。因此情感分析技术在自然语言处理研究领域得到了广大研究者的关注,具有很大的应用价值。目前,根据训练文本中出现的所有词作为特征进行情感分析,而通过词特征进行的情感分析仅仅考虑句子的词信息,没有考虑句子本身的语义信息,这样会造成情感分析的结果不准确。例如,通过词特征计算句子“alibaba真有钱”和句子“马云发财啦”的相似度为0,但是实际上两个句子的语义是非常相近的。因此现有情感分析的准确率较低。
技术实现思路
本专利技术实施例的目的是提供一种社交网络的用户情感分析方法及装置,能有效解决现有情感分析的准确率较低的问题。为实现上述目的,本专利技术实施例提供了一种社交网络的用户情感分析方法及装置,包括步骤:采集社交网络的用户数据;分析所述用户数据的发表内容,通过LDA技术抽取参与的主要话题,并获取正负面词集;分析用户对每一主要话题的主观情感集;根据所述正负面词集和主观情感集获得情感值;与现有技术相比,本专利技术公开的社交网络的用户情感分析方法通过先采集社交网络的用户数据,再分析所述用户数据的发表内容,抽取参与的主要话题,并获取正负面词集,接着分析用户对每一主要话题的主观情感集,然后根据所述正负面词集和主观情感集获得情感值技术方案,解决了现有情感分析的准确率较低问题,获得量化的情感值,利于将情感值整合进关系分析网络中获得社交网络的关系层次。作为上述方案的改进,所述社交网络为微博或微信。作为上述方案的改进,还包括步骤:根据所述情感值向所述社交网络的用户推荐内容。作为上述方案的改进,采集所述社交网络的用户数据具体为:利用大规模并行技术采集所述社交网络的用户数据。作为上述方案的改进,采集所述社交网络的用户数据具体为:接收大量所述社交网络的用户数据,将所述社交网络的用户数据分发到多台服务器,进入消息队列系统后快速写入硬盘进行存储和备份。通过上述方案,解决了数据的消费差问题,既能快速的接收海量的数据,从而又保证数据的完整性.存储上采用hadoop系统进行存储和备份,保证了数据的可靠性。本专利技术实施例还提供了一种社交网络的用户情感分析装置,包括:采集模块,用于采集社交网络的用户数据;正负面词集获取模块,用于分析所述用户数据的发表内容,抽取参与的主要话题,获取正负面词集;主观情感集获取模块,用于分析用户对每一主要话题的主观情感集;情感值获取模块,用于根据所述正负面词集和主观情感集获得情感值。与现有技术相比,本专利技术公开的社交网络的用户情感分析装置通过采集模块先采集社交网络的用户数据,再通过正负面词集获取模块分析所述用户数据的发表内容,抽取参与的主要话题,并获取正负面词集,接着通过主观情感集获取模块分析用户对每一主要话题的主观情感集,然后通过情感值获取模块根据所述正负面词集和主观情感集获得情感值技术方案,解决了现有情感分析的准确率较低问题,获得量化的情感值,利于将情感值整合进关系分析网络中获得社交网络的关系层次。作为上述方案的改进,所述社交网络为微博或微信。作为上述方案的改进,还包括:推荐模块,用于根据所述情感值向所述社交网络的用户推荐内容。作为上述方案的改进,所述收集模块具体用于利用大规模并行技术采集所述社交网络的用户数据。作为上述方案的改进,所述收集模块具体用于接收大量所述社交网络的用户数据,将所述社交网络的用户数据分发到多台服务器,进入消息队列系统后快速写入硬盘进行存储和备份。附图说明图1是本专利技术实施例1提供的一种社交网络的用户情感分析方法的流程示意图。图2是本专利技术实施例2提供的一种社交网络的用户情感分析方法的流程示意图。图3是本专利技术实施例3提供的一种社交网络的用户情感分析装置的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。参见图1,是本专利技术实施例1提供的一种社交网络的用户情感分析方法的流程示意图,包括步骤:S1、采集社交网络的用户数据;其中,所述用户数据包括发表内容;优选地,利用大规模并行技术采集所述社交网络的用户数据,既能快速的接收海量的数据,从而又保证数据的完整性。S2、分析所述用户数据的发表内容,通过LDA技术抽取参与的主要话题,并获取正负面词集;其中,所述LDA是一种非监督机器学习技术,可以用来识别大规模文档集(documentcollection)或语料库(corpus)中潜藏的主题信息。它采用了词袋(bagofwords)的方法,这种方法将每一篇文档视为一个词频向量,从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序,这简化了问题的复杂性,同时也为模型的改进提供了契机。每一篇文档代表了一些主题所构成的一个概率分布,而每一个主题又代表了很多单词所构成的一个概率分布。S3、分析用户对每一主要话题的主观情感集;S4、根据所述正负面词集和主观情感集获得情感值。具体实施时,先采集社交网络的用户数据,再分析所述用户数据的发表内容,抽取参与的主要话题,并获取正负面词集,接着分析用户对每一主要话题的主观情感集,然后根据所述正负面词集和主观情感集获得情感值技术方案,解决了现有情感分析的准确率较低问题,获得量化的情感值,利于将情感值整合进关系分析网络中获得社交网络的关系层次。优选地,在另一实施例中,如图2所示,在实施例1的基础上还包括步骤:S5、根据所述情感值向所述社交网络的用户推荐内容。通过上述步骤,可通过量化的情感值向所述社交网络的用户推荐个性化的内容,更加智能化,实现信息的自动化筛选。步骤S1采集所述社交网络的用户数据具体为:接收大量所述社交网络的用户数据,将所述社交网络的用户数据分发到多台服务器,进入消息队列系统后快速写入硬盘进行存储和备份。通过上述方案,解决了数据的消费差问题,既能快速的接收海量的数据,从而又保证数据的完整性.存储上采用hadoop系统进行存储和备份,保证了数据的可靠性。参见图3,是本专利技术实施例3提供的一种社交网络的用户情感分析装置的结构示意图,包括:采集模块101,用于采集社交网络的用户数据;正负面词集获取模块102,用于分析所述用户数据的发表内容,抽取参与的主要话题,获取正负面词集;主观情感集获取模块103,用于分析用户对每一主要话题的主观情感集;情感值获取模块104,用于根据所述正负面词集和主观情感集获得情感值。具体实施时,采集模块先采集社交网络的用户数据,再通过正负面词集获取模块分析所述用户数据的发表内容,抽取参与的主要话题,并获取正负面词集,接着通过主观情感集获取模块分析用户对每一主要话题的主观情感集,然后通过情感值获取模块根据所述正负面词集和主观情感集获得情感值技术方案,解决了现有情感分析的准确率较低问题,获得量化的情感值,利于将情感值整合进关系分析网络中获得社交本文档来自技高网...
社交网络的用户情感分析方法及装置

【技术保护点】
一种社交网络的用户情感分析方法,其特征在于,包括步骤:采集社交网络的用户数据;其中,所述用户数据包括发表内容;分析所述用户数据的发表内容,通过LDA技术抽取参与的主要话题,并获取正负面词集;分析用户对每一主要话题的主观情感集;根据所述正负面词集和主观情感集获得情感值。

【技术特征摘要】
1.一种社交网络的用户情感分析方法,其特征在于,包括步骤:采集社交网络的用户数据;其中,所述用户数据包括发表内容;分析所述用户数据的发表内容,通过LDA技术抽取参与的主要话题,并获取正负面词集;分析用户对每一主要话题的主观情感集;根据所述正负面词集和主观情感集获得情感值。2.如权利要求1所述的社交网络的用户情感分析方法,其特征在于,所述社交网络为微博或微信。3.如权利要求1所述的社交网络的用户情感分析方法,其特征在于,还包括步骤:根据所述情感值向所述社交网络的用户推荐内容。4.如权利要求1所述的社交网络的用户情感分析方法,其特征在于,采集所述社交网络的用户数据具体为:利用大规模并行技术采集所述社交网络的用户数据。5.如权利要求1所述的社交网络的用户情感分析方法,其特征在于,采集所述社交网络的用户数据具体为:接收大量所述社交网络的用户数据,将所述社交网络的用户数据分发到多台服务器,进入消息队列系统后快速写入硬盘进行存储和备份。6.一...

【专利技术属性】
技术研发人员:晋彤
申请(专利权)人:广州特道信息科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1