一种情感倾向信息获得方法及装置制造方法及图纸

技术编号:22689093 阅读:21 留言:0更新日期:2019-11-30 03:40
本申请实施例提供了一种情感倾向信息获得方法及装置,涉及互联网技术领域,其中,上述方法包括:获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;按照计算得到的重要性程度由高到低的顺序,从所述待处理评论信息包含的词中,选择对所述待处理评论信息具有表征性的词;根据所选择的词,获得所述待分析信息的情感倾向信息。应用本申请实施例提供的方案,能够获得信息的情感倾向信息。

A method and device for obtaining emotional tendency information

The embodiment of the application provides a method and device for obtaining emotional tendency information, which relates to the field of Internet technology, wherein the method comprises: obtaining the comment information to be processed, wherein the comment information to be processed is the comment information of the information to be analyzed; calculating the importance degree of the words contained in the comment information to be processed in the comment information to be processed; calculating the importance degree of the words contained in the comment information to be processed according to the calculated From the words contained in the comment information to be processed, words with representativeness to the comment information to be processed are selected in the order of high importance to low importance; according to the selected words, emotional tendency information of the information to be analyzed is obtained. Applying the scheme provided by the embodiment of the application, emotional tendency information of the information can be obtained.

【技术实现步骤摘要】
一种情感倾向信息获得方法及装置
本申请涉及互联网
,特别是涉及一种情感倾向信息获得方法及装置。
技术介绍
随着互联网技术的快速发展,互联网能够为用户提供的信息越来越广泛。而上述各种信息往往会具有情感倾向。例如,一条信息的情感倾向可以是表示正面情绪的情感倾向、表示负面情绪的情感倾向等。由于具有负面情绪的信息可能会为广大用户带来不良影响,为此,需要获得信息的情感倾向信息,然后根据情感倾向信息对互联网提供的各种信息进行监控。鉴于上述情况,需要提供一种获得信息的情感倾向信息的方案。
技术实现思路
本申请实施例的目的在于提供一种情感倾向信息获得方法及装置,以获得信息的情感倾向信息。具体技术方案如下:第一方面,本申请实施例提供了一种情感倾向信息获得方法,所述方法包括:获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;按照计算得到的重要性程度由高到低的顺序,从所述待处理评论信息包含的词中,选择对所述待处理评论信息具有表征性的词;根据所选择的词,获得所述待分析信息的情感倾向信息。第二方面,本申请实施例提供了一种情感倾向信息获得装置,所述装置包括:评论信息获取模块,用于获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;重要性程度计算模块,用于计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;词选择模块,用于按照计算得到的重要性程度由高到低的顺序,从所述待处理评论信息包含的词中,选择对所述待处理评论信息具有表征性的词;情感倾向信息获得模块,用于根据所选择的词,获得所述待分析信息的情感倾向信息。第三方面,本申请实施例提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现本申请实施例所述的情感倾向信息获得方法步骤。第四方面,本申请实施例提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现本申请实施例所述的情感倾向信息获得方法步骤。由以上可见,应用本申请实施例提供的方案获得待分析信息的情感倾向信息时,是基于待分析信息的评论信息,也就是待处理评论信息获得的。根据待处理评论信息包括的词在待处理评论信息中的重要性程度,从待处理评论信息包括的词中,选择对待处理评论信息具有表征性的词,然后根据所选择的词,获得待分析信息的情感倾向信息。由于待处理评论信息反映了待分析信息的阅读者对待分析信息的情感倾向,又由于上述所选择的词对待处理评论信息具有表征性,所以,上述所选择的词能够反映待分析信息的阅读者对待分析信息的情感倾向。因此,根据上述所选择的词能够获得待分析信息的情感倾向信息。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例提供的第一种情感倾向信息获得方法的流程示意图;图2为本申请实施例提供的第二种情感倾向信息获得方法的流程示意图;图3为本申请实施例提供的第三种情感倾向信息获得方法的流程示意图;图4为本申请实施例提供的第一种情感倾向信息获得装置的结构示意图;图5为本申请实施例提供的第二种情感倾向信息获得装置的结构示意图;图6为本申请实施例提供的第三种情感倾向信息获得装置的结构示意图;图7为本申请实施例提供的一种电子设备的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。由于互联网向用户提供的信息越来越广泛,而上述各种信息又往往具有情感倾向,为便于对互联网提供的各种信息进行监控,需要获得信息的情感倾向信息。基于此,本申请实施例提供了一种情感倾向信息获得方法及装置。本申请的一个实施例中,提供了一种情感倾向信息获得方法,该方法包括:获取待处理评论信息,待处理评论信息为待分析信息的评论信息;计算待处理评论信息包含的词在待处理评论信息中的重要性程度;按照计算得到的重要性程度由高到低的顺序,从待处理评论信息包含的词中,选择对待处理评论信息具有表征性的词;根据所选择的词,获得待分析信息的情感倾向信息。由于上述待处理评论信息反映了待分析信息的阅读者对待分析信息的情感倾向,又由于上述所选择的词对待处理评论信息具有表征性,所以,上述所选择的词能够反映待分析信息的阅读者对待分析信息的情感倾向。因此,根据上述所选择的词能够获得待分析信息的情感倾向信息。下面先通过具体实施例对本申请实施例提供的情感倾向信息获得方法进行详细说明。参见图1,提供了第一种情感倾向信息获得方法的流程示意图,该方法包括如下步骤S101-S104。S101:获取待处理评论信息。其中,上述待处理评论信息为待分析信息的评论信息。具体的,上述待分析信息可以是新闻、网络小说、论坛话题、视频、音频等信息。对于一条待分析信息而言,其评论信息可以是指该待分析信息的所有评论信息,还可以是指该待分析信息的部分评论信息。例如,该待分析信息的评论信息中最新的第一预设数量条评论信息、该待分析信息的评论信息中最近预设时长内发表的评论信息、该待分析信息的评论信息中长度达到预设长度的评论信息等。S102:计算待处理评论信息包含的词在待处理评论信息中的重要性程度。待处理评论信息包括的词由待分析信息的阅读者在发表评论信息时所使用的语言决定。例如,在上述阅读者发表评论信息时使用的语言为中文的情况下,上述待处理评论信息包含的词可以为中文中的单字词、多字词等,如,好、新闻、美丽、欢乐等等。在上述阅读者发表评论信息时使用的语言为英文的情况下,上述待处理评论信息包含的词可以为英文中的单词,如,news、happy、apple等。鉴于上述情况,上述待处理评论信息包含的词还可以为日文词、法文词等等,本申请实施例并不对此进行限定。本申请的一个实施例中,待处理评论信息中包含的词可以通过分词处理得到。具体的,可以采用现有技术中的分词处理算法实现上述分词处理,这里不再详述。另外,在计算待处理评论信息包含的词在待处理评论信息中的重要性程度时,可以依据各个词在待处理评论信息中出现的次数、词性等信息中的至少一种计算得到。计算上述重要性程度的具体方式可以参见如下图2所示实施例,这里暂不详述。对于一个词而言,上述词性是本文档来自技高网...

【技术保护点】
1.一种情感倾向信息获得方法,其特征在于,所述方法包括:/n获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;/n计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;/n按照计算得到的重要性程度由高到低的顺序,从所述待处理评论信息包含的词中,选择对所述待处理评论信息具有表征性的词;/n根据所选择的词,获得所述待分析信息的情感倾向信息。/n

【技术特征摘要】
1.一种情感倾向信息获得方法,其特征在于,所述方法包括:
获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;
计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;
按照计算得到的重要性程度由高到低的顺序,从所述待处理评论信息包含的词中,选择对所述待处理评论信息具有表征性的词;
根据所选择的词,获得所述待分析信息的情感倾向信息。


2.根据权利要求1所述的方法,其特征在于,所述计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度,包括:
对所述待处理评论信息进行分词处理,获得第一处理结果;
去除所述第一处理结果中的停用词,获得第二处理结果,其中,所述停用词为:预先设定的不具有感情色彩的词和/或对文本内容不具有表征性的词;
计算所述第二处理结果中各个词在所述待处理评论信息中的重要性程度。


3.根据权利要求2所述的方法,其特征在于,所述计算所述第二处理结果中各个词在所述待处理评论信息中的重要性程度,包括:
统计所述第二处理结果中所包含词的总数和各个词出现的次数;
针对所述第二处理结果中的每一词,获得预设的信息库中包含该词的信息的数量,并按照以下表达式计算该词的第一表征值和第二表征值:






其中,S1表示所述第一表征值,S2表示所述第二表征值,Num1表示所述第二处理结果中该词出现的次数,Num2表示所述第二处理结果中所包含词的总数,Num3所述信息库中所包含信息的总数,Num4表示所述信息库中包含该词的信息的数量;
根据所述第二处理结果中各个词的第一表征值和第二表征值,分别计算各个词在所述待处理评论信息中的重要性程度。


4.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
获得样本信息的评论信息所包含的词中对所述样本信息具有表征性的样本词;
对各个样本词分别进行编码,获得各个样本词以二进制数值表示的样本编码结果;
根据所述样本编码结果,生成各个样本词对应的向量,其中,每个样本词对应的向量包含预设数量个二进制数值;
将各个样本词对应的向量输入预设的深度学习模型进行训练,获得情感倾向获得模型;
所述根据所选择的词,获得所述待分析信息的情感倾向信息,包括:
对所选择的各个词分别进行编码,获得所选择的各个词以二进制数值表示的编码结果;
根据所述编码结果,生成所选择的各个词对应的向量,其中,每个所选择的词对应的向量包含所述预设数量个二进制数值;
将所选择的各个词对应的向量输入至所述情感倾向获得模型,获得所述待分析信息的情感倾向信息。


5.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据所选择的词,获得所述待分析信息的情感倾向信息,包括:
确定所选择的词的感情色彩;
针对所确定的每一感情色彩,统计所选择的词中属于该感情色彩的词的数量;
根据统计得到的数量,获得所述待分析信息的情感倾向信息。


6.一种情感倾向信息获得装置,其特征在于,所述装置包括:
评论信息获取模块,用于获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;
重要性程度计算模块,用于计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;
词选择模块,用于...

【专利技术属性】
技术研发人员:孙尚勇
申请(专利权)人:新华三信息安全技术有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1