The embodiment of the application provides a method and device for obtaining emotional tendency information, which relates to the field of Internet technology, wherein the method comprises: obtaining the comment information to be processed, wherein the comment information to be processed is the comment information of the information to be analyzed; calculating the importance degree of the words contained in the comment information to be processed in the comment information to be processed; calculating the importance degree of the words contained in the comment information to be processed according to the calculated From the words contained in the comment information to be processed, words with representativeness to the comment information to be processed are selected in the order of high importance to low importance; according to the selected words, emotional tendency information of the information to be analyzed is obtained. Applying the scheme provided by the embodiment of the application, emotional tendency information of the information can be obtained.
【技术实现步骤摘要】
一种情感倾向信息获得方法及装置
本申请涉及互联网
,特别是涉及一种情感倾向信息获得方法及装置。
技术介绍
随着互联网技术的快速发展,互联网能够为用户提供的信息越来越广泛。而上述各种信息往往会具有情感倾向。例如,一条信息的情感倾向可以是表示正面情绪的情感倾向、表示负面情绪的情感倾向等。由于具有负面情绪的信息可能会为广大用户带来不良影响,为此,需要获得信息的情感倾向信息,然后根据情感倾向信息对互联网提供的各种信息进行监控。鉴于上述情况,需要提供一种获得信息的情感倾向信息的方案。
技术实现思路
本申请实施例的目的在于提供一种情感倾向信息获得方法及装置,以获得信息的情感倾向信息。具体技术方案如下:第一方面,本申请实施例提供了一种情感倾向信息获得方法,所述方法包括:获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;按照计算得到的重要性程度由高到低的顺序,从所述待处理评论信息包含的词中,选择对所述待处理评论信息具有表征性的词;根据所选择的词,获得所述待分析信息的情感倾向信息。第二方面,本申请实施例提供了一种情感倾向信息获得装置,所述装置包括:评论信息获取模块,用于获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;重要性程度计算模块,用于计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;词选择模块,用于按照计算得到的重要性 ...
【技术保护点】
1.一种情感倾向信息获得方法,其特征在于,所述方法包括:/n获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;/n计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;/n按照计算得到的重要性程度由高到低的顺序,从所述待处理评论信息包含的词中,选择对所述待处理评论信息具有表征性的词;/n根据所选择的词,获得所述待分析信息的情感倾向信息。/n
【技术特征摘要】
1.一种情感倾向信息获得方法,其特征在于,所述方法包括:
获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;
计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;
按照计算得到的重要性程度由高到低的顺序,从所述待处理评论信息包含的词中,选择对所述待处理评论信息具有表征性的词;
根据所选择的词,获得所述待分析信息的情感倾向信息。
2.根据权利要求1所述的方法,其特征在于,所述计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度,包括:
对所述待处理评论信息进行分词处理,获得第一处理结果;
去除所述第一处理结果中的停用词,获得第二处理结果,其中,所述停用词为:预先设定的不具有感情色彩的词和/或对文本内容不具有表征性的词;
计算所述第二处理结果中各个词在所述待处理评论信息中的重要性程度。
3.根据权利要求2所述的方法,其特征在于,所述计算所述第二处理结果中各个词在所述待处理评论信息中的重要性程度,包括:
统计所述第二处理结果中所包含词的总数和各个词出现的次数;
针对所述第二处理结果中的每一词,获得预设的信息库中包含该词的信息的数量,并按照以下表达式计算该词的第一表征值和第二表征值:
其中,S1表示所述第一表征值,S2表示所述第二表征值,Num1表示所述第二处理结果中该词出现的次数,Num2表示所述第二处理结果中所包含词的总数,Num3所述信息库中所包含信息的总数,Num4表示所述信息库中包含该词的信息的数量;
根据所述第二处理结果中各个词的第一表征值和第二表征值,分别计算各个词在所述待处理评论信息中的重要性程度。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
获得样本信息的评论信息所包含的词中对所述样本信息具有表征性的样本词;
对各个样本词分别进行编码,获得各个样本词以二进制数值表示的样本编码结果;
根据所述样本编码结果,生成各个样本词对应的向量,其中,每个样本词对应的向量包含预设数量个二进制数值;
将各个样本词对应的向量输入预设的深度学习模型进行训练,获得情感倾向获得模型;
所述根据所选择的词,获得所述待分析信息的情感倾向信息,包括:
对所选择的各个词分别进行编码,获得所选择的各个词以二进制数值表示的编码结果;
根据所述编码结果,生成所选择的各个词对应的向量,其中,每个所选择的词对应的向量包含所述预设数量个二进制数值;
将所选择的各个词对应的向量输入至所述情感倾向获得模型,获得所述待分析信息的情感倾向信息。
5.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据所选择的词,获得所述待分析信息的情感倾向信息,包括:
确定所选择的词的感情色彩;
针对所确定的每一感情色彩,统计所选择的词中属于该感情色彩的词的数量;
根据统计得到的数量,获得所述待分析信息的情感倾向信息。
6.一种情感倾向信息获得装置,其特征在于,所述装置包括:
评论信息获取模块,用于获取待处理评论信息,所述待处理评论信息为待分析信息的评论信息;
重要性程度计算模块,用于计算所述待处理评论信息包含的词在所述待处理评论信息中的重要性程度;
词选择模块,用于...
【专利技术属性】
技术研发人员:孙尚勇,
申请(专利权)人:新华三信息安全技术有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。