一种情感词语文本信息分类方法技术

技术编号：24035783 阅读：49 留言：0更新日期：2020-05-07 01:51

本发明专利技术公开了一种情感词语文本信息分类方法，包括：获取文本信息；输入文本词语；判断词性，所述判断文本中词性分为情感词、否定词、程度副词；情感词打分，情感词输入情感词词典打分，得到分值1；判断情感词前后，判断情感词前后是否对应程度副词；得到新的情感词分值2；再次判断情感词前后，得到情感词分值3；输出文本最终得分，各情感词最终得分之和；根据文本最终得分划分文本类别。本发明专利技术旨在建立一个文本信息分类模型，目的是对文本进行情感色彩打分，进而将文本划分为正向、中立、负向三个类别。

A text information classification method of emotional words

全部详细技术资料下载

【技术实现步骤摘要】
一种情感词语文本信息分类方法
本专利技术涉及文本信息分类
，具体为一种情感词语文本信息分类方法。
技术介绍
情感分类是自然语言处理(NaturalLanguageProcessing，NLP)领域中的一个典型问题，问题的描述为，给定一段文字(可以是一句话或一篇文章)，判断这篇文章所表达的情感是正向、负向还是中性的。情感分类问题本身是一个无论学术界还是工业界都广泛深入研究的话题。利用情感字典是一种解决情感分类问题的方法。首先人为设定一些情感词，如正向情感词、负向情感词，之后通过统计输入文本的正、负向情感词的占比来决定文本的情感分类。分数绝对值低的部分样本判断准确性不算高，分类不够明确。分析文本情感色彩时没有考虑语境和句间关系，容易误判如讽刺性文本等特殊文本。
技术实现思路
本专利技术的目的在于解决现有技术方案中存在的问题。本专利技术解决其技术问题所采用的技术方案是：一种情感词语文本信息分类方法，包括：获取文本信息；输入文本词语；判断词性，所述判断文本中词性分为情感词、否定词、程度副词；情感词打分，情感词输入情感词词典打分，得到分值1；判断情感词前后，判断情感词前后是否对应程度副词；得到新的情感词分值2；再次判断情感词前后，得到情感词分值3；输出文本最终得分，各情感词最终得分之和；根据文本最终得分划分文本类别。进一步的，还包括文本词典，所述文本词典包含建立情感词典、否定词词典和...

【技术保护点】
1.一种情感词语文本信息分类方法，其特征在于，包括：/n获取文本信息；/n输入文本词语；/n判断词性，所述判断文本中词性分为情感词、否定词、程度副词；/n情感词打分，情感词输入情感词词典打分，得到分值1；/n判断情感词前后，判断情感词前后是否对应程度副词；/n得到新的情感词分值2；/n再次判断情感词前后，得到情感词分值3；/n输出文本最终得分，各情感词最终得分之和；/n根据文本最终得分划分文本类别。/n

【技术特征摘要】
1.一种情感词语文本信息分类方法，其特征在于，包括：
获取文本信息；
输入文本词语；
判断词性，所述判断文本中词性分为情感词、否定词、程度副词；
情感词打分，情感词输入情感词词典打分，得到分值1；
判断情感词前后，判断情感词前后是否对应程度副词；
得到新的情感词分值2；
再次判断情感词前后，得到情感词分值3；
输出文本最终得分，各情感词最终得分之和；
根据文本最终得分划分文本类别。

2.根据权利要求1所述的情感词语文本信息分类方法，其特征在于：还包括文本词典，所述文本词典包含建立情感词典、否定词词典和程度副词词典，将每个文本对象的单词列表中的词归类，生成此个文本对象的情感词词典、否定词词典和程度副词词典。

3.根据权利要求2所述的情感词语文本信息分类方法，其特...

【专利技术属性】
技术研发人员：李春燕，苏航，李松和，武传涛，刘瑞欣，
申请(专利权)人：山东众志电子有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人