一种新闻文本情绪倾向分析方法技术

技术编号：10051705 阅读：235 留言：0更新日期：2014-05-15 23:04

本发明专利技术提出了一种新闻文本情绪倾向分析方法，该方法包括以下步骤：拆解文本成若干个句子，每个句子包括至少一个分句，且每个分句包括至少一个词汇；分析每个词汇的属性，其中属性为乐观词汇、悲观词汇、非情绪词汇及否定修饰词汇中的一种；累计每个分句中所有词汇的属性，以推算出每个分句的情绪倾向；以单个句子为单位累加每个分句的情绪倾向，从而计算出文本情绪倾向熵值，以决定文本的情绪倾向。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术提出了，该方法包括以下步骤：拆解文本成若干个句子，每个句子包括至少一个分句，且每个分句包括至少一个词汇；分析每个词汇的属性，其中属性为乐观词汇、悲观词汇、非情绪词汇及否定修饰词汇中的一种；累计每个分句中所有词汇的属性，以推算出每个分句的情绪倾向；以单个句子为单位累加每个分句的情绪倾向，从而计算出文本情绪倾向熵值，以决定文本的情绪倾向。【专利说明】
本专利技术涉及，尤其涉及一种使用有限状态自动机与熵值的新闻文本情绪倾向分析方法。
技术介绍
财经领域的新闻文本情绪倾向分析的相关研究证实，财经新闻的内容常会影响金融市场的股票价格、交易量，甚至公司未来的营收；因此具有重要的实际运用价值。目前有关新闻文本情绪倾向分析的现有技术中，已存在利用机器学习技术来自动判断财经新闻的情绪倾向为乐观或悲观的技术。但是该技术尚须经过情绪语言的模型训练与测试，所以必须收集相当大数量的历史数据用于训练，以及必须先行计算语料的词汇机率分布等数据，故其应用上较受限制，存在进一步改善的空间。因此，如何进一步改善新闻文本情绪倾向分析的现有技术，以使其无须经过情绪语言的模型训练与测试，以及无须计算语料的词汇机率分布，并提高使用效率，是需要进一步探讨的课题。
技术实现思路
本专利技术主要目的在于提出。本专利技术提供的新闻文本情绪倾向分析方法，包括以下步骤:提供一情绪词汇库、一否定修饰词汇库与一有限状态自动机(finite state automata);对新闻文本进行分句分词处理，以产生若干个句子，其中每个句子包括至少一个子句，且每个子句包括至少一个词汇；使用情绪词汇...

【技术保护点】
一种新闻文本情绪倾向分析方法，其特征在于，包括以下步骤：提供一情绪词汇库、一否定修饰词汇库与一有限状态自动机；对新闻文本进行分句分词处理，以产生若干个句子，其中每个句子包括至少一个子句，且每个子句包括至少一个词汇；使用所述情绪词汇库与所述否定修饰词汇库对所述若干个句子以及每个分句的每个词汇进行词汇比对，以标示每个词汇为乐观词汇、悲观词汇、非情绪词汇或否定修饰词汇；依据词汇比对结果，将每个词汇分别转换为一个代表符号；使用所述有限状态自动机与所述代表符号，以推算每个分句的情绪倾向属于乐观、悲观或中性；以句子为单位分别累加新闻文本中每个句子所包含的每个分句的每种情绪倾向后，计算经累加后所有句子所对应的每种情绪倾向的熵值；依据计算出的熵值决定所述新闻文本的情绪倾向属于乐观、悲观或中性。

【技术特征摘要】
...

【专利技术属性】
技术研发人员：卢阳正，陈振南，柯淑津，魏裕珍，
申请(专利权)人：铭传大学，
类型：发明
国别省市：台湾;71

全部详细技术资料下载我是这个专利的主人