一种面向推荐服务的情感分析方法技术

技术编号：21850908 阅读：25 留言：0更新日期：2019-08-14 00:24

本发明专利技术涉及一种面向推荐服务的情感分析方法，该方法具体包括：步骤1)推荐服务系统收集包括文本声调或语音音调在内的用户情感语料，并对所述用户情感语料进行处理，获得文本分类第一语料和第二语料；步骤2)采用卡方统计的方法，从第二语料中选出一部分词来构建同义词替换词库，并通过该同义词替换词库来扩展文本分类第一语料；步骤3)采用转换工具，将步骤2)中扩展后的文本分类第一语料转换成带声调的拼音语料，并构建字母表对该拼音语料使用独热编码进行ONE‑HOT量化，输入基于卷积神经网络搭建好的分类器中进行分类，通过结合推荐算法和情感分类结果建模，为用户提供推荐服务。

An Emotional Analysis Method for Recommendation Service

全部详细技术资料下载

【技术实现步骤摘要】
一种面向推荐服务的情感分析方法
本专利技术属于推荐服务和情感分析
，具体涉及一种面向推荐服务的情感分析方法。
技术介绍
目前，推荐系统如今已经成为了人们生活中必不可少的工具，帮助人们更方便的获取到自己想要的结果。当前，大多数的大型购物网站的推荐系统是基于评分的推荐系统，商家出于商业方面的考虑，往往会通过雇佣人的方式对大型购物网站进行刷分。因此，评分分数的高低并不能很好的帮助用户进行推荐。现实中，由于每个人评分标准不同，有的人倾向给高分，有的人倾向给低分；而评论往往是出自个人的心中所想，一般含有比较有价值的反馈，因而评论更能反映一个用户的个性化需求。推荐系统采用了两种推荐技术：协同过滤(CollaborativeFilteringRecommendation，简写CFR)和内容过滤(ContentBasedRecommendation，简写为CBR)。其中，协同过滤已经被广泛应用于商业化的推荐系统中，协同过滤进一步包括：基于用户的协同推荐和基于项目的协同推荐；根据用户的评分，计算用户或者项目之间的相似度，进而推荐相似邻居或者相似项目。情感在人类智慧中发挥了重要作用；理性的决策、社交、创新和人类的生活都离不开情感。对于情感的分析，实际上就是对信息进行挖掘和分析，通过大众对媒体的评论了解人们对其内容的看法，得到他们的情感倾向。对文本的情感分析事实上也就是对文本中的主观信息进行倾向性分析和强度分析，这些主观信息都反映了大众的喜好以及个人的诉求。针对情感分析的研究已经成为国内外相关领域的研究热点。在中文文本情感分析的研究上，2012年，王振宇等人提出了基于Ho...

【技术保护点】
1.一种面向推荐服务的情感分析方法，其特征在于，该方法具体包括：步骤1)推荐服务系统收集包括文本声调或语音音调在内的用户情感语料，并对所述用户情感语料进行处理，获得文本分类第一语料和第二语料；步骤2)采用卡方统计的方法，从第二语料中选出一部分词来构建同义词替换词库，并通过该同义词替换词库来扩展文本分类第一语料；步骤3)采用转换工具，将步骤2)中扩展后的文本分类第一语料转换成带声调的拼音语料，并构建字母表对该拼音语料使用独热编码进行ONE‑HOT量化，输入基于卷积神经网络搭建好的分类器中进行分类，通过结合推荐算法和情感分类结果建模，为用户提供推荐服务。

【技术特征摘要】
1.一种面向推荐服务的情感分析方法，其特征在于，该方法具体包括：步骤1)推荐服务系统收集包括文本声调或语音音调在内的用户情感语料，并对所述用户情感语料进行处理，获得文本分类第一语料和第二语料；步骤2)采用卡方统计的方法，从第二语料中选出一部分词来构建同义词替换词库，并通过该同义词替换词库来扩展文本分类第一语料；步骤3)采用转换工具，将步骤2)中扩展后的文本分类第一语料转换成带声调的拼音语料，并构建字母表对该拼音语料使用独热编码进行ONE-HOT量化，输入基于卷积神经网络搭建好的分类器中进行分类，通过结合推荐算法和情感分类结果建模，为用户提供推荐服务。2.根据权利要求1所述的情感分析方法，其特征在于，所述步骤1)具体包括：采用分词工具对所述用户情感语料进行两次处理：第一，直接对所述用户情感语料进行切分，保留所有词汇，去除标点符号，将包含汉语的语料作为文本分类第一语料；第二，将文本分类第一语料进行分词后，过滤所有标点符号和无意义的特殊词，只保留含有语义信息的词，作为第二语料；其中，所述无意义的特殊词包括：时间词、量词、介词、助词、叹词、语气词和拟声词。3.根据权利要求2所述的情感分析方法，其特征在于，所述步骤1)具体包括：采用结巴分词，对语料采取了两次处理；第一，使用结巴分词的精确模式，保留所有词汇，去除标点符号，将包含汉语的语料作为文本分类第一语料；第二，采用结巴分词和自然语言处理与信息检索汉语分词系统兼容的标记法，将文本分类第一语料进行分词后，标注句子中每个词的词性，过滤所有标点符号，和无意义的特殊词只保留含有语义信息的词，作为第二语料。4.根据权利要求1所述的情感分析方法，其特征在于，所述步骤2)具体包括：利用卡方统计的方法，从第二语料中选取Top-N个关键词构建同义词词库；其中，N的大小由第二语料的词语数目来决定；其中，所述卡方统计方法是用来衡量两个变量间的相关性，具体为：在文本分类的问题特征选择阶段，主要判断一个特征词和一个类别之间是否相互独立；如果一个特征词和一...

【专利技术属性】
技术研发人员：盛益强，王星凯，赵震宇，
申请(专利权)人：中国科学院声学研究所，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人