【技术实现步骤摘要】
一种面向用户行为分析的大众口碑情感分析方法
本专利技术属于文件共享系统领域,具体是一种面向用户行为分析的大众口碑情感分析方法。
技术介绍
随着全球互联网使用率的增长,越来越多的消费者会提供在线评论。如果挖掘得当,丰富的数据就会产生有用的观点。从这些数据中可以获得的一个观点是关于大众口碑(EWOM)的知识。EWOM因其对消费者行为有显著的影响而闻名。EWOM传播框架体现了采用EWOM与消费者购买意愿的直接关系和影响。EWOM可以为越来越多信任这些讯息的消费者提供客观的信息,商家也可通过这些信息进行正确的商业决策。涉及到情感分析的意见挖掘是一套用于识别文本中所表达的情感、意见和作者态度,并将其转化为有意义的信息,最后将其用于商业决策的过程。情感分类属于意见挖掘的一部分,它是对文本中对意见和论据的识别,试图寻找评论中涉及积极、消极或者中立的意见描述。情感分析作为一种典型的利用自然语言处理、计算机语言学和文本分析来确定文本内主观信息和情感的技术受到了广泛的关注,并在许多领域得到了普遍的应用。到目前为止,人们已经提出了许多方法 ...
【技术保护点】
1.一种面向用户行为分析的大众口碑情感分析方法,包括数据的收集模块、特征提取模块、机器学习模块、元分类器模块以及情感词典模块,其特征在于,所述数据的收集模块与特征提取模块单向连接,所述特征提取模块与机器学习模块单向连接,所述机器学习模块与元分类器模块单向连接,所述元分类器模块与情感词典模块单向连接,所述数据的收集模块包括数据收集以及预处理,所述机器学习模块包括学习模块以及分类模块,所述学习模块采用半监督学习,所述元分类器模块包括利益/风险分类器、信任/不信任服务分类器、信任/不信任约会者分类器以及正面社会影响/负面社会影响分类器四个基分类器;/n所述数据收集在于采用爬虫软件 ...
【技术特征摘要】
1.一种面向用户行为分析的大众口碑情感分析方法,包括数据的收集模块、特征提取模块、机器学习模块、元分类器模块以及情感词典模块,其特征在于,所述数据的收集模块与特征提取模块单向连接,所述特征提取模块与机器学习模块单向连接,所述机器学习模块与元分类器模块单向连接,所述元分类器模块与情感词典模块单向连接,所述数据的收集模块包括数据收集以及预处理,所述机器学习模块包括学习模块以及分类模块,所述学习模块采用半监督学习,所述元分类器模块包括利益/风险分类器、信任/不信任服务分类器、信任/不信任约会者分类器以及正面社会影响/负面社会影响分类器四个基分类器;
所述数据收集在于采用爬虫软件获取评论数据,并使用深度收集策略来收集网站数据;
所述预处理通过删除重复、停用字、特殊字符以及对分词、否定的识别等操作将汉语句子分隔成词语序列;
所述特征提取模块即为将非结构化数据进行分类,将其转化为结构化数据和适度的非结构化文本数据,并生成用于机器学习模型的特征集;
所述半监督学习为机器通过对少量有标注文本和大量无标注文本的情感识别来学习构建分类模型;
所述分类模块通过学习的结果对特征提取模块传递来的数据进行情感分类,并将分类结果传输至元分类器模块中
所述元分类器模块中每个基分类器都以四类特征中的一种为基础,并使用逻辑回归模型进行组合;
所述情感词典模块是机器学习和情感词典相结合,情感词典是包含众多情感词语的词汇库,每个情感词语都可以表示其对应特征情感的程度,机器学习利用情感词典进行分类,同时情感词典通过机器分类得到进一步完善,并进一步对机器学习的分类结果进行修正;
所述一种面向用户行为分析的大众口碑情感分析方法为:
1)从ODS中获取数据;
2)通过特征选择将获取的非结构化文本数据转换为结构化数据;
3)然后分别从八个特征方面对个体的情感进行分类,分为利益/风险分类器、信任/不信任服务分类器、信任/不信任约会者分类器、正面社会影响/负面社会影响分类器等四个分类器;
4)将四个分类器的输出作为元分类器的输入特征;
5)建立的情感词典修正这四个分类器的错误预测结果;
6)将正确的结果导出。
2.根据权利要求1所述的一种面向用户行为分析的大众口碑情感分析方法,其特征在于,所述特征提取模块的工作步骤具体如下:
步骤一:首先在用户评论集合D中计算单词wi与wj的相似度Wij,采用公式来计算wi和wj的相似度,所述P(wi,wj)表示两个单词wi和wj同时出现的概率,所述P(wi)以及P(wj)分别表示评论中出现wi和wj的概率;
步骤二:将评论表示成一个由“词项-词项”组成的矩阵,其中每一行和每一列表示唯一的词项,矩阵中的值表示评论中每个单词对的相似度得分,之后通过公式计算得出单词wi的上下文相关度,所述n表示D中的词项数量;
步骤三:通过得到的单词wi的上下文相关度确定“词项-词项”矩阵是否为特征;
步骤四:重...
【专利技术属性】
技术研发人员:李慧,高超,张舒,樊宁,李子琦,杨玉,
申请(专利权)人:江苏海洋大学,江苏省海洋资源开发研究院连云港,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。