当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于深度学习的中文文本情感分析方法技术

技术编号:17779933 阅读:25 留言:0更新日期:2018-04-22 08:33
本发明专利技术公开了一种基于深度学习的中文文本情感分析方法,对网络文本进行获取,合理设计中文句子到数学向量的转换逻辑,首先用中文分词技术结合词向量学习工具构造词向量词典,然后用LSTM‑MP模型进行句向量转化,最终通过Softmax分类器将代表句向量进行正负面情感分类,达到情感分析的目的,该算法分类准确率高、效率高、灵活度高且避免了有监督学习方法的大量人工作业,有效地提高了文本情感倾向分类的效率和正确率,自动化集成度高节省大量人力。

【技术实现步骤摘要】
一种基于深度学习的中文文本情感分析方法
本专利技术涉及一种基于深度学习的中文文本情感分析方法,属于自然语言处理和深度学习

技术介绍
互联网的迅速发展使微博和社交网络成为流行的沟通交流形式。数以亿计反映人们观点和态度的信息每天通过Twitter、Facebook等平台发布并和所有人分享,这就给监控和分析私人企业或社会公共领域观点、情绪提供了机会。文本情感分析是对人们的观点、情绪、态度以及对诸如产品、服务、组织、事件等实体情感倾向做出有效分析然后进一步做信息归纳推理的一类技术。针对网络媒介产生的海量数据,提取出有价值的情绪和观点,并对其做出准确的文本情感分析,在诸多领域都有应用价值,例如:企业可以依据与其产品相关的反馈情绪进行售后服务调整及市场策略制定;政府可以根据社交平台的大量文本情绪分析制定出更加符合群众需求的政策制度;金融方面也可以根据各种金融消息的情绪观点提取挖掘进行某一金融市场的趋势预测等。文本(英文)情感分析方面的研究在国外进行的比较早,成果也比较成熟,比如:Turney和Pang分别用不同的方法实现产品和电影评论的极性分类,随后Pang和Snyder又将多种方法结本文档来自技高网...
一种基于深度学习的中文文本情感分析方法

【技术保护点】
一种基于深度学习的中文文本情感分析方法,其特征在于:包括以下步骤,步骤1,训练LSTM‑MP模型和Softmax分类器;具体过程如下:获取网络文本;对获得的网络文本进行预处理,得到网络文本中的中文句子;对中文句子进行中文分词并构建词向量词典;将若干中文句子进行人工标注,作为LSTM‑MP模型实验数据,其余中文句子作为LSTM‑MP模型训练数据;用LSTM‑MP模型训练数据训练LSTM‑MP模型;用训练好的LSTM‑MP模型将LSTM‑MP模型实验数据全部转换为句向量;将若干句向量作为Softmax分类器训练数据,其余句向量作为Softmax分类器测试数据;用Softmax分类器训练数据训练So...

【技术特征摘要】
1.一种基于深度学习的中文文本情感分析方法,其特征在于:包括以下步骤,步骤1,训练LSTM-MP模型和Softmax分类器;具体过程如下:获取网络文本;对获得的网络文本进行预处理,得到网络文本中的中文句子;对中文句子进行中文分词并构建词向量词典;将若干中文句子进行人工标注,作为LSTM-MP模型实验数据,其余中文句子作为LSTM-MP模型训练数据;用LSTM-MP模型训练数据训练LSTM-MP模型;用训练好的LSTM-MP模型将LSTM-MP模型实验数据全部转换为句向量;将若干句向量作为Softmax分类器训练数据,其余句向量作为Softmax分类器测试数据;用Softmax分类器训练数据训练Softmax分类器,用Softmax分类器测试数据测试训练好的Softmax分类器;步骤2,用训练好的LSTM-MP模型和Softmax分类器进行情感分析。2.根据权利要求1所述的一种基于深度学习的中文文本情感分析方法,其特征在于:设计多线程爬虫进行网络文本获取的过程为,选取适当的网站首页URL初始化爬虫的URL列表;获取各网站首页的HTML文档,解析出HTML文档中消息对应的URL,对消息对应的URL去重后添加至URL列表;若有新发布的消息,则将新消息对应的URL添加至URL列表;根据URL获取对应的HTML文档;将获取到的HTML文档,利用信息抽取技术进行信息抽取,抽取出页面的信息正文部分...

【专利技术属性】
技术研发人员:严勤丁聪陈葛恒肖丽莎
申请(专利权)人:河海大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1