文本情感分析的方法及装置制造方法及图纸

技术编号:14886796 阅读:123 留言:0更新日期:2017-03-25 20:13
本发明专利技术涉及自然语言处理技术领域,提供了一种文本情感分析的方法及装置。所述文本情感分析的方法包括以下步骤:获取原始语料,使用带有条件随机场的双向LSTM神经网络对所述原始语料的语句中的情感表达目标进行分析和识别;统计识别出的所述情感表达目标的数量,并根据所述情感表达目标的数量将所述语句判断为无情感表达目标的语句、带有一个情感表达目标的语句或带有多个情感表达目标的语句;将所述原始语料中的无情感表达目标的语句、带有一个情感表达目标的语句和/或带有多个情感表达目标的语句分别输入到三个一维卷积神经网络中进行情感分类,得到情感分类结果。本发明专利技术提高了文本情感分类的效率、准确性和容错性,能满足大规模语料处理的需求。

【技术实现步骤摘要】

本专利技术属于自然语言处理
,尤其涉及一种文本情感分析的方法及装置
技术介绍
对文本情感数据进行自动化分析一直是人工智能、自然语言处理技术的一个重要研究及应用
,其主要功能是通过自然语言处理技术和情感计算技术,自动分析和学习文本数据中蕴含的情感表达,根据情感表达将句子分为正面、负面和中性三种类别。随着信息技术的不断发展和信息系统应用范围的不断深化,对文本数据进行自动化情感分析是提高企业生产效率和竞争优势的重要技术措施。目前,语句级文本情感分析相关传统的分析方法多采用同一模型处理同一数据集下的所有句子,忽略了不同句子类别表达情感的差异。近年来,随着互联网和高性能计算的快速发展,尤其是深度学习技术的发展,如何优化已有语句级文本情感分析的方法,越来越引起相关科研工作者的关注。其中一种行之有效的优化方法是采用“分而治之”的策略,先对句子进行分类,然后在不同类别中微调情感分类器,提高分类器的性能。常见的基于句子类别判断的文本情感分析的方法主要是通过人工抽取、过滤、清洗特定类别的句子,然后在处理好的数据集上进行文本情感分析。常见的句子类别分类包括:主客观句分类、情感目标相关句情感分类、对比较句的情感分类、对否定句的情感分类、对条件句的情感分类以及对反讽句的情感分类。这些都需要人工收集和整理特定句子类别的句子作为有监督情感分类器的训练数据,无法对真实环境下的语句直接进行句子类别判断和情感分析。对于需要处理大量文本数据的行业而言,采用传统的文本情感分析的方法对文本数据进行情感分类,不仅准确度差,而且工作效率也很低。
技术实现思路
本专利技术的目的在于提供一种文本情感分析的方法及装置,旨在提高文本情感分类的效率、准确性和容错性,满足大规模语料处理的需求。本专利技术是这样实现的,一种文本情感分析的方法,所述方法包括以下步骤:步骤S1,获取原始语料,使用带有条件随机场的双向LSTM神经网络对所述原始语料的语句中的情感表达目标进行分析和识别;步骤S2,统计识别出的所述情感表达目标的数量,根据所述情感表达目标的数量将所述语句判断为无情感表达目标的语句、带有一个情感表达目标的语句或带有多个情感表达目标的语句;步骤S3,将所述原始语料中的无情感表达目标的语句、带有一个情感表达目标的语句和/或带有多个情感表达目标的语句分别输入到三个一维卷积神经网络中进行情感分类,得到情感分类结果。本专利技术的进一步的技术方案是,所述获取原始语料,使用带有条件随机场的双向LSTM神经网络对所述原始语料的语句中的情感表达目标进行分析和识别的步骤包括:步骤S101,将所述语句分割成词汇;步骤S102,将所述词汇输入到带有条件随机场的双向LSTM神经网络,得到BIO序列标记;步骤S103,统计所述语句对应的BIO序列标记的数量,将不带有BIO序列标记的句子归类为无情感表达目标的句子,将带有一个B标记的句子归类为带有一个情感表达目标的句子,将带有多个B标记的句子归类为带有多个情感表达目标的句子;其中,B表示情感表达目标开始词,I表示情感表达目标中间词或者结尾词;O表示非情感表达目标词。本专利技术的进一步的技术方案是,所述步骤S3还包括以下步骤:步骤S301,将所述无情感表达目标的句子、带有一个情感表达目标的句子和/或带有多个情感表达目标的句子集合作为训练数据分别输入到三个一维卷积神经网络,对所述一维卷积神经网络进行训练和优化。本专利技术的进一步的技术方案是,所述情感表达目标可以为情感表达作用的实体。本专利技术的进一步的技术方案是,在所述步骤S3之后还包括:步骤S4,输出所述情感分类结果。本专利技术还提供了一种文本情感分析的装置,所述装置包括:预处理模块、情感表达目标分类模块及情感分类模块;其中,所述预处理模块,用于获取原始语料,使用带有条件随机场的双向LSTM神经网络对所述原始语料的语句中的情感表达目标进行分析和识别;所述情感表达目标分类模块,用于统计识别出的所述情感表达目标的数量,并根据所述情感表达目标的数量将所述语句判断为无情感表达目标的语句、带有一个情感表达目标的语句或带有多个情感表达目标的语句;所述情感分类模块,用于将所述原始语料中的无情感表达目标的语句、带有一个情感表达目标的语句和/或带有多个情感表达目标的语句分别输入到三个一维卷积神经网络中进行情感分类,得到情感分类结果。本专利技术的进一步的技术方案是,所述预处理模块还包括分割单元及序列标注预测单元;其中,所述分割单元用于将所述语句分割成词汇;所述序列标注预测单元用于:分析所述词汇带有BIO序列标记的数量,将不带有BIO序列标记的句子归类为无情感表达目标的句子,将带有一个B标记的句子归类为带有一个情感表达目标的句子,将带有多个B标记的句子归类为带有多个情感表达目标的句子;其中,B表示情感表达目标开始词,I表示情感表达目标中间词或者结尾词;O表示非情感表达目标词。本专利技术的进一步的技术方案是,所述情感分类模块还用于将所述无情感表达目标的句子、带有一个情感表达目标的句子和/或带有多个情感表达目标的句子集合作为训练数据分别输入到三个一维卷积神经网络,对所述一维卷积神经网络进行训练和优化。本专利技术的进一步的技术方案是,所述情感表达目标可以为情感表达作用的实体。本专利技术的进一步的技术方案是,所述文本情感分析的装置还包括结果输出模块,所述结果输出模块,用于输出所述情感分类结果。本专利技术的有益效果是:本专利技术提供的文本情感分析的方法及装置,通过上述方案:获取原始语料,使用带有条件随机场的双向LSTM神经网络对所述原始语料的语句中的情感表达目标进行分析和识别;统计识别出的所述情感表达目标的数量,根据所述情感表达目标的数量将所述语句判断为无情感表达目标的语句、带有一个情感表达目标的语句或带有多个情感表达目标的语句;将所述原始语料中的无情感表达目标的语句、带有一个情感表达目标的语句和/或带有多个情感表达目标的语句分别输入到三个一维卷积神经网络中进行情感分类,得到情感分类结果,提高了文本情感分类的效率、准确性和容错性,满足了大规模语料处理的需求。附图说明图1是本专利技术文本情感分析的方法第一实施例的流程示意图;图2是本专利技术文本情感分析的方法第二实施例的流程示意图;图3是本专利技术文本情感分析的方法BIO标记结果示意图;图4是本专利技术文本情感分析的方法第三实施例的流程示意图;图5是本专利技术文本情感分析的装置第一实施例的功能模块示意图;图6是本专利技术文本情感分析的装置第二实施例的功能模块示意图;图7是本专利技术文本情感分析的装置第三实施例的功能模块示意图。附图标记:预处理模块-10;情感表达目标分类模块-20;情感分类模块-30;分割单元-40序列标注预测单元-50;结果输出模块-60。具体实施方式本专利技术实施例的解决方案主要是:获取原始语料,使用带有条件随机场的双向LSTM神经网络对原始语料的语句中的情感表达目标进行分析和识别;统计识别出的情感表达目标的数量,并根据情感表达目标的数量将语句判断为无情感表达目标的语句、带有一个情感表达目标的语句或带有多个情感表达目标的语句;将原始语料中的无情感表达目标的语句、带有一个情感表达目标的语句和/或带有多个情感表达目标的语句分别输入到三个一维卷积神经网络中进行情感分类,得到情感分类结果。本专利技术通过上述方案提高本文档来自技高网...
文本情感分析的方法及装置

【技术保护点】
一种文本情感分析的方法,其特征在于,所述方法包括以下步骤:步骤S1,获取原始语料,使用带有条件随机场的双向LSTM神经网络对所述原始语料的语句中的情感表达目标进行分析和识别;步骤S2,统计识别出的所述情感表达目标的数量,根据所述情感表达目标的数量将所述语句判断为无情感表达目标的语句、带有一个情感表达目标的语句或带有多个情感表达目标的语句;步骤S3,将所述原始语料中的无情感表达目标的语句、带有一个情感表达目标的语句和/或带有多个情感表达目标的语句分别输入到三个一维卷积神经网络中进行情感分类,得到情感分类结果。

【技术特征摘要】
1.一种文本情感分析的方法,其特征在于,所述方法包括以下步骤:步骤S1,获取原始语料,使用带有条件随机场的双向LSTM神经网络对所述原始语料的语句中的情感表达目标进行分析和识别;步骤S2,统计识别出的所述情感表达目标的数量,根据所述情感表达目标的数量将所述语句判断为无情感表达目标的语句、带有一个情感表达目标的语句或带有多个情感表达目标的语句;步骤S3,将所述原始语料中的无情感表达目标的语句、带有一个情感表达目标的语句和/或带有多个情感表达目标的语句分别输入到三个一维卷积神经网络中进行情感分类,得到情感分类结果。2.根据权利要求1所述的文本情感分析的方法,其特征在于,所述步骤S1包括以下步骤:步骤S101,将所述语句分割成词汇;步骤S102,将所述词汇输入到带有条件随机场的双向LSTM神经网络,得到BIO序列标记;步骤S103,统计所述语句对应的BIO序列标记的数量,将不带有BIO序列标记的句子归类为无情感表达目标的句子,将带有一个B标记的句子归类为带有一个情感表达目标的句子,将带有多个B标记的句子归类为带有多个情感表达目标的句子;其中,B表示情感表达目标开始词,I表示情感表达目标中间词或者结尾词;O表示非情感表达目标词。3.根据权利要求1所述的文本情感分析的方法,其特征在于,所述步骤S3还包括以下步骤:步骤S301,将所述无情感表达目标的句子、带有一个情感表达目标的句子和/或带有多个情感表达目标的句子集合作为训练数据分别输入到三个一维卷积神经网络,对所述一维卷积神经网络进行训练和优化。4.根据权利要求1-3任意一项所述的文本情感分析的方法,其特征在于,所述情感表达目标可以为情感表达作用的实体。5.根据权利要求4所述的文本情感分析的方法,其特征在于,在所述步骤S3之后还包括以下步骤:步骤S4,输出所述情感分类结果。6.一种文本情感...

【专利技术属性】
技术研发人员:徐睿峰陈涛黄锦辉
申请(专利权)人:哈尔滨工业大学深圳研究生院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1