【技术实现步骤摘要】
一种端到端的基于方面的情感分析方法
本专利技术涉及自然语言处理领域,特别涉及一种端到端的基于方面的情感分析方法。
技术介绍
情感分析主要应用与互联网产生的大量非结构化数据,通过情感分析技术,将其转换为结构化数据,从而得到网友对于一些事情事物的看法及态度,在商业应用以及舆情分析中有着很重要的应用。通常,在分析目标的情感时,可能不仅对整体的情感态度感兴趣,而且对目标的各个方面的情感态度有兴趣,而这就是基于方面的情感分析。现在的主要情感分析方法有基于字典的跟机器学习的。其中机器学习领域中的深度学习应用更加广泛,被越来越多的研究人员研究。但是目前的情感分析的深度学习模型比较复杂,利用了各种辅助结构,模型比较繁琐。例如为了解决方面短语跟观点短语关系以及标签序列之间的关系,分别引入辅助结构去解决问题。为了解决以上的问题,我们提供了一种端到端的基于方面的情感分析方法。上述系统是一种端到端的,不需要任何辅助结构的模型,模型通俗易懂,结构比较简单,而且解决了上述的那些辅助结构解决的问题,模型的效果更好。专利技术 ...
【技术保护点】
1.一种端到端的基于方面的情感分析方法,其特征在于,包含如下步骤:/nS1,确定情感分析的数据集,所述数据集包括训练集、验证集和测试集;/nS2,读入数据集,对数据集进行标记,并导入词向量;/nS3,通过pytorch库搭建设计的模型,输入相应的数据,并得到相应的输出;/nS4,利用训练集,验证集对模型进行训练,得到训练好的模型进而得到情感分析结果。/n
【技术特征摘要】
1.一种端到端的基于方面的情感分析方法,其特征在于,包含如下步骤:
S1,确定情感分析的数据集,所述数据集包括训练集、验证集和测试集;
S2,读入数据集,对数据集进行标记,并导入词向量;
S3,通过pytorch库搭建设计的模型,输入相应的数据,并得到相应的输出;
S4,利用训练集,验证集对模型进行训练,得到训练好的模型进而得到情感分析结果。
2.如权利要求1所述的端到端的基于方面的情感分析方法,其特征在于,所述的步骤S2包括:
S2.1,将数据集读入内存,并将数据集进行小写处理,同时将数据集的标签转换为符合的标签;
S2.2,创建字典以及标签集合,并进行标记,同时将数据集的输入语句以及对应的标签序列进行标记;
S2.3,读入预训练好的词向量。
3.如权利要求1所述的端到端的基于方面的情感分析方法,其特征在于,所述的步骤S3包括:
S3.1,搭建查找表,将数据集的输入语句进行向量化,将自然文本转化为计算机可以理解的数据;
S3.2,搭建双向长短期记忆网络层,所述的双向长短期记忆网...
【专利技术属性】
技术研发人员:董永川,邹乔莎,史传进,
申请(专利权)人:复旦大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。