【技术实现步骤摘要】
一种航班点评的细粒度情感分类系统
本专利技术涉及自然语言处理领域,尤其涉及一种航班点评的细粒度情感分类系统。
技术介绍
情感分析是自然语言处理领域的重要问题之一,旨在利用自然语言处理和文本挖掘技术,对带有情感色彩的主观性文本进行分析、处理和抽取的过程。其中,文本的情感分类是情感分析的一项核心任务,其目标是对给定文本的情感极性进行正确分类。文本的情感分类任务主要可分为两大类,句子级别的情感分类和细粒度的情感分类。句子级别的情感分类旨在对一个句子的情感极性进行分类,而细粒度的情感分类旨在对一个句子中提及的不同对象的情感极性进行分类。例如:“这家餐厅的服务不好,但是菜做的不错。”这句话提及了两个对象,服务和餐食,他们具有相反的情感极性,细粒度的情感分类能够分别判断“服务”和“餐食”两个对象的情感极性,但是句子级别情感分类无法做到这一点。显然,在实际场景下,一个文本或句子中包含多个评论对象,并且这些评论对象的情感极性各不相同,是十分常见的现象。尤其在航空领域的一些APP中,海量的用户对自己乘坐的航班进行了点评,并且点评的内容 ...
【技术保护点】
1.一种航班点评的细粒度情感分类系统,其特征在于:系统逻辑架构上包括训练路径和测试路径两个逻辑路径,其中所述测试路径依次包括用户输入界面、数据预处理模块、情感分类模型、分类结果输出模块,所述训练路径包括数据增强模块和所述数据预处理模块;/n所述训练路径输入数据为已经得到标注的语句数据,通过所述数据增强模块处理后,得到训练样本,所述训练样本经过所述数据预处理模块处理后,得到训练数据,进而输入所述情感分类模型进行训练;/n所述测试路径为所述情感分类模型经过训练后的对外输入输出路径,具体地:用户输入界面将待测语句输入,经过所述数据预处理模块处理后得到待测数据,通过应用程序接口输入 ...
【技术特征摘要】
1.一种航班点评的细粒度情感分类系统,其特征在于:系统逻辑架构上包括训练路径和测试路径两个逻辑路径,其中所述测试路径依次包括用户输入界面、数据预处理模块、情感分类模型、分类结果输出模块,所述训练路径包括数据增强模块和所述数据预处理模块;
所述训练路径输入数据为已经得到标注的语句数据,通过所述数据增强模块处理后,得到训练样本,所述训练样本经过所述数据预处理模块处理后,得到训练数据,进而输入所述情感分类模型进行训练;
所述测试路径为所述情感分类模型经过训练后的对外输入输出路径,具体地:用户输入界面将待测语句输入,经过所述数据预处理模块处理后得到待测数据,通过应用程序接口输入所述情感分类模型进行预测,之后通过所述分类结果输出模块输出分类结果。
2.如权利要求1所述的一种航班点评的细粒度情感分类系统,其特征在于:所述数据预处理模块包括数据清洗步骤、分词处理和去停用词处理步骤,其中,所述数据清洗步骤处理方法包括:合并类别、清除表情符号、删除乱码符号、删除连续的重复标点、删除空白句子、将繁体字转化为简体字,其中,所述合并类别方法为对随机采样部分数据进行分析,将意思比较相近、没有细分必要的评论对象的类别进行合并;所述分词处理和去停用词处理步骤中,所述分词处理使用两种开源的分词工具,结巴分词器和BERT中文分词器,并引入航空领域词典,用以辅助结巴分词器,所述去停用词处理步骤根据百度的停用词表,删除句子中的停用词。
3.如权利要求2所属的一种航班点评的细粒度情感分类系统,其特征在于:所述情感分类模型首先对进行预处理后的句子在输入模型之前将句子中的词转化为对应的词向量表示,转化过程通过预训练的词向量模型和预训练的BERT模型分别实现,进而利用BiLSTM模型获取与各个评论对象的情感要素相关的上下文信息,并设计一种基于评论对象的注意力机制,为每个预先定义的评论对象计算其对应的分类向量,最终,通过多个Softmax分类器,根据分类向量,将每个评论对象分为积极、消极、中性、未提及四类。
4.如权利要求3所述的一种航班点评的细粒度情感分类系统,其特征在于:所述预训练的词向量模型结构为:每个需要判断的类别设置embedding,所述类别包括:服务、餐食、准点...
【专利技术属性】
技术研发人员:张日崇,许利祥,孙凯,胡志元,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。