【技术实现步骤摘要】
本专利技术属于自然语言处理,尤其涉及一种面向隐式情感语句的特征提取方法。
技术介绍
1、情感分析被广泛应用于解决文本情感倾向性问题,是自然语言处理领域中备受关注的热门领域。文本情感语句可以分为显式情感语句和隐式情感语句,其中隐式情感语句不包含或仅包含少量明显的情感词。随着互联网技术的迅猛发展,大量信息的涌现使得文本类型变得更加多样化,格式也变得更加复杂,导致模型难以准确理解,而隐式情感语句在其中发挥着主导作用。因此,如何对隐式情感语句进行分析和特征提取成为自然语言处理中的一个难题。情感分析任务是对情感语句进行二分类(贬义、褒义),由于隐式情感语句的语义较复杂,除语句本身外还有很多对分类任务有着重要影响的事实信息。因此,在提取隐式情感语句语义特征的同时,也对与之相关的事实信息进行情感特征提取。
2、早期的情感分析方法主要包括基于情感词典和基于机器学习的方法。基于情感词典的方法需要消耗大量人力和时间成本。基于机器学习的方法针对不同领域的任务需要人工调整算法,无法实现自动化情感分析。目前主流方法是利用深度学习进行情感分析,实现自动
...【技术保护点】
1.一种面向隐式情感语句的特征提取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的面向隐式情感语句的特征提取方法,其特征在于,所述步骤S1中,RoBERTa模型包括三种嵌入编码,分别是标记嵌入、分割嵌入和位置嵌入;标记嵌入是基于WordPiece嵌入对RoBERTa模型进行预训练得到的词向量;所述RoBERTa模型在处理输入文本时,在单词的开头添加[CLS]标志位,在结尾添加[SEP]标志位,并将每个单词转换为对应的标记嵌入向量,以分割句子。
3.根据权利要求1所述的面向隐式情感语句的特征提取方法,其特征在于,所述步骤S2的具体过程如
4...
【技术特征摘要】
1.一种面向隐式情感语句的特征提取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的面向隐式情感语句的特征提取方法,其特征在于,所述步骤s1中,roberta模型包括三种嵌入编码,分别是标记嵌入、分割嵌入和位置嵌入;标记嵌入是基于wordpiece嵌入对roberta模型进行预训练得到的词向量;所述roberta模型在处理输入文本时,在单词的开头添加[cls]标志位,在结尾添加...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。