【技术实现步骤摘要】
一种面向智慧标牌系统的情感分类方法
[0001]本专利技术涉及智慧标牌系统领域,尤其涉及一种面向智慧标牌系统的情感分类方法。
技术介绍
[0002]当前对于中文文本情感分类的方法主要有以下两类:第一类是基于词典规则的方法,这种方法基于情感词典和规则,对文本语句中的每个字词进行情感分类,然后根据字词的分类结果对整个文本语句进行情感分类。其优点在于实现简单、成本较低,但对于文本中含义复杂、多义性强的情况,效果不如机器学习方法。
[0003]另一类是通过训练一个机器学习模型来实现文本情感分类。其特点为通常需要大量的标注数据作为训练集,然后利用如朴素贝叶斯、支持向量机、随机森林、深度学习等机器学习算法,对模型进行训练和测试,得到最终的情感分类结果。
[0004]针对海量用户短评论的情感文本数据,传统的基于词典规则的方法尽管可以方便获取文本的情感倾向,但是会忽略文本的顺序和文段语义信息,同时需要依靠大量人力物力进行更新,因此不适用于本专利技术面向的智慧标牌系统,而传统的机器学习方法,存在过度依赖文本数据以及特征提取繁琐 ...
【技术保护点】
【技术特征摘要】
1.一种面向智慧标牌系统的情感分类方法,其特征在于,包括:通过对文本输入矩阵进行近似词义扩展;使用注意力机制与原文本输入矩阵进行计算,得到注意力加权文本矩阵;将所述注意力加权文本矩阵作为输入,传入至融合卷积神经网络与时间卷积网络的情感分类模型中,得到SATT
‑
CTCN模型,利用SATT
‑
CTCN模型得到情感分类结果。2.如权利要求1所述的面向智慧标牌系统的情感分类方法,其特征在于,所述通过对文本输入矩阵进行近似词义扩展,包括:对于输入的文本,使用预训练词向量模型,将其表示为文本矩阵,同时考虑其稀疏性和歧义性,对其使用基于余弦相似度的词义扩展。3.如权利要求2所述的面向智慧标牌系统的情感分类方法,其特征在于,所述基于余弦相似度的词义扩展,包括:将文本向量设为T=(W1,W2,W3,W4
……
,Wn);其中,Wi为该词所对应词向量,即Wi=(x1,x2,x3,x4
……
xn);对应于文本T中每个字词Wi,在预训练词向量模型中通过余弦相似度寻找近义词Zj=(y1,y2,y3,y4
……
yn)进行词义扩展,计算公式表示为:其中,x
i
和y
i
为预训练词;通过获取结果最接近1的字词,作为原文本中字词Wi的最相似词,进行词义扩展。4.如权利要求3所述的面向智慧标牌系统的情感分类方法,其特征在于,使用注意力机制与原文本输入矩阵进行计算,得到注意力加权文本矩阵,包括:对于待处理的文本句S=[W1,W2,W3
…
Wi
…
,WT];其中,Wi代表文本句中的字词,文本句S大小为T
×
D,T代表统一后的文本句长度,即文本句中字词个数;D代表每个字词的维数;将其接入线性层y',并进行归一化处理。5.如权利要求4所述的面向智慧标牌系统的情感分类方法,其特征在于,所述将其接入线性层y',并进行归一化处理,包括:得到字词的重要性分布,公式表示为:Ci=y
’×
WiWiWi其中,Ci表示文本句线性化后的值;u
c
表示为文本均值,δ
c
表示为文本标准差;为避免
δ
c
‑
ε的分母为0,设定ε=1e
‑
5;将上述四个公式带入以下的两个公式中,即可得到每个字词在文本句中的重要性分布;α
i
=...
【专利技术属性】
技术研发人员:胡棪嵘,刘旋,刘萍,郑杰,吴惠灵,
申请(专利权)人:扬州大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。