当前位置: 首页 > 专利查询>扬州大学专利>正文

一种面向智慧标牌系统的情感分类方法技术方案

技术编号:38719666 阅读:19 留言:0更新日期:2023-09-08 23:15
本发明专利技术公开了一种面向智慧标牌系统的情感分类方法包括,首先通过对文本输入矩阵进行近似词义扩展;然后使用注意力机制与原文本输入矩阵进行计算,得到注意力加权文本矩阵;并将所述注意力加权文本矩阵作为输入,传入至融合卷积神经网络与时间卷积网络的情感分类模型中,得到SATT

【技术实现步骤摘要】
一种面向智慧标牌系统的情感分类方法


[0001]本专利技术涉及智慧标牌系统领域,尤其涉及一种面向智慧标牌系统的情感分类方法。

技术介绍

[0002]当前对于中文文本情感分类的方法主要有以下两类:第一类是基于词典规则的方法,这种方法基于情感词典和规则,对文本语句中的每个字词进行情感分类,然后根据字词的分类结果对整个文本语句进行情感分类。其优点在于实现简单、成本较低,但对于文本中含义复杂、多义性强的情况,效果不如机器学习方法。
[0003]另一类是通过训练一个机器学习模型来实现文本情感分类。其特点为通常需要大量的标注数据作为训练集,然后利用如朴素贝叶斯、支持向量机、随机森林、深度学习等机器学习算法,对模型进行训练和测试,得到最终的情感分类结果。
[0004]针对海量用户短评论的情感文本数据,传统的基于词典规则的方法尽管可以方便获取文本的情感倾向,但是会忽略文本的顺序和文段语义信息,同时需要依靠大量人力物力进行更新,因此不适用于本专利技术面向的智慧标牌系统,而传统的机器学习方法,存在过度依赖文本数据以及特征提取繁琐的问题,也同样无法适本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种面向智慧标牌系统的情感分类方法,其特征在于,包括:通过对文本输入矩阵进行近似词义扩展;使用注意力机制与原文本输入矩阵进行计算,得到注意力加权文本矩阵;将所述注意力加权文本矩阵作为输入,传入至融合卷积神经网络与时间卷积网络的情感分类模型中,得到SATT

CTCN模型,利用SATT

CTCN模型得到情感分类结果。2.如权利要求1所述的面向智慧标牌系统的情感分类方法,其特征在于,所述通过对文本输入矩阵进行近似词义扩展,包括:对于输入的文本,使用预训练词向量模型,将其表示为文本矩阵,同时考虑其稀疏性和歧义性,对其使用基于余弦相似度的词义扩展。3.如权利要求2所述的面向智慧标牌系统的情感分类方法,其特征在于,所述基于余弦相似度的词义扩展,包括:将文本向量设为T=(W1,W2,W3,W4
……
,Wn);其中,Wi为该词所对应词向量,即Wi=(x1,x2,x3,x4
……
xn);对应于文本T中每个字词Wi,在预训练词向量模型中通过余弦相似度寻找近义词Zj=(y1,y2,y3,y4
……
yn)进行词义扩展,计算公式表示为:其中,x
i
和y
i
为预训练词;通过获取结果最接近1的字词,作为原文本中字词Wi的最相似词,进行词义扩展。4.如权利要求3所述的面向智慧标牌系统的情感分类方法,其特征在于,使用注意力机制与原文本输入矩阵进行计算,得到注意力加权文本矩阵,包括:对于待处理的文本句S=[W1,W2,W3

Wi

,WT];其中,Wi代表文本句中的字词,文本句S大小为T
×
D,T代表统一后的文本句长度,即文本句中字词个数;D代表每个字词的维数;将其接入线性层y',并进行归一化处理。5.如权利要求4所述的面向智慧标牌系统的情感分类方法,其特征在于,所述将其接入线性层y',并进行归一化处理,包括:得到字词的重要性分布,公式表示为:Ci=y
’×
WiWiWi其中,Ci表示文本句线性化后的值;u
c
表示为文本均值,δ
c
表示为文本标准差;为避免
δ
c

ε的分母为0,设定ε=1e

5;将上述四个公式带入以下的两个公式中,即可得到每个字词在文本句中的重要性分布;α
i
=...

【专利技术属性】
技术研发人员:胡棪嵘刘旋刘萍郑杰吴惠灵
申请(专利权)人:扬州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1