一种基于BERT-TextCNN的外卖评论分类方法技术

技术编号：36543524 阅读：9 留言：0更新日期：2023-02-01 16:49

针对线上外卖平台评论文本，本发明专利技术设计了一种基于BERT

全部详细技术资料下载

【技术实现步骤摘要】
一种基于BERT
‑
TextCNN的外卖评论分类方法

[0001]本专利技术涉及情感倾向分析领域。

技术介绍

[0002]2020年中国实体餐饮业呈现颓势，近十年来实体餐饮收入首次下跌。与之形成鲜明对比的是中国线上外卖市场的蓬勃发展。据统计，2020年中国线上外卖用户达到了4.56亿人，较2019年增长了7.8％。线上订单量的激增和外卖交易规模的不断扩大造成了外卖评论文本的爆炸式增长。
[0003]分析外卖平台评论文本的情感倾向可以督促外卖平台完善服务体系，规范服务机制。情感分析目前被广泛应用于提取用户评论文本中的情感因素，从而精确表达用户对于商品的褒贬情绪，是文本挖掘的一种高效手段。但是现有的针对外卖评论文本的极性判别多倾向于总体情感倾向判别，而忽略了对于食品不同特征的情感倾向分类。一般的外卖评论文本往往涉及用户对商品不同特征的情感倾向，褒贬不一。笼统的判定整句极性不能协助平台高效挖掘用户行为倾向等特点。因此对外卖产品评论进行多特征情感极性分析可以更大程度的帮助平台实现高效管理，降低消费者对于多特征商品、商家的选择成本，为消费者提供更全面、有效的决策支撑。
[0004]BERT是近两年被广泛应用的自然语言处理手段，其应用动态词向量技术，开创性地同时进行下句预测和掩语言模型两个子任务，利用大规模数据预训练出Transformer模型。由于BERT的词向量是依据上下文信息动态生成的，因此可以更好的解决一词多义等问题。结合电商评论文本长短不一，上下文关联性较强的特点，利用BERT进行词向...

【技术保护点】

【技术特征摘要】
1.一种基于BERT
‑
TextCNN的外卖评论分类方法，包括以下步骤：步骤1：对输入的评论文本进行预处理，包括去除停用词和分词等，最终得到一个token列表；步骤2：利用BERT进行文本向量化处理，通过字嵌入、段嵌入、位置嵌入和双向Transformer编码器生成词嵌入矩阵；步骤3：搭建基于Text
‑
CNN的多任务文本分类、极性判别模型；将步骤2得到的词嵌入矩阵作为Text
‑
CNN嵌入层的输出，设置卷积核为{h＝i,w＝768}(i＝2,3,4,5)，沿着词向量矩阵的方向上下滑动，实现一维卷积，设置通道数为512；将卷积核c与词向量矩阵T中的第i个窗口t
i:i+h
‑1内的词向量进行卷积得到特征f
i
，卷积核C(C∈R
H
×
W
)与词向量矩阵内所有窗口的向量{t
1:h
,t
2:h
,....,t
n
‑
h+1:n
}顺次进行卷积操作得到特征图f＝{f1,f2,...,f
n

【专利技术属性】
技术研发人员：许文波，陈泓秀，贾海涛，罗欣，常乐，冷庚，
申请(专利权)人：电子科技大学长三角研究院湖州，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人