一种母婴垂直媒体UGC的情感分类模型的构建方法和装置制造方法及图纸

技术编号:37991211 阅读:16 留言:0更新日期:2023-06-30 10:05
本申请公开了一种母婴垂直媒体UGC的情感分类模型的构建方法和装置,该方法包括以下步骤:周期性地获取与母婴垂直媒体相关的UGC数据,得到母婴UGC数据集;基于情感极性分类或情感维度分类,标注所述母婴UGC数据集,并从母婴UGC数据集中提取特征;基于Transformer编码器、生成型预训练变换模型GPT

【技术实现步骤摘要】
一种母婴垂直媒体UGC的情感分类模型的构建方法和装置


[0001]本申请属于计算机
,具体涉及一种母婴垂直媒体UGC的情感分类模型的构建方法和装置。

技术介绍

[0002]目前,文本情感分类技术已经成为自然语言处理领域的重要研究方向,主要涉及到文本的预处理、特征提取和分类模型训练等环节。常用的情感分类方法包括朴素贝叶斯、支持向量机、逻辑回归等机器学习算法,以及深度学习方法如卷积神经网络、循环神经网络等。
[0003]随着互联网技术的发展,用户生成内容(User Generated Content,以下简称:UGC)在网络平台上越来越重要。在母婴垂直媒体平台上,用户可以自由地发表自己的经验和看法,这些内容可以为其他用户提供有价值的参考。由于母婴话题涉及到用户情感、情绪等方面,因此对这些内容进行情感分类具有很高的价值。
[0004]然而,对于母婴垂直媒体UGC情感分类来说,由于其特殊的领域和用户群体,现有的情感分类方法在分类精度和鲁棒性方面存在一定的局限性。

技术实现思路

[0005]本申请实施例的目的是提供一本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种母婴垂直媒体用户生成内容UGC的情感分类模型的构建方法,其特征在于,包括以下步骤:周期性地获取与母婴垂直媒体相关的UGC数据,得到母婴UGC数据集;基于情感极性分类或情感维度分类,标注所述母婴UGC数据集,并从母婴UGC数据集中提取特征;基于Transformer编码器、生成型预训练变换模型GPT

3以及Softmax层,构建母婴垂直媒体UGC的情感分类模型,使用所述母婴UGC数据集评估所述情感分类模型,并根据评估结果对所述情感分类模型进行优化。2.根据权利要求1所述的方法,其特征在于,所述情感极性分类包括正面、负面和中性,所述情感维度分类包括愉快、悲伤和愤怒。3.根据权利要求1所述的方法,其特征在于,所述Transformer编码器包括多个Transformer编码层,用于对文本进行编码;每个编码层包括多头自注意力机制子层和前馈神经网络子层,所述自注意力机制子层用于计算每个单词在上下文中的重要程度,所述前馈神经网络子层用于增强模型的非线性表达能力。4.根据权利要求1所述的方法,其特征在于,所述GPT

3用于对输入序列进行语言模型预训练和情感分类任务微调预训练,所述语言模型预训练用于帮助模型学习语言的上下文关系和语法规律,所述情感分类任务微调预训练用于帮助模型学习不同情感类别之间的区别和表达方式;所述Softmax层用于对所述GPT

3的输出进行分类,得到最终的情感分类结果。5.根据权利要求4所述的方法,其特征在于,所述Softmax层使用softmax函数将所述GPT

3的输出映射到不同的情感类别的概率分布上,以便于模型对输入序列进行分类。6.一种母婴垂直...

【专利技术属性】
技术研发人员:万虹刘阳
申请(专利权)人:品木世纪北京营销科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1