一种情感分类模型的训练方法及装置制造方法及图纸

技术编号：28135579 阅读：31 留言：0更新日期：2021-04-21 19:03

本发明专利技术实施例提供一种情感分类模型的训练方法及装置，所述方法包括：获取作为训练样本的文本，并根据文本的文本长度划分文本的分类；所述文本是用户评论文本；确定与划分后每类文本分别对应的批量样本数；其中，所述批量样本数的数量与划分后每类文本的文本长度呈反比例变化；利用与每批批量样本数相对应的批量样本分别训练情感分类模型。所述装置执行上述方法。本发明专利技术实施例提供的情感分类模型的训练方法及装置，通过确定与划分后每类文本分别对应的批量样本数，并利用与每批批量样本数相对应的批量样本分别训练情感分类模型，能够加快情感分类模型的训练速度。快情感分类模型的训练速度。快情感分类模型的训练速度。

全部详细技术资料下载

【技术实现步骤摘要】
一种情感分类模型的训练方法及装置

[0001]本专利技术涉及人工智能
，尤其涉及一种情感分类模型的训练方法及装置。

技术介绍

[0002]随着电子商务的快速发展，越来越多的消费者在互联网平台上发表产品评论。评论可以反映出消费者对某一产品的某个属性的喜好程度，即情感分类，例如可以为积极、消极或中立。
[0003]现有技术通过建立情感分类模型来实现对情感进行分类，例如可以采用如下步骤：1.构造语言学特征，包括n-gram特征、语义特征、句法依赖特征、属性类别特征等；2.通过奇异值分解进行特征降维；3.采用one-vs-all策略的分类算法训练分类器；4.将模型效果反馈到特征空间进行进一步优化。
[0004]由于，上述模型的训练方法中用到的训练样本的特征类别繁多，并且，标记带有一定的主观因素，甚至可能存在错误，因此，给整个模型的训练加大了难度，甚至会导致模型无法收敛。

技术实现思路

[0005]针对现有技术存在的问题，本专利技术实施例提供一种情感分类模型的训练方法及装置。
[0006]本专利技术实施例提供一种情感分类模型的训练方法，包括：
[0007]获取作为训练样本的文本，并根据文本的文本长度划分文本的分类；所述文本是用户评论文本；
[0008]确定与划分后每类文本分别对应的批量样本数；其中，所述批量样本数的数量与划分后每类文本的文本长度呈反比例变化；
[0009]利用与每批批量样本数相对应的批量样本分别训练情感分类模型。
[0010]其中，所...

【技术保护点】

【技术特征摘要】
1.一种情感分类模型的训练方法，其特征在于，包括：获取作为训练样本的文本，并根据文本的文本长度划分文本的分类；所述文本是用户评论文本；确定与划分后每类文本分别对应的批量样本数；其中，所述批量样本数的数量与划分后每类文本的文本长度呈反比例变化；利用与每批批量样本数相对应的批量样本分别训练情感分类模型。2.根据权利要求1所述的情感分类模型的训练方法，其特征在于，所述根据文本的文本长度划分文本，包括：根据依次递减的预设文本长度阈值和所有文本的文本长度，依次划分所有文本。3.根据权利要求2所述的情感分类模型的训练方法，其特征在于，所述确定与划分后每类文本分别对应的批量样本数，包括：根据依次递增的预设批量样本数阈值和划分后每类文本，依次确定与划分后每类文本分别对应的批量样本数。4.根据权利要求1至3任一所述的情感分类模型的训练方法，其特征在于，所述利用利用与每批批量样本数相对应的批量样本分别训练情感分类模型之前，所述情感分类模型的训练方法还包括：在一批批量样本中设置至少一个未知分类词。5.根据权利要求4所述的情感分类模型的训练方法，其特征在于，所述在在一批批量样本中设置至少一个未知分类词，包括：在预设数值区间内生成随机数，并根据所述随机数和一批批量样本中的词数量，确定未知分类词的数量；其中，所述预设...

【专利技术属性】
技术研发人员：曹秀亭，
申请(专利权)人：普天信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人