情绪分类模型训练方法、情绪预测方法和装置制造方法及图纸

技术编号:32133944 阅读:13 留言:0更新日期:2022-01-29 19:39
本申请涉及一种情绪分类模型训练方法、情绪预测方法、装置、计算机设备和存储介质。本申请涉及人工智能领域,可用于金融科技领域或其他相关领域。情绪分类模型训练方法包括:获取样本参与方的样本文本数据,以及样本标签;将样本文本数据输入待训练的文本数据分类模型,利用文本数据分类模型确定样本文本数据中包含的文本分词对应的第一分词向量,以及上文词向量和下文词向量;根据上文词向量和下文词向量,得到文本分词对应的第二分词向量;基于第一分词向量以及第二分词向量,确定市场情绪预测概率;根据市场情绪预测概率与样本标签之间的差异损失对文本数据分类模型进行训练,得到情绪分类模型。采用本方法能够提高市场情绪分类的准确率。类的准确率。类的准确率。

【技术实现步骤摘要】
情绪分类模型训练方法、情绪预测方法和装置


[0001]本申请涉及人工智能
,特别是涉及一种情绪分类模型训练方法、情绪预测方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]随着人工智能技术的发展,出现了一种利用人工智能技术分析市场情绪的方法,该方法通过采集与市场参与方相关的文本数据,以及对应的市场情绪数据,对模型进行训练,从而可以通过训练的模型,利用文本数据,对该市场情绪进行预测。
[0003]传统技术中,在采集文本数据后,首先需要对采集的文本数据进行特征提取,例如通过特征提取模型提取词向量,从而得到文本特征进行模型的训练。然而这种文本特征的提取方法仅仅考虑了文本数据本身的特征,而缺少考虑文本之间的关联关系,因此训练出的模型进行市场情绪分类的准确率较低。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种能够提高市场情绪分类准确性的情绪分类模型训练方法、情绪预测方法、装置、计算机设备、存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种情绪分类模型训练方法,所述方法包括:
[0006]获取样本参与方对应的样本文本数据,以及获取所述样本文本数据对应的样本标签;所述样本标签用于标识所述样本文本数据对应的市场情绪类型;
[0007]将所述样本文本数据输入待训练的文本数据分类模型,利用所述文本数据分类模型确定所述样本文本数据中包含的文本分词对应的第一分词向量,以及所述文本分词对应的上文词向量和下文词向量;
[0008]根据所述文本分词对应的上文词向量和下文词向量,得到所述文本分词对应的第二分词向量;
[0009]基于所述第一分词向量以及所述第二分词向量,确定所述样本文本数据对应的市场情绪预测概率;
[0010]根据所述市场情绪预测概率与所述样本标签之间的差异损失对所述文本数据分类模型进行训练,得到情绪分类模型。
[0011]在其中一个实施例中,所述文本分词对应的上文词向量和下文词向量的数量为多个;所述根据所述文本分词对应的上文词向量和下文词向量,得到所述文本分词对应的第二分词向量,包括:根据所述文本分词对应的多个上文词向量,得到所述文本分词对应的上文均值向量,以及根据所述文本分词对应的多个下文词向量,得到所述文本分词对应的下文均值向量;获取所述上文均值向量对应的第一空间映射向量,以及获取所述下文均值向量对应的第二空间映射向量;根据所述第一空间映射向量以及所述第二空间映射向量,得到所述文本分词对应的第二分词向量。
[0012]在其中一个实施例中,所述获取所述上文均值向量对应的第一空间映射向量,以
及获取所述下文均值向量对应的第二空间映射向量,包括:获取预设的空间映射变换信息;利用所述空间映射变换信息分别对所述上文均值向量以及所述下文均值向量进行空间映射变换,分别得到所述第一空间映射向量以及所述第二空间映射向量;所述根据所述第一空间映射向量以及所述第二空间映射向量,得到所述文本分词对应的第二分词向量,包括:将所述第二空间映射向量与所述第一空间映射向量进行作差处理,得到所述文本分词对应的第二分词向量。
[0013]在其中一个实施例中,所述基于所述第一分词向量以及所述第二分词向量,确定所述样本文本数据对应的市场情绪预测概率,包括:获取所述第一分词向量与所述第二分词向量的向量均值,将所述向量均值作为所述文本分词对应的目标分词向量;根据文本分词对应的目标分词向量,获取所述样本文本数据对应的样本文本特征;根据所述样本文本特征,确定所述样本文本数据对应的市场情绪预测概率。
[0014]在其中一个实施例中,所述将所述样本文本数据输入待训练的文本数据分类模型之前,还包括:根据预设的语句分词语料库,获取所述样本文本数据包含的初始文本分词;获取预设的停用词语料库,利用停用词语料库对所述初始文本分词进行过滤处理,得到所述样本文本数据包含的文本分词;所述将所述样本文本数据输入待训练的文本数据分类模型,包括:将所述样本文本数据包含的文本分词输入所述待训练的文本数据分类模型。
[0015]在其中一个实施例中,所述获取样本参与方对应的样本文本数据,包括:获取所述样本参与方对应的样本新闻数据,将所述样本新闻数据作为所述样本文本数据;和/或获取所述样本参与方对应的样本视频数据,从所述样本视频数据中提取出对应的音频数据,得到样本音频数据;将所述样本音频数据对应的文本数据作为所述样本文本数据。
[0016]第二方面,本申请还提供了一种情绪预测方法,所述方法包括:
[0017]获取在预设时间周期内采集的针对于市场参与方的参与方文本数据;
[0018]将所述参与方文本数据输入情绪分类模型,通过所述情绪分类模型输出所述市场参与方对应的市场情绪类型;所述情绪分类模型通过如上述的情绪分类模型训练方法得到。
[0019]第三方面,本申请还提供了一种情绪分类模型训练装置,所述装置包括:
[0020]样本数据获取模块,用于获取样本参与方对应的样本文本数据,以及获取所述样本文本数据对应的样本标签;所述样本标签用于标识所述样本文本数据对应的市场情绪类型;
[0021]第一向量获取模块,用于将所述样本文本数据输入待训练的文本数据分类模型,利用所述文本数据分类模型确定所述样本文本数据中包含的文本分词对应的第一分词向量,以及所述文本分词对应的上文词向量和下文词向量;
[0022]第二向量获取模块,用于根据所述文本分词对应的上文词向量和下文词向量,得到所述文本分词对应的第二分词向量;
[0023]预测概率获取模块,用于基于所述第一分词向量以及所述第二分词向量,确定所述样本文本数据对应的市场情绪预测概率;
[0024]分类模型训练模块,用于根据所述市场情绪预测概率与所述样本标签之间的差异损失对所述文本数据分类模型进行训练,得到情绪分类模型。
[0025]第四方面,本申请还提供了一种情绪预测装置,所述装置包括:
[0026]预测文本获取模块,用于获取在预设时间周期内采集的针对于市场参与方的参与方文本数据;
[0027]市场情绪预测模块,用于将所述参与方文本数据输入情绪分类模型,通过所述情绪分类模型输出所述参与方文本数据对应的市场情绪类型;所述情绪分类模型通过如上述的情绪分类模型训练方法得到。
[0028]第五方面,本申请还提供了一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0029]获取样本参与方对应的样本文本数据,以及获取所述样本文本数据对应的样本标签;所述样本标签用于标识所述样本文本数据对应的市场情绪类型;
[0030]将所述样本文本数据输入待训练的文本数据分类模型,利用所述文本数据分类模型确定所述样本文本数据中包含的文本分词对应的第一分词向量,以及所述文本分词对应的上文词向量和下文词向量;
[0031]根据所述文本分词对应的上文词向量和下文词向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种情绪分类模型训练方法,其特征在于,所述方法包括:获取样本参与方对应的样本文本数据,以及获取所述样本文本数据对应的样本标签;所述样本标签用于标识所述样本文本数据对应的市场情绪类型;将所述样本文本数据输入待训练的文本数据分类模型,利用所述文本数据分类模型确定所述样本文本数据中包含的文本分词对应的第一分词向量,以及所述文本分词对应的上文词向量和下文词向量;根据所述文本分词对应的上文词向量和下文词向量,得到所述文本分词对应的第二分词向量;基于所述第一分词向量以及所述第二分词向量,确定所述样本文本数据对应的市场情绪预测概率;根据所述市场情绪预测概率与所述样本标签之间的差异损失对所述文本数据分类模型进行训练,得到情绪分类模型。2.根据权利要求1所述的方法,其特征在于,所述文本分词对应的上文词向量和下文词向量的数量为多个;所述根据所述文本分词对应的上文词向量和下文词向量,得到所述文本分词对应的第二分词向量,包括:根据所述文本分词对应的多个上文词向量,得到所述文本分词对应的上文均值向量,以及根据所述文本分词对应的多个下文词向量,得到所述文本分词对应的下文均值向量;获取所述上文均值向量对应的第一空间映射向量,以及获取所述下文均值向量对应的第二空间映射向量;根据所述第一空间映射向量以及所述第二空间映射向量,得到所述文本分词对应的第二分词向量。3.根据权利要求2所述的方法,其特征在于,所述获取所述上文均值向量对应的第一空间映射向量,以及获取所述下文均值向量对应的第二空间映射向量,包括:获取预设的空间映射变换信息;利用所述空间映射变换信息分别对所述上文均值向量以及所述下文均值向量进行空间映射变换,分别得到所述第一空间映射向量以及所述第二空间映射向量;所述根据所述第一空间映射向量以及所述第二空间映射向量,得到所述文本分词对应的第二分词向量,包括:将所述第二空间映射向量与所述第一空间映射向量进行作差处理,得到所述文本分词对应的第二分词向量。4.根据权利要求1所述的方法,其特征在于,所述基于所述第一分词向量以及所述第二分词向量,确定所述样本文本数据对应的市场情绪预测概率,包括:获取所述第一分词向量与所述第二分词向量的向量均值,将所述向量均值作为所述文本分词对应的目标分词向量;根据文本分词对应的目标分词向量,获取所述样本文本数据对应的样本文本特征;根据所述样本文本特征,确定所述样本文本数据对应的市场情绪预测概率。5.根据权利要求1至4任意一项所述的方法,其特征在于,所述将所述样本文本数据输入待训练的文本数据分类模型之前,还包括:
根据预设的语句分词语料库,获取所述样本文本数据包含的初始文本分词;获取预设的停用词语料库,利用停用词语料库对所述初始文本分词进行过滤处理,得到所述样本文本数据包含的文本分词;所述将所述样本文本数据输入待训...

【专利技术属性】
技术研发人员:张笑雪李曼丽文晋京
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1