货运语料意图分类模型的训练方法、装置、设备及介质制造方法及图纸

技术编号：36606527 阅读：16 留言：0更新日期：2023-02-04 18:29

本申请涉及人工智能领域，公开了一种货运语料意图分类模型的训练方法、装置、设备及存储介质。该方法包括：获取货运语料训练集，货运语料训练集中包括多条货运语料样本及其意图类别；根据每条货运语料样本的意图类别，对每条货运语料样本进行数据标注；预处理每条货运语料样本，得到多条目标货运语料样本；对每条目标货运语料样本执行向量表达，得到每条目标货运语料样本的初始句向量；构建TextCNN网络模型，并初始化网络参数；依次将每个初始句向量输入至TextCNN网络模型中执行多分类训练，得到货运语料意图分类模型。本发明专利技术通过训练货运语料意图分类模型，进而使用货运语料意图分类模型识别各中货运语料的意图，提升了货运语料意图识别的效率。料意图识别的效率。料意图识别的效率。

全部详细技术资料下载

【技术实现步骤摘要】
货运语料意图分类模型的训练方法、装置、设备及介质

[0001]本申请涉及人工智能领域，尤其涉及一种货运语料的意图分类方法、装置、设备及存储介质。

技术介绍

[0002]在货运场景中，很多人机交互、人与人交互的货运语料被予以记录，通过分析货运语料可以识别货运语料对应的意图，进而根据所识别意图做进一步决策。
[0003]在现有的技术中，对于货运场景下的货运语料通常是由人为判断意图，进而根据其意图做出决策或答复，其效率低下。
[0004]申请内容
[0005]本申请实施例提供一种货运语料意图分类模型的训练方法，能够对货运场景的中货运语料样本执行预训练，并在预训练的基础上执行意图分类训练，从而得到货运语料意图分类模型，进而可使用货运语料意图分类模型识别各中货运语料的意图，提升了货运语料意图识别的效率。
[0006]第一方面，本申请实施例提供一种货运语料意图分类模型的训练方法，包括：响应于接收到模型训练请求，获取预置的货运语料训练集，其中，货运语料训练集中包括多条货运语料样本和每条货运语料样本对应的意图类别；根据每条货运语料样本对应的意图类别，对每条货运语料样本进行数据标注；对货运语料训练集中的每条货运语料样本执行预处理，得到多条目标货运语料样本；对每条目标货运语料样本执行向量表达，得到每条目标货运语料样本对应的初始句向量；构建TextCNN网络模型，并初始化TextCNN网络模型的网络参数；依次将每条目标货运语料样本对应的初始句向量输入至TextCNN网络模型中执行多分类训练，得到货运语料意图...

【技术保护点】

【技术特征摘要】
1.一种货运语料意图分类模型的训练方法，其特征在于，所述货运语料意图分类模型的训练方法包括：响应于接收到模型训练请求，获取预置的货运语料训练集，其中，所述货运语料训练集中包括多条货运语料样本和每条货运语料样本对应的意图类别；根据每条货运语料样本对应的意图类别，对每条货运语料样本进行数据标注；对所述货运语料训练集中的每条货运语料样本执行预处理，得到多条目标货运语料样本；对每条目标货运语料样本执行向量表达，得到每条目标货运语料样本对应的初始句向量；构建TextCNN网络模型，并初始化所述TextCNN网络模型的网络参数；依次将每条目标货运语料样本对应的初始句向量输入至所述TextCNN网络模型中执行多分类训练，得到货运语料意图分类模型。2.根据权利要求1所述的货运语料意图分类模型的训练方法，其特征在于，所述对所述货运语料训练集中的每条货运语料样本执行预处理，得到多条目标货运语料样本包括：对所述货运语料训练集中的每条初始货运语料样本执行分词处理；去除分词处理后的每条初始货运语料样本中的停用词；对去除停用词后的每条初始货运语料样本进行词干提取，得到多条目标货运语料样本。3.根据权利要求1所述的货运语料意图分类模型的训练方法，其特征在于，每条目标货运语料样本为一个分词序列，每个分词序列中至少包括一个分词，所述对每条目标货运语料样本执行向量表达，得到每条目标货运语料样本对应的初始句向量包括：获取与货运行业相关的词嵌套预训练模型，并将每条目标货运语料样本中的分词依次输入至所述词嵌套预训练模型中执行预训练，得到每条目标货运语料样本中各分词对应的词向量；基于同一目标货运语料样本中各分词对应的词向量求和后计算平均值，得到每条目标货运语料样本对应的初始句向量。4.根据权利要求1所述的货运语料意图分类模型的训练方法，其特征在于，所述TextCNN网络模型包括卷积层、池化层以及全连接层，所述依次将每条目标货运语料样本对应的初始句向量输入至所述TextCNN网络模型中执行多分类训练，得到货运语料意图分类模型包括：依次将每条目标货运语料样本对应的初始句向量输入至所述TextCNN网络模型中，调用所述卷积层对所输入的初始句向量进行卷积，并基于预置的激活函数对卷积结果进行激活，得到目标句向量；调用所述池化层对所述目标句向量执行池化处理；调用所述全连接层中的多分类器计算所述目标句向量对应的多分类概率分布，其中，所述多分类概率分布用于表示目标句向量与预置的多个意图类别标签之间的匹配概率，所述多个意图类别标签与数据标注的结果对应；基于预置的损失函数计算所述多分类概率分布对应的损失值；根据所述损失值调整所述TextCNN网络模型的网络参数，得到货运语料意图分类模型。
5.根据权利要求4所述的货运语料意图分类模型的训练方法，其特征在于，所述调用所述全连接层中的多分类器计算所述目标句向量对应的多分类概率分布包括：调用所述全连接层中的多分类器，使用所述多分类器中与每个意图类别标签对应的概率密度矩阵分别与所述目标句向量进行点积运算，得到所述目标句向量...

【专利技术属性】
技术研发人员：闫晚丰，张治宇，蒋志强，周炜星，杨毓丞，
申请(专利权)人：上海运柚科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人