一种基于XLNet的智能语音对话意图识别方法技术

技术编号：23100702 阅读：47 留言：0更新日期：2020-01-14 20:54

本发明专利技术提出一种基于XLNet的智能语音对话意图识别方法，包括以下步骤：S1：将对话节点的标准问题和扩展的多个相似问题作为语料打标整理成文本样本；S2：将文本样本拆分成训练集合和验证集合；S3：将训练集合输入XLNet模型中，初始化原始相关权重，设置好迭代次数和步长，并在损失函数中加入Triplet loss损失，固定网络其他层；S4：通过离线准确率在验证集合上验证XLNet模型；S5：预加载XLNet模型，提供接口接收待识别的语音转化为文本输入，输出对话文本相关的分类类别；S6：在线上服务中添加对应的阀值计算和分类概率计算；S7：分类激活时通过配置文件得到相关分类的文本标题。本发明专利技术提出的意图识别方法，极大提升了意图识别率；重写demo脚本，提升了意图识别率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于XLNet的智能语音对话意图识别方法
本专利技术涉及语音识别领域，尤其涉及一种基于XLNet的智能语音对话意图识别方法。
技术介绍
随着大数据和机器计算力的飞速发展，深度学习技术在视觉和语音上取得了很多重大的突破。在语音识别领域，越来越多的智能语音机器人投入实用，语音机器人是否智能，取决于对话过程中的意图识别是否准确。XLNet模型的提出刷新了nlp技术在各项数据集合上的成绩，然而真正使用XLNet技术在语音识别领域的使用依然存在很多问题。首先，基于XLNet模型完全复用demo中的脚本和模型参数，完全复用demo脚本和模型参数，在实际场景下没有根据本身的数据分布调整模型参数，导致效果不佳；其次，因为重新训练整个网络所需的语料和计算资源太过于庞大，导致个人或者公司选择重新训练整个网络时整个模型没有收敛或者过拟合。
技术实现思路
为解决上述问题，本专利技术提出一种基于XLNet的智能语音对话意图识别方法。一种基于XLNet的智能语音对话意图识别方法，包括以下步骤：S1：将对话节点的标准问题和扩展的多个相似问题作为语料打标整理成文本样本；S2：将文本样本拆分成训练集合和验证集合；S3：将训练集合输入模型中，初始化原始相关权重，设置好迭代次数和步长，并在损失函数中加入Tripletloss损失，固定网络其他层，仅仅再次训练XLNet模型最后两层网络，直到模型收敛；S4：离线准确率等指标评测，在验证集合上验证模型可用S5：线上预测时，预加载模...

【技术保护点】
1.一种基于XLNet的智能语音对话意图识别方法，其特征在于，包括以下步骤：/nS1：将对话节点的标准问题和扩展的多个相似问题作为语料打标整理成文本样本；/nS2：将文本样本拆分成训练集合和验证集合；/nS3：将训练集合输入XLNet模型中，初始化原始相关权重，设置好迭代次数和步长，并在损失函数中加入Triplet loss损失，固定网络其他层，仅仅再次训练XLNet模型最后两层网络，直到XLNet模型收敛；/nS4：通过离线准确率在验证集合上验证XLNet模型；/nS5：线上预测时，预加载XLNet模型，提供接口接收待识别的语音转化为文本输入，输出对话文本相关的分类类别；/nS6：在线上服务中添加对应的阀值计算和分类概率计算，通过计算阀值判断是否激活输出相关的分类，通过归一化和softmax计算分类概率判断分类的合理程度；/nS7：分类激活时通过配置文件得到相关分类的文本标题，否则返回默认分类。/n

【技术特征摘要】
1.一种基于XLNet的智能语音对话意图识别方法，其特征在于，包括以下步骤：
S1：将对话节点的标准问题和扩展的多个相似问题作为语料打标整理成文本样本；
S2：将文本样本拆分成训练集合和验证集合；
S3：将训练集合输入XLNet模型中，初始化原始相关权重，设置好迭代次数和步长，并在损失函数中加入Tripletloss损失，固定网络其他层，仅仅再次训练XLNet模型最后两层网络，直到XLNet模型收敛；
S4：通过离线准确率在验证集合上验证XLNet模型；
S5：线上预测时，预加载XLNet模型，提供接口接收待识别的语音转化为文本输入，输出对话文本相关的分类类别；
S6：在线上服务中添加对应的阀值计算和分类概率计算，通过计算阀值判断是否激活输出相关的分类，通过归一化和softmax计算分类概率判断分类的合理程度；
S7：分类激活时通过配置文件得到相关分类的文本标题，否则返回默认分类。

2.根据权利要求1所述的一种基于XLNet的智能语音对话意图识别方法，其特征在于，所述将文本样本拆分成训练集合和验证集合之后还包括：通过多个实际通话录...

【专利技术属性】
技术研发人员：王磊，
申请(专利权)人：浙江百应科技有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人