文本分类方法、装置、电子设备及存储介质制造方法及图纸

技术编号：32581869 阅读：58 留言：0更新日期：2022-03-09 17:13

本公开提供一种文本分类方法、装置、电子设备及存储介质，所述方法：获取待处理文本；将所述待处理文本输入预先训练好的文本分类模型中，获取所述待处理文本在多个类别上的预测概率值；选取所述预测概率值中的最大预测概率值，将所述最大预测概率值对应的类别确定为所述待处理文本的类别；其中，所述文本分类模型是根据三元组样本数据进行训练得到的，所述文本分类模型的损失函数值是根据交叉熵损失值以及相对损失值确定的。本公开提供的文本分类方法能够提高NLP系统的鲁棒性，提高语音意图的准确性，提升用户的体验。提升用户的体验。提升用户的体验。

全部详细技术资料下载

【技术实现步骤摘要】
文本分类方法、装置、电子设备及存储介质

[0001]本公开涉及信息处理
，尤其涉及一种文本分类方法、装置、电子设备及存储介质

技术介绍

[0002]随着语音识别技术的不断发展，如今语音智能系统已经深入应用到工业的各个方面，使得各个产品能够自然地和用户进行交互。
[0003]现有技术中，语音智能系统中识别用户意图主要采取管道结构，即用户—ASR(Automatic Speech Recognition，自动语音识别技术)系统—NLP(Natural Language Processing，自然语言处理)系统，其中，ASR系统将用户的音频转化为文本，然后NLP系统对转换出来的文本进行类别分类，通过确定文本的类别标签的方式得到用户的文本意图。由于NLP系统的输入是ASR系统的输出，若ASR系统将用户的语音转换错误，NLP系统的识别意图会与原始用户的真实意图相差甚远，使得NLP系统的鲁棒性不高，导致用户的语音意图判断结果不准确。

技术实现思路

[0004]本公开提供一种文本分类方法、装置、电子设备及存储...

【技术保护点】

【技术特征摘要】
1.一种文本分类方法，其特征在于，包括：获取待处理文本；其中，所述待处理文本为待识别语音数据通过语音识别系统转换得到的文本；将所述待处理文本输入预先训练好的文本分类模型中，获取所述待处理文本在多个类别上的预测概率值；选取所述预测概率值中的最大预测概率值，将所述最大预测概率值对应的类别确定为所述待处理文本的类别；其中，所述文本分类模型是根据三元组样本数据进行训练得到的，其中，所述三元组样本数据包括样本语音数据的转换数据、样本语音数据的类别标签数据以及所述样本语音数据的语音识别结果数据；所述文本分类模型的损失函数值是根据交叉熵损失值以及相对损失值确定的，其中，所述相对损失值是根据第一预测概率分布值与第二预测概率分布值确定的；所述第一预测概率分布值是基于所述样本语音数据的转换数据得到的，所述第二预测概率分布值是基于所述样本语音数据的语音识别结果数据得到的。2.根据权利要求1所述的文本分类方法，其特征在于，在所述获取待处理文本之前，方法还包括：在文本分类模型中的参数为第一参数值的情况下，将所述样本语音数据的转换数据输入所述文本分类模型，得到第一预测概率分布值；其中，所述第一参数值为文本分类模型在训练过程中所使用参数值中的任意一个；根据所述第一预测概率分布值以及所述样本语音数据的类别标签数据，计算交叉熵损失值；在文本分类模型中的参数为第一参数值的情况下，将所述样本语音数据的语音识别结果数据输入所述文本分类模型，得到第二预测概率分布值；根据所述第一预测概率分布值与所述第二预测概率分布值计算相对损失值；根据所述交叉熵损失值与所述相对损失值，在文本分类模型的参数为第一参数值的情况下计算所述文本分类模型的损失函数值；根据所述损失函数值，从所述文本分类模型在训练过程中所使用的多个参数值中确定所述文本分类模型的最终值。3.根据权利要求2所述的文本分类方法，其特征在于，所述根据所述第一预测概率分布值与所述第二预测概率分布值计算相对损失值，包括：根据所述第一预测概率分布值与所述第二预测概率分布值计算KL散度值；将所述KL散度值作为所述相对损失值。4.根据权利要求2所述的文本分类方法，其特征在于，所述根据所述交叉熵损失值与所述相对损失值，在文本分类模型的参数为第一参数值的情况下计算文本分类模型的损失函数值，具体包括：Loss＝β
·
CE(p(Trans))+(1
‑
β)KL(p(Trans),p(ASR))其中，Loss表示所述文本分类模型的损失函数值；β表示所述文本分类模型的超参数；CE(p(Trans))表示所述交叉熵损失值，p(Trans)表示所述第一预测概率分布值；KL(p(Trans),p(ASR))表示所述相对损失值，p(ASR)表示所述第二预测概率分布值。
5.根据权利要求2所述的文本分类方法，其特征在于，在所述在文本分类模型中的参数为第一参数值的情况下，将所述样本语音数据的转换数据输入所述文本分类模型之前，方法还包括：获取样本语音数据；播放所述样本语音数据，监听并记录所述样本语音数据，得到所述样本语音数据的转换数据...

【专利技术属性】
技术研发人员：王泽勋，陈蒙，乐雨泉，赵宇明，冯明超，
申请(专利权)人：京东科技信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人