一种面向低资源环境的高效口语理解识别方法技术

技术编号：25915042 阅读：20 留言：0更新日期：2020-10-13 10:33

本发明专利技术适用于口语理解识别技术领域，提供一种面向低资源环境的高效口语理解识别方法，使用多任务学习将口语理解任务的两个子任务进行联合训练，多任务学习可以利用隐含在两个子任务的训练信号中的特定领域信息来提高泛化能力；而且使用了字符级和词语级别的词向量，可以捕捉输入文本不同粒度的特征；另外，使用张量分解的方法对模型进行了压缩，进一步降低模型的参数量。本发明专利技术方法在有效降低模型参数的情况下仍然可以保证模型的准确度，可以适应计算和存储资源非常有限实际生产环境，大大降低了模型的部署成本，节能环保。

全部详细技术资料下载

【技术实现步骤摘要】
一种面向低资源环境的高效口语理解识别方法
本专利技术属于口语理解识别
，尤其涉及一种面向低资源环境的高效口语理解识别方法。
技术介绍
随着近年来科技的快速进步，能够与客户进行流畅对话的智能对话系统已经在电商客服、天气查询、搜索引擎等领域替代了大量的人工重复劳动，不仅大大解放了生产力，而且可以为客户提供快速精准的特色功能服务，因而成为现代科技特别是人工智能领域最为核心、最为热门的技术之一。口语理解识别任务是智能对话系统中非常重要的一环，目的是通过计算机自动从说话人产生的离散口语文字信息中提取出结构化数据，用于支持对话系统后续的信息检索、阅读理解、问答生成等任务。通常情况下，口语理解识别任务可以继续细分为两个子任务，分别是语句意图识别和语句词槽填充。其中语句意图识别主要完成对当前输入语句的用户意图分析，语句词槽填充则是从输入语句中解析出诸如时间、地点、数量等等关键的名词信息。目前关于口语理解识别任务已有大量研究，特别是随着深度学习的发展，基于深度神经网络的方法以其高准确率得到广泛的认可。目前的口语理解识别方法根据是否将语句识别和语句词槽填充两个任务进行独立建模，可分为独立建模和联合建模两种。其中效果较好的联合模型又包括基于卷积神经网络等方法、基于双向长短期记忆网络的方法、基于变压器模型的方法以及基于最新的BERT模型的方法等等。现有的方法主要目标是提高模型在口语理解任务的识别准确度，并没有考虑如何在计算资源非常有限实际生产环境，平衡准确率和资源占用两方面的因素，使得模型既能准确的预测同时占用少量资源...

【技术保护点】
1.一种面向低资源环境的高效口语理解识别方法，其特征在于，所述方法包括下述步骤：/n步骤S1、从合适的数据源中选取和设计用户的常用查询语句，从所述常用查询语句中提取重要实体和属性作为词槽，并分析常用查询语句的输入目的作为意图，以构建口语理解识别数据集，数据集划分为训练集，验证集和测试集；/n步骤S2、构建模型的嵌入表示层，包括词语级别的嵌入层和字符级别的嵌入层；/n步骤S3、在所述嵌入表示层上构建模型的意图识别神经网络分支；/n步骤S4、在所述嵌入表示层上构建模型的词槽填充神经网络分支；/n步骤S5、设置联合训练模型的损失函数，并选用优化器对所述意图识别神经网络分支和词槽填充神经网络分支在训练集上进行训练，同时在验证集上进行效果验证并选取训练超参数，最终在测试集上进行测试；/n步骤S6、对训练好的模型中参数量较大的全连接层的参数进行张量分解，构建压缩后的模型；/n步骤S7、对压缩后的模型继续在训练集上进行进一步训练微调，以提升压缩后模型的效果。/n

【技术特征摘要】
1.一种面向低资源环境的高效口语理解识别方法，其特征在于，所述方法包括下述步骤：
步骤S1、从合适的数据源中选取和设计用户的常用查询语句，从所述常用查询语句中提取重要实体和属性作为词槽，并分析常用查询语句的输入目的作为意图，以构建口语理解识别数据集，数据集划分为训练集，验证集和测试集；
步骤S2、构建模型的嵌入表示层，包括词语级别的嵌入层和字符级别的嵌入层；
步骤S3、在所述嵌入表示层上构建模型的意图识别神经网络分支；
步骤S4、在所述嵌入表示层上构建模型的词槽填充神经网络分支；
步骤S5、设置联合训练模型的损失函数，并选用优化器对所述意图识别神经网络分支和词槽填充神经网络分支在训练集上进行训练，同时在验证集上进行效果验证并选取训练超参数，最终在测试集上进行测试；
步骤S6、对训练好的模型中参数量较大的全连接层的参数进行张量分解，构建压缩后的模型；
步骤S7、对压缩后的模型继续在训练集上进行进一步训练微调，以提升压缩后模型的效果。

2.如权利要求1所述面向低资源环境的高效口语理解识别方法，其特征在于，所述步骤S1具体包括：
步骤S11、从合适的数据源中选取与任务相关的常用查询语句，根据提问的频率和质量选取部分常用查询语句作为待标注数据集；
步骤S12、从常用查询语句中根据任务的目标设计常用实体以及属性的词语作为词槽；
步骤S13、设计若干常见的意图作为标签，根据标签对待标注数据集中的常用查询语句进行分类和标注；
步骤S14、根据设计的词槽以及标注后的常用查询语句构建标注口语理解数据集，并随机划分大小生成训练集、验证集和测试集。

3.如权利要求2所述面向低资源环境的高效口语理解识别方法，其特征在于，所述步骤S2具体包括：
步骤S21、根据口语理解识别数据集的语句，选用适合的预训练词向量作为模型的词语级别的的词嵌入层，预训练词向量的选用标准为尽量提高词表覆盖率，即口语理解识别数据集中常用查询语句的分词集合属于词向量词表中的部分在词向量词表中的占有百分比，其中词嵌入层的参数为词嵌入矩阵WE＝concat(we1,we2,......,wen)；
这里wei为对口语理解识别数据集中常用查询语句的分词后的每个单词在预训练词向量中选取对应的单词向量，n表示分词操作后单词的个数，concat表示对词向量在句子方向上进行拼接，d为每个单词的向量维度，此时词嵌入矩阵WE大小为n×d；
步骤S22、使用高斯分布随机初始字符级别的字符嵌入层参数并进行特征提取，构建模型的字符级别的嵌入层，其中字符嵌入层的参数为字符嵌入矩阵CE＝concat(ce1,ce2,......,cem)，这里需要对口语理解识别数据集中常用查询语句转化为字符序列，cei为字符序列中每个字符随机初始化一个d维的词向量，m为字符转化操...

【专利技术属性】
技术研发人员：莫益军，孙焱，
申请(专利权)人：湖北马斯特谱科技有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人