跨领域语言模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号：24121539 阅读：15 留言：0更新日期：2020-05-13 03:14

本申请提供了一种跨领域语言模型训练方法、装置、电子设备及存储介质，所述方法包括：获得多个领域的语料训练集；基于所述多个领域的语料训练集，对多个语言模型进行训练，得到多个语言模型各自的输出，其中，所述多个语言模型与所述多个领域的语料训练集一一对应；根据所述多个语言模型各自的输出，以及所述多个语言模型预设的插值系数，对所述多个语言模型进行插值，得到所述跨领域语言模型。本申请提供了一种跨领域语言模型训练方法，通过基于线性插值的语言模型混合方法，将多个领域的语言模型混合为一个模型，有效解决了语言模型跨领域的脆弱性，提高了语言模型性能指标以及降低了语言模型的困惑度。

Cross domain language model training methods, devices, electronic devices and storage media

全部详细技术资料下载

【技术实现步骤摘要】
跨领域语言模型训练方法、装置、电子设备及存储介质
本专利技术涉及自然语言处理
，特别是涉及一种跨领域语言模型训练方法、装置、电子设备及存储介质。
技术介绍
自然语言处理(NLP)是计算机科学、语言学和机器学习的交叉点，它致力于让计算机能够理解和生成人类语言，但是计算机无法直接对语言字符进行数学运算，需要将文本转换为数学符号，然后应用各类算法进行处理，得到我们想要的结果。语言模型是根据语言客观事实而进行的语言抽象数学建模，将自然语言文本转换为带语义特征的数学符号，因此语言模型的性能好坏直接影响NLP系统的性能。尽管语言模型的理论基础已比较完善，但是语言模型但在实际应用中常常会遇到一些难以处理的问题，模型对跨领域的脆弱性(brittlenessacrossdomains)是最显著的问题。一方面，在实际应用场景中训练语言模型时采用的语料往往来自多种不同的领域，来自不同领域的数据无论在主题方面，还是在风格方面都有一定的差异，另一方面，语言模型对跨领域的数据非常敏感，直接影响语言模型的性能指标。
技术实现思路
本申请实施例提供了一种跨领域语言模型训练方法、装置、电子设备及存储介质，旨在解决语言模型跨领域的脆弱性，提高语言模型性能指标，降低语言模型的困惑度。本申请实施例第一方面提供了一种跨领域语言模型训练方法，包括：获得多个领域的语料训练集；基于所述多个领域的语料训练集，对多个语言模型进行训练，得到多个语言模型各自的输出，其中，所述多个语言模型与所述多个领域的语料训练集一...

【技术保护点】
1.一种跨领域语言模型训练方法，其特征在于，包括：/n获得多个领域的语料训练集；/n基于所述多个领域的语料训练集，对多个语言模型进行训练，得到多个语言模型各自的输出，其中，所述多个语言模型与所述多个领域的语料训练集一一对应；/n根据所述多个语言模型各自的输出，以及所述多个语言模型预设的插值系数，对所述多个语言模型进行插值，得到所述跨领域语言模型。/n

【技术特征摘要】
1.一种跨领域语言模型训练方法，其特征在于，包括：
获得多个领域的语料训练集；
基于所述多个领域的语料训练集，对多个语言模型进行训练，得到多个语言模型各自的输出，其中，所述多个语言模型与所述多个领域的语料训练集一一对应；
根据所述多个语言模型各自的输出，以及所述多个语言模型预设的插值系数，对所述多个语言模型进行插值，得到所述跨领域语言模型。

2.根据权利要求1所述的方法，其特征在于，根据所述多个语言模型各自的输出，以及所述多个语言模型预设的插值系数，对所述多个语言模型进行插值，得到所述跨领域语言模型，包括：
根据所述多个语言模型各自经第一次训练后的输出，以及预先为所述多个语言模型分配的初始化的插值系数，对所述多个语言模型进行第一次插值，得到第一次插值后的语言模型；
根据所述多个语言模型各自经下一次训练后的输出，以及所述多个语言模型各自经下一次训练后对应的插值系数，对所述多个语言模型进行下一次插值，直到得到所述跨领域语言模型。

3.根据权利要求2所述的方法，其特征在于，在对所述多个语言模型进行第r次插值之前，所述方法还包括：
按照以下公式确定所述多个语言模型各自经第r次训练后对应的插值系数，其中，

表示第r次训练后，第j个语言模型在第i类语料训练集上对应的插值系数，n表示所述多个语言模型的总数，Pij表示第j个语言模型经第r次训练后的输出，h表示第r-1次训练后第j个语言模型在第i类语料训练集上的λ值，i<＝n。

4.根据权利要求1所述的方法，其特征在于，在对所述多个语言模型进行插值，得到所述跨领域语言模型后，所述方法还包括：
根据NCE损失函数计算所述跨领域语言模型的损失值；
根据所述损失值对所述跨领域语言模型的模型参数进行优化。

5.根据权利要求...

【专利技术属性】
技术研发人员：谢福进，王志海，喻波，魏力，孙亚东，
申请(专利权)人：北京明朝万达科技股份有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人