一种词向量的增量学习方法、装置和电子设备制造方法及图纸

技术编号：18894519 阅读：21 留言：0更新日期：2018-09-08 10:58

本发明专利技术实施例提供了一种词向量的增量学习方法、装置和电子设备，该方法包括：获取新词；在已训练的基础词向量模型的基础上，对所述新词构造词增量向量模型；获取训练语料；采用所述训练语料对所述词向量增量模型进行训练，获得词向量，利用迁移学习的特性增量学习词向量，无需重新学习词向量，大大减少了时间的消耗，降低了资源的耗费。

Incremental learning method, device and electronic equipment for word vector

The embodiment of the invention provides an incremental learning method, device and electronic device for word vectors, which comprises: acquiring new words; constructing a word incremental vector model for the new words on the basis of a trained basic word vector model; acquiring training corpus; and advancing the word vector incremental model with the training corpus. Word vectors are acquired by line training. Word vectors are incrementally learnt by using the characteristics of transfer learning. No need to re-learn word vectors is needed. This greatly reduces the consumption of time and resources.

全部详细技术资料下载

【技术实现步骤摘要】
一种词向量的增量学习方法、装置和电子设备
本专利技术涉及机器学习
，特别是涉及一种词向量的增量学习方法、装置和电子设备。
技术介绍
word2vec算法是一种快算速度的近义词算法，原本用于将词做一个embedding(向量)，从大量的离散id类别映射到一个几十到几百维度的N维空间中的一个点。word2vec算法同样也用于具备语义相关性的序列，从而训练词向量。例如，在推荐场景中用户浏览的记录，每一次会话或者时间间隔比较短的时间记录都可以认为是一次连续的时间序列，从而应用word2vec算法。目前，随着新词的加入通常会需要对词向量进行扩展，此时，需要重新学习词向量。
技术实现思路
本专利技术实施例提出了一种词向量的增量学习方法、装置和电子设备，以解决加入新词需要重新学习词向量的问题。第一方面，本专利技术实施例提供了一种词向量的增量学习方法，包括：获取新词；在已训练的基础词向量模型的基础上，对所述新词构造词增量向量模型；获取训练语料；采用所述训练语料对所述词向量增量模型进行训练，获得词向量。优选地，所述基础词向量模型为负采样的第一神经网络，所述第一神经网络包括基础词向量表与第一输出层，所述第一输出层中具有基础输出参数；所述在已训练的基础词向量模型的基础上，对所述新词构造词增量向量模型，包括：构造负采样的第二神经网络作为增量词向量模型，所述第二神经网络具有增量词向量表与第二输出层；在所述基础词向量表的基础上初始化所述新词所属的增量词向量表；在所述第二输出层中，使用所述基础输出参数的基础上初始化所述新词对应的增量输出参数。优选地，所述在所述基础词向量表的基础上初始...

【技术保护点】
1.一种词向量的增量学习方法，其特征在于，包括：获取新词；在已训练的基础词向量模型的基础上，对所述新词构造词增量向量模型；获取训练语料；采用所述训练语料对所述词向量增量模型进行训练，获得词向量。

【技术特征摘要】
1.一种词向量的增量学习方法，其特征在于，包括：获取新词；在已训练的基础词向量模型的基础上，对所述新词构造词增量向量模型；获取训练语料；采用所述训练语料对所述词向量增量模型进行训练，获得词向量。2.根据权利要求1所述的方法，其特征在于，所述基础词向量模型为负采样的第一神经网络，所述第一神经网络包括基础词向量表与第一输出层，所述第一输出层中具有基础输出参数；所述在已训练的基础词向量模型的基础上，对所述新词构造词增量向量模型，包括：构造负采样的第二神经网络作为增量词向量模型，所述第二神经网络具有增量词向量表与第二输出层；在所述基础词向量表的基础上初始化所述新词所属的增量词向量表；在所述第二输出层中，使用所述基础输出参数的基础上初始化所述新词对应的增量输出参数。3.根据权利要求2所述的方法，其特征在于，所述在所述基础词向量表的基础上初始化所述新词所属的增量词向量表，包括：使用所述基础词向量表初始化所述增量词向量表；将所述新词插入所述增量词向量表中；在所述增量词向量表中随机初始化所述新词的词向量。4.根据权利要求2所述的方法，其特征在于，所述基础输出参数包括基础权值与基础偏置值，所述增量输出参数包括增量权值与增量偏置值；所述在所述第二输出层中，使用所述基础输出参数的基础上初始化所述新词对应的增量输出参数，包括：在所述增量词向量表与所述基础词向量表中查询相同的词，作为原词；使用所述基础权值与所述基础偏置值初始化所述原词对应的增量权值与增量偏置值；对所述新词生成新的增量权值与增量偏置值；随机初始化所述新词对应的增量权值与增量偏置值。5.根据权利要求1-4任一项所述的方法，其特征在于，所述采用所述训练语料对所述词向量增量模型进行训练，获得词向量，包括：使用...

【专利技术属性】
技术研发人员：庄正中，
申请(专利权)人：广州荔支网络技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人