词嵌入方法、装置与电子设备制造方法及图纸

技术编号：25708746 阅读：13 留言：0更新日期：2020-09-23 02:55

本公开提供一种词嵌入方法，包括：通过预设神经网络接收词向量数据，所述预设神经网络包括生成器和判决器；通过所述生成器对所述词向量数据提取特征张量，所述生成器基于反卷积网络形成；通过所述判决器对所述特征张量进行分类以输出分类结果，所述判决器基于卷积网络形成。本公开提供的词嵌入方法可以有效减少模型的可调整参数数量，增加模型深度，提高模型泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
词嵌入方法、装置与电子设备
本公开涉及机器学习
，具体而言，涉及一种基于生成器-判决器模型的词嵌入方法。
技术介绍
随着互联网技术的飞速发展，以互联网为载体的电商业务出现了爆发式的增长，产生了海量实时数据。这些数据中包含极具价值的用户信息，例如用户日志记录的用户行为数据，有助于分析获取用户行为偏好。大规模互联网系统产生的原始数据具有结构和非结构混合、高维稀疏、数据量大等特点，为了更好地分析用户的行为偏好进而预测用户行为，业内使用词嵌入(W2V，WordtoVec)技术构建文本数据中词与词之间相互关系、提取数据的通用特征，学习这些通用特征的低阶、高阶相互作用，完成对用户行为的分析或预测。FNN(FactorizationMachinesupportedNeuralNetwork，因子分解机神经网络)模型是一种常用的词嵌入模型。FNN模型可以将异构数据分为不同的域，并用FM(FactorizationMachine，因子分解机)算法将域内数据映射到一个共同的低维实向量空间，再使用多层感知机模型进行分析预测。但是，多层感知机模型的第一层参数对模型最终分析预测能力的影响较小，极大降低了预训练对FNN模型性能提升的影响；此外，多层感知机模型为全连接神经网络，模型可调整参数数量巨大，训练过程复杂，训练时容易出现过拟合问题。需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本公开的目的在于提供一种基于生成器...

【技术保护点】
1.一种词嵌入方法，其特征在于，包括：/n通过预设神经网络接收词向量数据，所述预设神经网络包括生成器和判决器；/n通过所述生成器对所述词向量数据提取特征张量，所述生成器基于反卷积网络形成；/n通过所述判决器对所述特征张量进行分类以输出分类结果，所述判决器基于卷积网络形成。/n

【技术特征摘要】
1.一种词嵌入方法，其特征在于，包括：
通过预设神经网络接收词向量数据，所述预设神经网络包括生成器和判决器；
通过所述生成器对所述词向量数据提取特征张量，所述生成器基于反卷积网络形成；
通过所述判决器对所述特征张量进行分类以输出分类结果，所述判决器基于卷积网络形成。

2.如权利要求1所述的词嵌入方法，其特征在于，所述分类结果为对预设目标变量的预测结果。

3.如权利要求1所述的词嵌入方法，其特征在于，所述生成器包括串联的多个生成器子模块，每个所述生成器子模块包括N1个反卷积层和N2个上采样层，所述多个生成器子模块的特征通道数相同。

4.如权利要求3所述的词嵌入方法，其特征在于，所述生成器子模块将前一个生成器子模块输出的特征张量通道数减半并进行空间放大。

5.如权利要求1所述的词嵌入方法，其特征在于，所述判决器包括串联的多个判决器子模块和多个全连接层，每个所述判决器子模块包括N3个卷积层和N4个下采样层，所述多个判决器子模块的特征通道数相同。

6.如权利要求5所述的词嵌入方法，其特征在于，所述判决器子模块的将前一个判决器子模块输出的特征张量通道数加倍并进行空间缩小，所述全连接层接收最后一个所述判决器子模块...

【专利技术属性】
技术研发人员：吕乐，程建波，彭南博，史英迪，范敏，
申请(专利权)人：京东数字科技控股有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人