The embodiment of the specification discloses a word vector processing method, device and device. The methods include: obtaining the words obtained from the word segmentation word, establishing the word vector of each word, training the convolution neural network according to the vector of each word and the word vector of the context words in the corpus, and obtaining the training of word vectors of each word according to the word vector of each word and the convolution neural network after training. Result\u3002 One
【技术实现步骤摘要】
词向量处理方法、装置以及设备
本说明书涉及计算机软件
,尤其涉及词向量处理方法、装置以及设备。
技术介绍
如今的自然语言处理的解决方案,大都采用基于神经网络的架构,而在这种架构下一个重要的基础技术就是词向量。词向量是将词映射到一个固定维度的向量,该向量表征了该词的语义信息。在现有技术中,常见的用于生成词向量的算法比如包括:谷歌公司的词向量算法、微软公司的深度神经网络算法等。基于现有技术,需要一种更准确的词向量方案。
技术实现思路
本说明书实施例提供词向量处理方法、装置以及设备,用以解决如下技术问题:需要一种更准确的词向量方案。为解决上述技术问题,本说明书实施例是这样实现的:本说明书实施例提供的一种词向量处理方法,包括:获取对语料分词得到的各词;建立所述各词的词向量;根据所述各词的词向量,以及所述各词在所述语料中的上下文词的词向量,对卷积神经网络进行训练;根据所述各词的词向量和训练后的所述卷积神经网络,获取所述各词的词向量的训练结果。本说明书实施例提供的一种词向量处理装置,包括:获取模块,获取对语料分词得到的各词;建立模块,建立所述各词的词向量;训练模块,根据所述各词的词向量,以及所述各词在所述语料中的上下文词的词向量,对卷积神经网络进行训练;处理模块,根据所述各词的词向量和训练后的所述卷积神经网络,获取所述各词的词向量的训练结果。本说明书实施例提供的另一种词向量处理方法,包括:步骤1,建立通过对语料分词得到的各词构成的词汇表,所述各词不包括在所述语料中出现次数少于设定次数的词;跳转步骤2;步骤2,确定各词的总数量,相同的词只计一次;跳转步骤3;步骤3,为 ...
【技术保护点】
1.一种词向量处理方法,包括:
【技术特征摘要】
1.一种词向量处理方法,包括:获取对语料分词得到的各词;建立所述各词的词向量;根据所述各词的词向量,以及所述各词在所述语料中的上下文词的词向量,对卷积神经网络进行训练;根据所述各词的词向量和训练后的所述卷积神经网络,获取所述各词的词向量的训练结果。2.如权利要求1所述的方法,所述建立所述各词的词向量,具体包括:确定所述各词的总数量;分别为所述各词建立维度为所述总数量的词向量,其中,所述各词的词向量互不相同,所述词向量中有一个元素为1,其余元素为0。3.如权利要求1所述的方法,所述根据所述各词的词向量,以及所述各词在所述语料中的上下文词的词向量,对卷积神经网络进行训练,具体包括:根据所述各词的词向量,以及所述各词在所述语料中的上下文词和负样例词的词向量,对卷积神经网络进行训练。4.如权利要求3所述的方法,所述根据所述各词的词向量,以及所述各词在所述语料中的上下文词和负样例词的词向量,对卷积神经网络进行训练,具体包括:对分词后的所述语料进行遍历,对遍历到的当前词执行:确定当前词在分词后的所述语料中的一个或多个上下文词以及负样例词;将当前词的上下文词的词向量输入卷积神经网络的卷积层进行卷积计算;将卷积计算结果输入所述卷积神经网络的池化层进行池化计算,得到第一向量;将当前词的词向量输入所述卷积神经网络的全连接层进行计算,得到第二向量,以及将当前词的负样例词的词向量输入所述卷积神经网络的全连接层进行计算,得到第三向量;根据所述第一向量、所述第二向量、所述第三向量,以及指定的损失函数,更新所述卷积神经网络的参数。5.如权利要求4所述的方法,所述进行卷积计算,具体包括:按照如下公式,进行卷积计算:其中,xi表示第i个上下文词的词向量,xi:i+θ-1表示将第i~i+θ-1个上下文词的词向量拼接得到的向量,yi表示通过所述卷积计算得到的向量的第i个元素,ω表示卷积层的权重参数,ζ表示卷积层的偏置参数,σ表示激励函数。6.如权利要求4所述的方法,所述进行池化计算,具体包括:进行最大化池化计算或者平均池化计算。7.如权利要求4所述的方法,所述根据所述第一向量、所述第二向量、所述第三向量,以及指定的损失函数,更新所述卷积神经网络的参数,具体包括:计算所述第二向量与所述第一向量的第一相似度,以及所述第三向量与所述第一向量的第二相似度;根据所述第一相似度、所述第二相似度,以及指定的损失函数,更新所述卷积神经网络的参数。8.如权利要求4所述的方法,所述损失函数具体包括:其中,c表示所述第一向量,w表示所述第二向量,w'm表示第m个负样例词对应的所述第三向量,ω表示卷积层的权重参数,ζ表示卷积层的偏置参数,表示全连接层的权重参数,τ表示全连接层的偏置参数,γ表示超参数,s表示相似度计算函数,λ表示负样例词的数量。9.如权利要求1所述的方法,所述根据所述各词的词向量和训练后的所述卷积神经网络,获取所述各词的词向量的训练结果,具体包括:将所述各词的词向量分别输入训练后的所述卷积神经网络的全连接层进行计算,获得计算后输出的向量,作为对应的词向量训练结果。10.一种词向量处理装置,包括:获取模块,获取对语料分词得到的各词;建立模块,建立所述各词的词向量;训练模块,根据所述各词的词向量,以及所述各词在所述语料中的上下文词的词向量,对卷积神经网络进行训练;处理模块,根据所述各词的词向量和训练后的所述卷积神经网络,获取所述各词的词向量的训练结果。11.如权利要求10所述的装置,所述建立模块建立所述各词的词向量,具体包括:所述建立模块确定所述各词的总数量;分别为所述各词建立维度为所述总数量的词向量,其中,所述各词的词向量互不相同,所述词向量中有一个元素为1,其余元素为0。12.如权利要求10所述的装置,所述训练模块根据所述各词的词向量,以及所述各词在所述语料中的上下文词的词向量,对卷积神经网络进行训练,具体包括:所述训练模块根据所述各词的词向量,以及所述各词在所述语料中的上下文词和负样例词的词向量,对卷积神经网络进行训练。13.如权利要求12所述的装置,所述训练模块根据所述各词的词向量,以及所述各词在所述语料中的上下文词和负样例词的词向量,对卷积神经网络进行训练,具体包括:所述训练模块对分词后的所述语料进行遍历,对遍历到的当前词执行:确定当前词在分词后的所述语料中的一个或多个上下文词以及负样例词;将当前词的上下文词的词向量输入卷积神经网络的卷积层进行卷积...
【专利技术属性】
技术研发人员:曹绍升,周俊,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。