The invention provides a method and a system for short text classification. The method is that text vector matrix is obtained by text processing for classified short text. Based on convolution neural network, feature extraction of text vector matrix is carried out, and multi-dimensional convolution features corresponding to different angles are obtained, and one-dimensional precise features corresponding to each multi-dimensional convolution feature are obtained by compressing each multi-dimensional convolution feature. For each one-dimensional feature, the weight of each one-dimensional feature is calculated. For each multi-dimensional convolution feature, the multi-dimensional convolution feature is weighted based on the corresponding weight value of the one-dimensional precise feature, and the adaptive convolution feature is used to determine the category of short text to be classified. In this scheme, the multi-dimensional convolution features of short texts are extracted from different angles, and the weights of multi-dimensional convolution features of different angles in short texts are calculated. Based on this weight calculation, the adaptive convolution feature for determining short text categories is obtained, which improves the accuracy of short text classification.
【技术实现步骤摘要】
一种短文本分类的方法及系统
本专利技术涉及数据处理
,具体涉及一种短文本分类的方法及系统。
技术介绍
随着科学技术的发展,使用神经网络算法构建分类模型来对短文本进行分类逐渐成为主流的分类方式之一,其中基于卷积神经网络的分类模型在短文本分类上取得了较好的性能。基于卷积神经网络算法构建分类模型的步骤为:将短文本训练数据集作为网络模型的输入,利用多个卷积核从多个角度抽取文本特征,并拼接每个卷积特征中最大的特征作为文本的最终特征表示,进而使用全连接层对文本表示进行类别预测,使模型得到的预测的类别分布不断逼近真实的类别分布,根据逼近的过程利用反向传播不断优化模型参数,使模型收敛,从而得到拟合训练数据且泛化能力较好的短文本分类模型。短文本使用较少的词就能完整表达句意,因此用词精炼且每个词都可能表达不同角度的主题类别,但是,卷积神经网络在处理多角度特征时,其认为每个角度特征对文本表示的重要性程度是一致的,直接将各个角度特征进行拼接,可能导致文本特征的区分度不强且文本特征表示的信息度不够,因此降低了分类的准确率。
技术实现思路
有鉴于此,本专利技术实施例提供一种短文本分类的方法 ...
【技术保护点】
1.一种短文本分类的方法,其特征在于,所述方法包括:对待分类短文本进行文本处理得到文本向量矩阵;基于卷积神经网络对所述文本向量矩阵进行特征抽取,得到多个不同角度对应的多维卷积特征,并对每一所述多维卷积特征进行压缩处理得到每一所述多维卷积特征对应的一维精要特征,每一角度对应一个多维卷积特征;针对每一所述一维精要特征,计算每一所述一维精要特征的权重值;针对每一所述多维卷积特征,基于所述一维精要特征对应的权重值,对所述多维卷积特征进行加权,利用得到的自适应的卷积特征确定所述待分类短文本的类别。
【技术特征摘要】
1.一种短文本分类的方法,其特征在于,所述方法包括:对待分类短文本进行文本处理得到文本向量矩阵;基于卷积神经网络对所述文本向量矩阵进行特征抽取,得到多个不同角度对应的多维卷积特征,并对每一所述多维卷积特征进行压缩处理得到每一所述多维卷积特征对应的一维精要特征,每一角度对应一个多维卷积特征;针对每一所述一维精要特征,计算每一所述一维精要特征的权重值;针对每一所述多维卷积特征,基于所述一维精要特征对应的权重值,对所述多维卷积特征进行加权,利用得到的自适应的卷积特征确定所述待分类短文本的类别。2.根据权利要求1所述的方法,其特征在于,所述对待分类短文本进行文本处理得到文本向量矩阵,包括:对所述待分类短文本进行分词处理以及去停用词处理,得到第一词表;过滤所述第一词表中的低频词,得到第二词表;为所述第二词表中的词进行编号,得到包含词和词编号的对应关系的第一文本序列;基于所述第一文本序列的序列长度,对所述第一文本序列进行补零处理或截断处理或无处理,得到第二文本序列;基于词向量矩阵,将所述第二文本序列映射得到所述文本向量矩阵,所述词向量矩阵从预先训练好的词向量模型获得。3.根据权利要求1所述的方法,其特征在于,所述基于卷积神经网络对所述文本向量矩阵进行特征抽取,得到多个不同角度对应的多维卷积特征,并对每一所述多维卷积特征进行压缩处理得到每一所述多维卷积特征对应的一维精要特征,包括:基于所述卷积神经网络中预设的每一卷积核,对所述文本向量矩阵进行卷积操作,得到多个不同角度对应的多维卷积特征,每一所述卷积核对应一角度;通过平均池化操作对每一所述多维卷积特征进行压缩,得到每一所述多维卷积特征对应的一维精要特征。4.根据权利要求1所述的方法,其特征在于,所述针对每一所述一维精要特征,计算每一所述一维精要特征的权重值,包括:随机初始化参数矩阵和偏置向量;针对每一所述一维精要特征,基于网络参数对所述一维精要特征进行优化,得到包含每一所述一维精要特征在所述待分类短文本中的重要性的第一重要性集合,所述网络参数包括卷积核、所述参数矩阵和偏置向量;基于RELU激活函数,将所述第一重要性集合中无用的一维精要特征置零,得到第二重要性集合;基于sigmoid函数对所述第二重要性集合进行压缩,得到每一所述一维精要特征的权重值。5.根据权利要求1所述的方法,其特征在于,所述针对每一所述多维卷积特征,基于所述一维精要特征对应的权重值,对所述多维卷积特征进行加权,得到用于确定所述待分类短文本类别的自适应的卷积特征,包括:针对每一所述多维卷积特征,对所述多维卷积特征进行最大池化操作,得到每一所述多维卷积特征对应的最优卷积特征;将每一所述一维精要特征对应的权重值和最优卷积特征进行加权处理,得到多个加权卷积特征;对多个所述加权卷积特征进行拼接处理,得到一个自适应的卷积特征;将所述自适应的卷积特征输入预先构建的分类子模型中,基于所述自适应的卷积特征中最大的加权卷积特...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。