基于深度卷积神经网络进行文本特征提取的方法技术

技术编号：19056889 阅读：1931 留言：0更新日期：2018-09-29 12:11

本发明专利技术提供基于深度卷积神经网络进行文本特征提取的方法，属于文本特征提取技术领域。该基于深度卷积神经网络进行文本特征提取的方法包括以下步骤：S1：将句子样本中的词转换为词向量；S2：通过深度卷积神经网络扫描所述词向量得到扫描特征；S3：通过对扫描特征进行采样生成深度特征；S4：将深度特征输入至分类层得到分类结果。本发明专利技术中将句子样本中的词转换为词向量，通过深度卷积神经网络扫描词向量得到扫描特征，通过对扫描特征进行采样生成深度特征，将深度特征输入至分类层得到分类结果，则完成对文本的特征提取，解决了句子长短不一的问题，提高了文本特征提取的准确率和性能，消耗资源更少，效率更高。

全部详细技术资料下载

【技术实现步骤摘要】
基于深度卷积神经网络进行文本特征提取的方法
本专利技术属于文本特征提取
，涉及基于深度卷积神经网络进行文本特征提取的方法。
技术介绍
随着互联网的快速发展，互联网已经成为了人们获取信息的主要渠道，互联网上的文本数据内容呈现着指数增长的趋势。互联网上的文本数据包括丰富的信息，这些信息对于我们构建知识库或知识图谱非常有用；但是人工进行相关知识提取的工作量过大，如果能够通过计算机理解并提取出有用的信息，这样就可以节省大量的人力。但互联网上的文本数据几乎都是以自然语言的形式存在，即无结构化的，计算机无法直接进行处理。为了解决这个问题，信息抽取技术应运而生，信息抽取技术从无结构化的文本数据中抽取出结构化数据。文本挖掘技术可以帮助人们快速有效的从海量数据中获取关键信息，而文本特征提取则是文本挖掘的关键步骤。
技术实现思路
本专利技术针对现有的技术存在的上述问题，提供基于深度卷积神经网络进行文本特征提取的方法，本专利技术所要解决的技术问题是：如何通过深度卷积神经网络对文本中的特征进行提取。本专利技术的目的可通过下列技术方案来实现：基于深度卷积神经网络进行文本特征提取的方法，包括以下步骤：S1：将句子样本中的词转换为词向量；S2：通过深度卷积神经网络扫描所述词向量得到扫描特征；S3：通过对扫描特征进行采样生成深度特征；S4：将深度特征输入至分类层得到分类结果。优选的，步骤S1中根据词典将句子样本分隔成词。优选的，步骤S1中通过embedding将词转换为词向量。优选的，步骤S2中具体包括：S21：将词向量进行计算分权得到特征矩阵；S22：通过深度卷积神经网络的滤波器扫描...

【技术保护点】
1.基于深度卷积神经网络进行文本特征提取的方法，其特征在于，包括以下步骤：S1：将句子样本中的词转换为词向量；S2：通过深度卷积神经网络扫描所述词向量得到扫描特征；S3：通过对扫描特征进行采样生成深度特征；S4：将深度特征输入至分类层得到分类结果。

【技术特征摘要】
1.基于深度卷积神经网络进行文本特征提取的方法，其特征在于，包括以下步骤：S1：将句子样本中的词转换为词向量；S2：通过深度卷积神经网络扫描所述词向量得到扫描特征；S3：通过对扫描特征进行采样生成深度特征；S4：将深度特征输入至分类层得到分类结果。2.如权利要求1所述的基于深度卷积神经网络进行文本特征提取的方法，其特征在于：步骤S1中根据词典将句子样本分隔成词。3.如权利要求1或2所述的基于深度卷积神经网络进行文本特征提取的方法，其特征在于：步骤S1中通过embedding将词转换为词向量。4.如权利要求3所述的基于深度卷积神经网络进行文本特征提取的方法，其特征在于，步骤S2中具体包括：S21：将词向量进行计算分权得到特征矩阵；S22：通过深度卷积神经网络的滤波器扫描特征矩阵得到扫描特征。5.如权利要求4所述的基于深度卷积神经网络进行文本特征提取的方法，其特征在于，步骤...

【专利技术属性】
技术研发人员：张黎，邹开红，宗旭，肖增辉，
申请(专利权)人：杭州闪捷信息科技股份有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人