基于神经网络的文本分类方法、系统及计算机设备技术方案

技术编号:22166898 阅读:28 留言:0更新日期:2019-09-21 10:34
本发明专利技术实施例提供了一种基于神经网络的文本分类方法,所述方法包括:对待分类文本进行分词操作以获取L个分词;对所述L个分词分别进行词向量映射,以获取L*d维词向量矩阵,其中每个分词映射为一个d维词向量;通过卷积层对所述L*d维词向量矩阵执行卷积操作,得到M个卷积特征图,所述卷积层包括M个f*d的卷积核;将每个卷积特征图中的第j个元素配置到第j个输入向量中,得到(L‑f+1)个输入向量,1≤j≤(L‑f+1);及将所述(L‑f+1)个输入向量依顺序输入到长短短期记忆网络模型中,计算所述待分类文本的分类向量。本发明专利技术实施例提供的文本分类方法,可以有效避免文本分类错误的问题,从而提高分类准确率。

Text Classification Method, System and Computer Equipment Based on Neural Network

【技术实现步骤摘要】
基于神经网络的文本分类方法、系统及计算机设备
本专利技术实施例涉及计算机数据处理领域,尤其涉及一种基于神经网络的文本分类方法、系统、计算机设备及计算机可读存储介质。
技术介绍
文本分类是自然语言处理的重要任务之一,类似于文章的行业分类,情感分析等许多自然语言处理任务其实质都是文本的分类。目前常用的文本分类器主要可以分成两大类:基于先验规则的文本分类器和基于模型的文本分类器。基于先验规则的文本分类器的分类规则需要靠人工挖掘或先验知识的积累。基于模型的文本分类器,如基于LDA(LatentDirichletAllocation,文档主题生成模型)等主题模型对文本分类。然而,采用上述分类方法经常会出现分类错误的问题,导致分类的准确率低。
技术实现思路
有鉴于此,本专利技术实施例的目的是提供一种基于神经网络的文本分类方法、系统、计算机设备及计算机可读存储介质,解决文本分类错误、分类准确率低的问题。为实现上述目的,本专利技术实施例提供了一种基于神经网络的文本分类方法,包括以下步骤:对待分类文本进行分词操作以获取L个分词;对所述L个分词分别进行词向量映射,以获取L*d维词向量矩阵,其中每个分词映射为一个d维词向量;通过卷积层对所述L*d维词向量矩阵执行卷积操作,得到M个卷积特征图,所述卷积层包括M个f*d的卷积核;将每个卷积特征图中的第j个元素配置到第j个输入向量中,得到(L-f+1)个输入向量,1≤j≤(L-f+1),其中所述第j个输入向量中的元素排列顺序由各个元素所在的特征卷积图的i值决定,i为卷积核标识,1≤i≤M;及将所述(L-f+1)个输入向量依顺序输入到长短短期记忆网络模型中,计算所述待分类文本的分类向量。优选地,所述对待分类文本进行分词操作以获取L个分词的步骤,包括:获取浏览所述待分类文本的多个用户的多个用户属性信息;根据所述多个用户的多个用户属性信息,分析得到浏览所述待分类文本的目标群体;根据所述目标群体的历史用户画像,得到所述待分类文本对应每个主题的预测概率;根据所述每个主题的预测概率,筛选预测概率大于预设阀值的多个目标主题;及基于所述多个目标主题对所述待分类文本进行分词操作。优选地,所述基于所述多个目标主题对所述待分类文本进行分词操作的步骤,包括:根据所述多个目标主题的多个主题词库,对所述待分类文本进行分词操作。优选地,所述基于所述多个目标主题对所述待分类文本进行分词操作的步骤,包括:根据每个目标主题关联的主题词库分别对所述待分类文本进行分词操作,以得到多个分词集合;对比各个分词集合在相应字符位置区域的分词是否相同;如果相同,则将相应字符位置区域的分词放入目标分词集合中;及如果不相同,则选择将其中一个分词集合在相应字符位置区域的分词放入到所述目标分词集合。优选地,所述选择将其中一个分词集合在相应字符位置区域的分词放入到所述目标分词集合的步骤,包括:通过隐马尔科夫模型分析各个分词集合在相应字符位置区域的分词的被划分概率;及选择将被划分概率最高的分词放入到所述目标分词集合中。优选地,所述选择将其中一个分词集合在相应字符位置区域的分词放入到所述目标分词集合的步骤,包括:通过隐马尔科夫模型分析各个分词集合在相应字符位置区域的分词的被划分概率;根据各个分词集合在相应字符位置区域的分词的被划分概率以及各个分词集合关联的目标主题的预测概率,计算出各个分词集合在相应字符位置区域的分词的综合权重系数;及选择将综合权重系数最高的分词加入目标分词集合中。优选地,将所述(L-f+1)个输入向量依顺序输入到长短短期记忆网络模型中,计算所述待分类文本的分类向量的步骤,包括:通过所述长短期记忆网络模型获取(L-f+1)个输出向量;及将所述(L-f+1)个输出向量输入到分类层,通过所述分类层输出分类向量。为实现上述目的,本专利技术实施例还提供了基于神经网络的文本分类系统,包括:分词模块,用于对待分类文本进行分词操作以获取L个分词;词向量映射模块,用于对所述L个分词分别进行词向量映射,以获取L*d维词向量矩阵,其中每个分词映射为一个d维词向量;卷积模块,用于通过卷积层对所述L*d维词向量矩阵执行卷积操作,得到M个卷积特征图,所述卷积层包括M个f*d的卷积核;特征映射模块,用于将每个卷积特征图中的第j个元素配置到第j个输入向量中,得到(L-f+1)个输入向量,1≤j≤(L-f+1),其中所述第j个输入向量中的元素排列顺序由各个元素所在的特征卷积图的i值决定,i为卷积核标识,1≤i≤M;及预测模块,用于将所述(L-f+1)个输入向量依顺序输入到长短短期记忆网络模型中,计算所述待分类文本的分类向量。为实现上述目的,本专利技术实施例还提供了一种计算机设备,所述计算机设备存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被处理器执行时实现如上所述的基于神经网络的文本分类方法的步骤。为实现上述目的,本专利技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有计算机程序,所述计算机程序可被至少一个处理器所执行,以使所述至少一个处理器执行如上所述的基于神经网络的文本分类方法的步骤。本专利技术实施例提供的基于神经网络的文本分类方法、系统、计算机设备及计算机可读存储介质,结合卷积和长短期基于网络模型,形成CNN+LSTM的文本分类模型,有效兼顾文本的局部上下文特征,和大跨度的词与词之间的依赖关系。因此,可以解决文本分类错误、分类准确率低的问题,尤其适用于长文本的文本分类任务。附图说明图1为本专利技术基于神经网络的文本分类方法实施例一的流程示意图。图2为图1中步骤S100的具体流程示意图。图3为图2中步骤S1008的具体流程示意图。图4为本专利技术文本分类系统实施例二的程序模块示意图。图5为本专利技术计算机设备实施例三的硬件结构示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本专利技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。以下实施例将以计算机设备2为执行主体进行示例性描述。实施例一参阅图1,示出了本专利技术实施例一之基于神经网络的文本分类方法的步骤流程图。可以理解,本方法实施例中的流程图不用于对执行步骤的顺序进行限定。具体如下。步骤S100,对待分类文本进行分词操作以获取L个分词。所述分词操作可以基于词典分词算法:正向最大匹配法、逆向最大匹配法和双向匹配分词法,也可以基于隐马尔科夫模型HMM、CRF、SVM、深度学习等算法。在示例性的实施例中,参阅图2,所述步骤S100可以进一步包括步骤S1000~步骤S1008:步骤S100本文档来自技高网...

【技术保护点】
1.一种基于神经网络的文本分类方法,其特征在于,所述方法包括:对待分类文本进行分词操作以获取L个分词;对所述L个分词分别进行词向量映射,以获取L*d维词向量矩阵,其中每个分词映射为一个d维词向量;通过卷积层对所述L*d维词向量矩阵执行卷积操作,得到M个卷积特征图,所述卷积层包括M个f*d的卷积核;将每个卷积特征图中的第j个元素配置到第j个输入向量中,得到(L‑f+1)个输入向量,1≤j≤(L‑f+1),其中所述第j个输入向量中的元素排列顺序由各个元素所在的特征卷积图的i值决定,i为卷积核标识,1≤i≤M;及将所述(L‑f+1)个输入向量依顺序输入到长短短期记忆网络模型中,计算所述待分类文本的分类向量。

【技术特征摘要】
1.一种基于神经网络的文本分类方法,其特征在于,所述方法包括:对待分类文本进行分词操作以获取L个分词;对所述L个分词分别进行词向量映射,以获取L*d维词向量矩阵,其中每个分词映射为一个d维词向量;通过卷积层对所述L*d维词向量矩阵执行卷积操作,得到M个卷积特征图,所述卷积层包括M个f*d的卷积核;将每个卷积特征图中的第j个元素配置到第j个输入向量中,得到(L-f+1)个输入向量,1≤j≤(L-f+1),其中所述第j个输入向量中的元素排列顺序由各个元素所在的特征卷积图的i值决定,i为卷积核标识,1≤i≤M;及将所述(L-f+1)个输入向量依顺序输入到长短短期记忆网络模型中,计算所述待分类文本的分类向量。2.根据权利要求1所述的基于神经网络的文本分类方法,其特征在于,所述对待分类文本进行分词操作以获取L个分词的步骤,包括:获取浏览所述待分类文本的多个用户的多个用户属性信息;根据所述多个用户的多个用户属性信息,分析得到浏览所述待分类文本的目标群体;根据所述目标群体的历史用户画像,得到所述待分类文本对应每个主题的预测概率;根据所述每个主题的预测概率,筛选预测概率大于预设阀值的多个目标主题;及基于所述多个目标主题对所述待分类文本进行分词操作。3.根据权利要求2所述的基于神经网络的文本分类方法,其特征在于,所述基于所述多个目标主题对所述待分类文本进行分词操作的步骤,包括:根据所述多个目标主题的多个主题词库,对所述待分类文本进行分词操作。4.根据权利要求2所述的基于神经网络的文本分类方法,其特征在于,所述基于所述多个目标主题对所述待分类文本进行分词操作的步骤,包括:根据每个目标主题关联的主题词库分别对所述待分类文本进行分词操作,以得到多个分词集合;对比各个分词集合在相应字符位置区域的分词是否相同;如果相同,则将相应字符位置区域的分词放入目标分词集合中;及如果不相同,则选择将其中一个分词集合在相应字符位置区域的分词放入到所述目标分词集合。5.根据权利要求4所述的基于神经网络的文本分类方法,其特征在于,所述选择将其中一个分词集合在相应字符位置区域的分词放入到所述目标分词集合的步骤,包括:通过隐马尔科夫模型分析各个分词集合在相应字符位置区域的分词的被划分概率;及选择...

【专利技术属性】
技术研发人员:于凤英王健宗
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1