文本分类模型的构建方法、系统以及计算机可读存储介质技术方案

技术编号：21034440 阅读：31 留言：0更新日期：2019-05-04 05:29

本发明专利技术提出了一种文本分类模型的构建方法、文本分类模型的构建系统和计算机可读存储介质。其中，文本分类模型的构建方法包括：采集至少三轮对话信息；将至少三轮对话信息并行输入至卷积神经网络文本分类模型；根据至少三轮对话信息对卷积神经网络文本分类模型进行训练，得到文本分类模型。利用并行输入的对话信息对卷积神经网络文本分类模型进行训练，由于训练过程中使用的并行输入的信息具有上下文关联关系的对话信息，因此，得到的训练结果能够实现结合上下文进行文本分类，进而提高文本分类的准确性。

Construction Method, System and Computer Readable Storage Medium of Text Classification Model

全部详细技术资料下载

【技术实现步骤摘要】
文本分类模型的构建方法、系统以及计算机可读存储介质
本专利技术涉及文本分类
，具体而言，涉及一种文本分类模型的构建方法、文本分类模型的构建系统和计算机可读存储介质。
技术介绍
多通道卷积神经网络多应用在图像处理领域，如应用在人机交互中图像识别，或者在视频目标图像追踪中，实现了目标的快速确定。相关技术中，文本分类运用的是softmax分类器(一种损失函数运用softmax函数的分类器)，但softmax函数有严重的问题是softmax分类输出的概率(0～1)互斥。某一类别概率高会让其他类别概率都很低。比如在政务文本分类中，一条数据既是社保类别又是征缴业务类别，所以很难用单一类别判断数据。Softmax分类器原本用于卷积神经网络图像识别，需要对1000个label(标签)输出确定类别，然而，相关技术中，文本分类运用过程中是对单一数据的进行训练的结果，得到的训练模型不能对具有上下文关联的信息进行关联处理，致使准确率较低。因此，亟需一种文本分类模型的构建方法，以使构建得到的模型能够实现上下文关联处理，进而提高分类的准确性。
技术实现思路
本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。为此，本专利技术第一个方面在于提出一种文本分类模型的构建方法。本专利技术的第二个方面在于提出一种文本分类模型的构建系统。本专利技术的第三个方面在于提出一种计算机可读存储介质。有鉴于此，根据本专利技术的一个方面，提出了一种文本分类模型的构建方法，包括：采集至少三轮对话信息；将至少三轮对话信息并行输入至卷积神经网络文本分类模型；根据至少三轮对话信息对卷积神经网络文本分类模...

【技术保护点】
1.一种文本分类模型的构建方法，其特征在于，包括：采集至少三轮对话信息；将所述至少三轮对话信息并行输入至卷积神经网络文本分类模型；根据所述至少三轮对话信息对所述卷积神经网络文本分类模型进行训练，得到所述文本分类模型。

【技术特征摘要】
1.一种文本分类模型的构建方法，其特征在于，包括：采集至少三轮对话信息；将所述至少三轮对话信息并行输入至卷积神经网络文本分类模型；根据所述至少三轮对话信息对所述卷积神经网络文本分类模型进行训练，得到所述文本分类模型。2.根据权利要求1所述的文本分类模型的构建方法，其特征在于，所述至少三轮对话信息通过以下任意一种方式并行输入至卷积神经网络文本分类模型：使用字向量映射的方式将所述至少三轮对话信息中每一轮对话信息逐字映射到向量空间，生成对应的第一图像，将所述至少三轮对话信息对应的第一图像并行输入至所述卷积神经网络文本分类模型；将所述至少三轮对话信息通过独热编码编译成第二图像输入至所述卷积神经网络文本分类模型。3.根据权利要求2所述的文本分类模型的构建方法，其特征在于，所述根据所述至少三轮对话信息对所述卷积神经网络文本分类模型进行训练，得到所述文本分类模型，具体包括：将所述第一图像或所述第二图像输入至卷积层进行卷积运算，并将运算结果输入池化层中使用预设方法进行降采样处理；将降采样处理结果输入至全连接层，通过分类器进行分类，并将分类结果输入至优化器进行优化，得到所述文本分类模型。4.根据权利要求3所述的文本分类模型的构建方法，其特征在于，所述预设方法为max-pooling。5.根据权利要求3所述的文本分类模型的构建方法，其特征在于，所述将降采样处理结果输入至全连接层，通过分类器进行分类，并将分类结果输入至优化器进行优化具体包括：将降采样处理结果输入至全连接层，通过sigmoid分类器进行分类，根据选定的sigmoid损失函数进行迭代运算，直至所述sigmoid损失函数的数值最小。6.根据权利要求5所述的文本分类模型的构建方法，其特征在于，所述根据选定的sigmoid损失函数进行迭代运算，直至所述sigmoid损失函数的数值最小具体包括：使用Adam改进后的随机梯度下降算法对选定的所述sigmoid损失函数进行迭代运算，直至所述sigmoid损失函数的数值最小。7.根据权利要求2所述的文本分类模型的构建方法，其特征在于，所述字向量为采用中英文翻译训练改进的Cove预训练字向量。8.根据权利要求2所述的文本分类模型的构建方法，其特征在于，在所述将降采样处理结果输入至全连接层之后，在所述通过sigmoid分类器进行分类之前，还包括：将所述将降采样处理结果依次输入dropout和relu激活。9.根据权利要求1所述的文本分类模型的构建方法，其特征在于，在采集至少三轮对话信息之后，在所述将所述至少三轮对话信息并行输入至卷积神经网络文本分类模型之前，还包括：对所述至少...

【专利技术属性】
技术研发人员：程源泉，欧阳一村，
申请(专利权)人：深圳中兴网信科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人