文本分类方法及装置、存储介质、电子装置制造方法及图纸

技术编号:27936764 阅读:22 留言:0更新日期:2021-04-02 14:17
本发明专利技术公开了一种文本分类方法及装置、存储介质、电子装置,其中,上述方法包括:获取文本数据中的词向量矩阵,对词向量矩阵进行多个感受野的卷积处理,以得到多个卷积层;对多个卷积层通过残差进行叠加连接,以得到多个卷积层的目标卷积层,残差用于表示多个卷积层中的每一卷积层的残差值;提取目标卷积层的目标特征,将目标特征输入到目标逻辑函数中,得到函数输出结果,根据函数输出结果确定文本数据的类别,即通过获取文本数据的目标卷积层对应目标特征的概率值,进而确定不同概率值对应的文本数据类别,解决了相关技术中,对短文本分类的准确率太低以及预测速度过慢等问题,提高了文本分类模型的训练速度以及分类准确率。

【技术实现步骤摘要】
文本分类方法及装置、存储介质、电子装置
本专利技术涉及通信领域,具体而言,涉及一种文本分类方法及装置、存储介质、电子装置。
技术介绍
在智能问答领域中通常会涉及短文本的分类问题,近些年以transformer结构为主的bert(是一个预训练的模型)及其变种模型,通过预训练现在大数据上获得高质量的嵌入(embedding),再通过特征提取器(fineturning)来处理具体的任务,刷新了各大榜单,但是这些模型的核心都是如何让模型获得更长的长距离信息记忆。进而智能问答领域中通常会涉及短文本的分类问题,用于以判断用户的意图时,由于文本一般较短,使得提取的特征相当敏感,模型结构的稍加改动,或者模型参数W初始化方法的不同,都会对模型有很大的影响。因此,无法应用于对模型的准确率以及预测速度具有很高要求的工业生产中。此外,由于在短文本分类中,文本本身很短,一般在20字左右,其实更重要的是如何精准的判断出文本所蕴含的信息,并不需要进行记忆。对于短文本分类,bert等大规模模型预测速度过慢,并且效果一般。针对相关技术中,对短文本分类的准确率太低以及预测速度过慢等问题,尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种文本分类方法及装置、存储介质、电子装置,以至少解决相关技术中,对短文本分类的准确率太低以及预测速度过慢等问题。根据本专利技术的一个实施例,提供了一种文本分类方法,包括:获取文本数据中的词向量矩阵,对所述词向量矩阵进行多个感受野的卷积处理,以得到多个卷积层;对所述多个卷积层通过残差进行叠加连接,以得到所述多个卷积层的目标卷积层,其中,所述残差用于表示所述多个卷积层中的每一卷积层的残差值;提取所述目标卷积层的目标特征,将所述目标特征输入到目标逻辑函数中,得到函数输出结果,根据所述函数输出结果确定所述文本数据的类别。在一个示例性的实施例中,获取文本数据中的词向量矩阵,包括:从所述文本数据中获取所有词的词向量,得到不同词对应的不同词向量,其中,所述词向量用于唯一标识所述文本数据中的词;将所述不同词向量聚合在一个矩阵中,得到所述词向量矩阵。在一个示例性的实施例中,对所述词向量矩阵进行多个感受野的卷积处理,以得到多个卷积层之后,所述方法还包括:获取预设的激活函数;通过所述激活函数对所述多个卷积层进行激活;对激活后的多个卷积层中不符合预设条件的卷积层进行丢弃处理。在一个示例性的实施例中,对所述多个卷积层通过残差进行叠加连接,以得到所述卷积层的目标卷积层,包括:确定所述多个卷积层中每一个卷积层与标准卷积层的残差值,得到多个残差,其中,每一个卷积层对应一个标准卷积层;获取所述多个残差中小于预设阈值的残差对应的多个卷积层,将小于预设阈值的残差对应的多个卷积层进行叠加连接,以得到所述卷积层的目标卷积层。在一个示例性的实施例中,对所述多个卷积层通过残差进行叠加连接,以得到所述卷积层的目标卷积层之后,所述方法还包括:对所述目标卷积层进行归一化处理,并将归一化后的目标卷积层存储在目标存储位置中;根据所述目标存储位置中目标卷积层的数量确定所述文本数据进行迭代卷积的次数。在一个示例性的实施例中,根据所述函数输出结果确定所述文本数据的类别,包括:从所述函数输出结果中获取所述文本数据对应不同类别的多个概率值;将所述多个概率值中最大的概率值所对应的类别作为所述文本数据的类别。根据本专利技术的另一个实施例,还提供了一种文本分类装置,包括:获取模块,用于获取文本数据中的词向量矩阵,对所述词向量矩阵进行多个感受野的卷积处理,以得到多个卷积层;连接模块,用于对所述多个卷积层通过残差进行叠加连接,以得到所述多个卷积层的目标卷积层,其中,所述残差用于表示所述多个卷积层中的每一卷积层的残差值;提取模块,用于提取所述目标卷积层的目标特征,将所述目标特征输入到目标逻辑函数中,得到函数输出结果,根据所述函数输出结果确定所述文本数据的类别。在一个示例性的实施例中,所述获取模块,还用于从所述文本数据中获取所有词的词向量,得到不同词对应的不同词向量,其中,所述词向量用于唯一标识所述文本数据中的词;将所述不同词向量聚合在一个矩阵中,得到所述词向量矩阵。在一个示例性的实施例中,上述装置还包括:激活模块,用于获取预设的激活函数;通过所述激活函数对所述多个卷积层进行激活;对激活后的多个卷积层中不符合预设条件的卷积层进行丢弃处理。在一个示例性的实施例中,上述连接模块,还用于确定所述多个卷积层中每一个卷积层与标准卷积层的残差值,得到多个残差,其中,每一个卷积层对应一个标准卷积层;获取所述多个残差中小于预设阈值的残差对应的多个卷积层,将小于预设阈值的残差对应的多个卷积层进行叠加连接,以得到所述卷积层的目标卷积层。在一个示例性的实施例中,上述装置还包括:处理模块,用于对所述目标卷积层进行归一化处理,并将归一化后的目标卷积层存储在目标存储位置中;根据所述目标存储位置中目标卷积层的数量确定所述文本数据进行迭代卷积的次数。在一个示例性的实施例中,上述提取模块,还用于从所述函数输出结果中获取所述文本数据对应不同类别的多个概率值;将所述多个概率值中最大的概率值所对应的类别作为所述文本数据的类别。根据本专利技术的又一个实施例,还提供了一种计算机可读的存储介质,所述计算机可读的存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。根据本专利技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。通过本专利技术,获取文本数据中的词向量矩阵,对所述词向量矩阵进行多个感受野的卷积处理,以得到多个卷积层;对所述多个卷积层通过残差进行叠加连接,以得到所述多个卷积层的目标卷积层,其中,所述残差用于表示所述多个卷积层中的每一卷积层的残差值;提取所述目标卷积层的目标特征,将所述目标特征输入到目标逻辑函数中,得到函数输出结果,根据所述函数输出结果确定所述文本数据的类别,即通过获取文本数据的目标卷积层对应目标特征的概率值,进而确定不同概率值对应的文本数据类别。采用上述技术方案,解决了相关技术中,对短文本分类的准确率太低以及预测速度过慢等问题,提高了文本分类模型的训练速度以及分类准确率。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是本专利技术实施例的一种文本分类方法的计算机终端的硬件结构框图;图2是根据本专利技术实施例的文本分类方法的流程图;图3为根据本专利技术可选实施例的文本分类方法的流程示意图;图4是根据本专利技术实施例的一种文本分类装置的结构框图。具体实施方式下文中将参考附图并结合实施例来详细说明本专利技术。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。需要说明的是,本文档来自技高网...

【技术保护点】
1.一种文本分类方法,其特征在于,包括:/n获取文本数据中的词向量矩阵,对所述词向量矩阵进行多个感受野的卷积处理,以得到多个卷积层;/n对所述多个卷积层通过残差进行叠加连接,以得到所述多个卷积层的目标卷积层,其中,所述残差用于表示所述多个卷积层中的每一卷积层的残差值;/n提取所述目标卷积层的目标特征,将所述目标特征输入到目标逻辑函数中,得到函数输出结果,根据所述函数输出结果确定所述文本数据的类别。/n

【技术特征摘要】
1.一种文本分类方法,其特征在于,包括:
获取文本数据中的词向量矩阵,对所述词向量矩阵进行多个感受野的卷积处理,以得到多个卷积层;
对所述多个卷积层通过残差进行叠加连接,以得到所述多个卷积层的目标卷积层,其中,所述残差用于表示所述多个卷积层中的每一卷积层的残差值;
提取所述目标卷积层的目标特征,将所述目标特征输入到目标逻辑函数中,得到函数输出结果,根据所述函数输出结果确定所述文本数据的类别。


2.根据权利要求1所述的方法,其特征在于,获取文本数据中的词向量矩阵,包括:
从所述文本数据中获取所有词的词向量,得到不同词对应的不同词向量,其中,所述词向量用于唯一标识所述文本数据中的词;
将所述不同词向量聚合在一个矩阵中,得到所述词向量矩阵。


3.根据权利要求1所述的方法,其特征在于,对所述词向量矩阵进行多个感受野的卷积处理,以得到多个卷积层之后,所述方法还包括:
获取预设的激活函数;
通过所述激活函数对所述多个卷积层进行激活;
对激活后的多个卷积层中不符合预设条件的卷积层进行丢弃处理。


4.根据权利要求1所述的方法,其特征在于,对所述多个卷积层通过残差进行叠加连接,以得到所述卷积层的目标卷积层,包括:
确定所述多个卷积层中每一个卷积层与标准卷积层的残差值,得到多个残差,其中,每一个卷积层对应一个标准卷积层;
获取所述多个残差中小于预设阈值的残差对应的多个卷积层,将小于预设阈值的残差对应的多个卷积层进行叠加连接,以得到所述卷积层的目标卷积层。


5.根据权利要求1所述的方法,其特征在于,对所述多个卷积层通过残差进行叠加连接,以得到所述卷积层的目标卷积层之后,所述...

【专利技术属性】
技术研发人员:韩俊明
申请(专利权)人:青岛海尔科技有限公司海尔智家股份有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1