文本分类方法、装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:46251113 阅读:9 留言:0更新日期:2025-08-29 19:58
本公开提供了一种文本分类方法、装置、计算机设备及计算机可读存储介质。方法通过获取待分类文本;基于第一预设文本长度的文本窗口以及第二预设文本长度的滑动步长,对待分类文本进行滑动窗口拆分,得到多个第一子文本;将多个第一子文本输入预设神经网络模型进行文本特征提取,得到多个第一子文本特征,预设神经网络模型基于对样本文本进行滑动窗口拆分得到的子样本文本以及对应的文本标签训练得到;对多个第一子文本特征进行特征融合,得到第一文本特征;基于第一文本特征对待分类文本进行分类,得到第一文本类别。该方法可以提升对长文本进行文本分类的准确性。

【技术实现步骤摘要】

本公开涉及人工智能,特别是涉及一种文本分类方法、装置、计算机设备及计算机可读存储介质


技术介绍

1、随着互联网技术以及终端技术的不断发展,人们获取信息的能力也在不断地提升。其中,文本作为信息的主要载体,大量地出现在社交平台、视频平台以及电商平台等公域网络中,由此派生出来的文本内容分类的需求也在不断地提升。

2、为了提升文本分类的效率,本领域技术人员在不断探索新的文本分类方法,其中人工智能的快速发展为文本分类提供了新的思路。采用基于人工智能技术的文本分类模型对待分类文本进行分类,可以极大地降低人耗,提升文本审核的效率。然而,目前基于文本分类模型对待审核文本进行分类,其分类准确性较低。


技术实现思路

1、本公开实施例提供了一种文本分类方法、装置、计算机设备及计算机可读存储介质,该文本分类方法可以提升文本分类的准确性。

2、本公开第一方面提供了一种文本分类方法,所述方法包括:

3、获取待分类文本;

4、基于第一预设文本长度的文本窗口以及第二预设文本长度的滑动步长,对本文档来自技高网...

【技术保护点】

1.一种文本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取待分类文本之后,还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述第一文本特征与所述第二文本特征对所述待分类文本进行分类,得到第二文本类别,包括:

4.根据权利要求1所述的方法,其特征在于,所述预设神经网络模型为文本分类模型的特征提取层,所述文本分类模型包括特征提取层、特征融合层以及分类层,所述文本分类模型的训练过程,包括如下步骤:

5.根据权利要求4所述的方法,其特征在于,所述基于所述第一预设文本长度的文本窗口以及所述第二预设...

【技术特征摘要】

1.一种文本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述获取待分类文本之后,还包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述第一文本特征与所述第二文本特征对所述待分类文本进行分类,得到第二文本类别,包括:

4.根据权利要求1所述的方法,其特征在于,所述预设神经网络模型为文本分类模型的特征提取层,所述文本分类模型包括特征提取层、特征融合层以及分类层,所述文本分类模型的训练过程,包括如下步骤:

5.根据权利要求4所述的方法,其特征在于,所述基于所述第一预设文本长度的文本窗口以及所述第二预设文本长度的滑动步长,对所述样本文本进行滑动窗口拆分,得到多个第一子样本文本之后,还包括:

6.根据权利要求5所述的方法,其特征在于,所述对所述多个第一子样本文本进行文本预处理,得到多个第二子样本文本之后,还包括:

7.根据权利要求6所述的方法,其特征在于,所述对所述第二子样本文本进行数据增强,包括:

8.根据权利要求4所述的方法,其特征在于,所述将所述多个第一子样本文本输入所述特征提取层进行文本特征提取,得到所述特征提取层输出的多个子...

【专利技术属性】
技术研发人员:王能
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1