一种基于深度学习的文本分类方法及装置制造方法及图纸

技术编号:42953483 阅读:20 留言:0更新日期:2024-10-11 16:10
本发明专利技术公开了一种基于深度学习的文本分类方法及装置,涉及文本分类的技术领域;通过调用预训练的浅层神经网络模型对目标文本进行分析,得到第一分类结果;若第一分类结果不理想,则调用预训练的第二深度学习模型对目标文本进行分析,得到目标分类项;第二深度学习模型是一种结合图神经网络和双向长短期记忆网络的模型。通过使用计算效率高、耗费小的浅层神经网络模型,能够快速处理大部分的文本;对于浅层模型无法准确分类的文本,使用复杂的图神经网络和双向长短期记忆网络,保证了分类的准确性。通过分级处理机制,优先使用浅层神经网络进行初步分类,仅在必要时调用复杂模型,有效节省了计算资源,提高了处理效率。

【技术实现步骤摘要】

本专利技术涉及文本分类的,具体涉及一种基于深度学习的文本分类方法及装置


技术介绍

1、目前,新闻资讯阅读软件一般通过对各新闻平台或自媒体的文章进行抓取,得到大量的新闻资讯。然后按照新闻标题所属的领域进行组织整理和推送,比如根据娱乐、生活、教育、科技、萌宠、汽车等进行分类并推送到不同的类别下。

2、当前对新闻进行分类发行的过程,通常是由智能模型对新闻文本的标题进行分析,得到新闻文本的分类。专利cn114969324a公开了一种基于主题词特征扩展的中文新闻标题分类方法;通过复合分词方法和主体词语扩展方法,得到主题,最后使用卷积神经网络得到分类结果。

3、但该类方法遇到以吸引阅读为目标的标题时,则会出现分类错误。如果对新闻文本进行全文本分析,使用简单的轻量模型在某些复杂文本分类任务中无法获得准确的分类结果;而复杂模型在处理简单文本时会浪费大量的计算资源,并且会降低计算效率。


技术实现思路

1、本专利技术的目的就在于解决上述
技术介绍
中提到的计算资源浪费大、计算效率低的问题,而提出一种基于深度本文档来自技高网...

【技术保护点】

1.一种基于深度学习的文本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于深度学习的文本分类方法,其特征在于,所述调用预训练的第一深度学习模型对目标文本进行分析,得到第一分类结果包括:

3.根据权利要求2所述的一种基于深度学习的文本分类方法,其特征在于,所述对多个第二分类项进行选择,得到第三分类项,并计算所述第三分类项的第一置信度包括:

4.根据权利要求2所述的一种基于深度学习的文本分类方法,其特征在于,所述第一深度学习模型包括第一预处理层、第一词嵌入层、隐藏层和第一输出层;

5.根据权利要求1所述的一种基于深度学习的...

【技术特征摘要】

1.一种基于深度学习的文本分类方法,其特征在于,所述方法包括:

2.根据权利要求1所述的一种基于深度学习的文本分类方法,其特征在于,所述调用预训练的第一深度学习模型对目标文本进行分析,得到第一分类结果包括:

3.根据权利要求2所述的一种基于深度学习的文本分类方法,其特征在于,所述对多个第二分类项进行选择,得到第三分类项,并计算所述第三分类项的第一置信度包括:

4.根据权利要求2所述的一种基于深度学习的文本分类方法,其特征在于,所述第一深度学习模型包括第一预处理层、第一词嵌入层、隐藏层和第一输出层;

5.根据权利要求1所述的一种基于深度学习的文本分类方法,其特征在于,所述第二深度学习模型包括第二预处理层、第二词嵌入层、文本嵌入层、图结构构建层、图神经网络层...

【专利技术属性】
技术研发人员:王鑫刘辉肖家锴孙伟邢璐潘如轩蔡翔王庆军赵龙王潇仇茹嘉史伟豪
申请(专利权)人:国网安徽省电力有限公司电力科学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1