一种深度学习的混合主题模型构建方法技术

技术编号:23085122 阅读:37 留言:0更新日期:2020-01-11 01:10
本发明专利技术涉及计算机深度学习技术领域,提出一种深度学习的混合主题模型构建方法,包括以下步骤:步骤S1:预处理阶段;步骤S2:文本信息表征;步骤S3:补充背景信息子网络;步骤S4:全连接层网络进行主题划分,并输出标签分类概率。本发明专利技术针对华为云平台和智慧学习平台的数据进行主题挖掘,发现基于深度学习的混合主题模型HTM,在主题分类的领域需要的数据量较小,且在面对长短不同类型的文本时,通过Bi‑LSTM框架可以有效的进行转化获得较好的迁移能力,使得模型迁移能力强、分类错误率低,模型整体分类效果好。为今后深度学习的主题分类模型在小样本学习和迁移学习作出了有益尝试。

A method of constructing mixed topic model for deep learning

【技术实现步骤摘要】
一种深度学习的混合主题模型构建方法
本专利技术涉及计算机深度学习
,特别涉及一种深度学习的混合主题模型构建方法。
技术介绍
目前LSA、pLSA、LDA、HDP、lda2vec这五中典型的主题模型存在模型训练需要预先设定主题数目、训练时间比较长、特征提取不充分和样本效率低等问题。
技术实现思路
本专利技术的目的在于改善现有技术中所存在的不足,提供一种深度学习的混合主题模型构建方法。为了更清楚地说明本专利技术实施例的技术方法案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。为了实现上述专利技术目的,本专利技术实施例提供了以下技术方案:一种深度学习的混合主题模型构建方法,包括以下步骤:步骤S1:预处理阶段;步骤S2:文本信息表征;步骤S3:补充背景信息子网络;步骤S4:全连接层网络进行主题划分,并本文档来自技高网...

【技术保护点】
1.一种深度学习的混合主题模型构建方法,其特征在于:包括以下步骤:/n步骤S1:预处理阶段;/n步骤S2:文本信息表征;/n步骤S3:补充背景信息子网络;/n步骤S4:全连接层网络进行主题划分,并输出标签分类概率。/n

【技术特征摘要】
1.一种深度学习的混合主题模型构建方法,其特征在于:包括以下步骤:
步骤S1:预处理阶段;
步骤S2:文本信息表征;
步骤S3:补充背景信息子网络;
步骤S4:全连接层网络进行主题划分,并输出标签分类概率。


2.根据权利要求1所述的一种深度学习的混合主题模型构建方法,其特征在于:所述预处理阶段的步骤包括:
对处理的原始的文本数据进行编号,去除原始数据的噪声,构建词向量,每个句子里的词做补齐处理,形成半合成数据。


3.根据权利要求1所述的一种深度学习的混合主题模型构建方法,其特征在于:所述文本信息表征包括句子级别的信息表征和文档级别的信息表征。


4.根据权利要求3所述的一种深度学习的混合主题模型构建方法,其特征在于:所述句子级别的信息表征的步骤包括:
句子级别的信息表征通过卷积网络CNN训练词向量来提取句子中的主干信息为文本分类奠定基础。


5.根据权利要求3所述的一种深度学习的混合主题模型构建方法,其特征在于:所述文档级别的信息表征的步骤包括:
文档级别的信息表征结合词向量对句子表征的基础,考虑文档的上下文和全局信息,对文档进行建模。


6.根据权利要求1所述的一种深度学习的混合主题模型构建方法,其特征在于:...

【专利技术属性】
技术研发人员:万家山
申请(专利权)人:安徽信息工程学院
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1