一种基于会议报告的事件主题分类方法及系统技术方案

技术编号:43984039 阅读:19 留言:0更新日期:2025-01-10 20:07
本发明专利技术涉及一种基于会议报告的事件主题分类方法及系统,属于自然语言处理技术领域,解决了现有因文本特征提取不充分导致事件主题分类不准确的问题。方法包括:解析历史会议报告得到事件文本集;对事件文本集中每个事件文本构建动态提示词并传入大模型,将对应得到的多条推理文本补入事件文本集中得到扩增文本集;利用扩增文本集训练双通道特征融合BERT模型,得到事件主题分类模型;双通道特征融合BERT模型中的双通道模块包括多头注意力机制通道和文本卷积通道;解析待预测的会议报告得到多条待预测事件,将每条待预测事件传入事件主题分类模型中,预测出对应的事件主题类别。实现了对会议报告的事件主题类别的准确分类。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其涉及一种基于会议报告的事件主题分类方法及系统


技术介绍

1、随着信息技术的飞速发展,如何高效、准确地从政府、集团会议报告中,对会议主题进行分类成为了一个亟待解决的问题。

2、传统机器学习的主题分类方法依赖于手工特征提取和专家经验来设计特征,这不仅耗时耗力,而且难以处理高维数据和复杂的非线性关系。

3、而深度学习bert模型采用双向的编码器,核心优势在于其创新的双向训练机制,它通过大量无标注文本的预训练,学习了深层次的语言表示,使得模型能够捕捉到丰富的上下文信息和语言的细微差别。但是由于bert是基于字粒度的语言模型,很容易忽视词汇之间语法信息,容易忽视句子中长距离的文本特征,不能很好地处理复杂的语义文本,导致分类容易出现错误。


技术实现思路

1、鉴于上述的分析,本专利技术实施例旨在提供一种基于会议报告的事件主题分类方法及系统,用以解决现有因文本特征提取不充分导致会议报告的事件主题分类不准确的问题。

2、一方面,本专利技术实施例提供了一种基于本文档来自技高网...

【技术保护点】

1.一种基于会议报告的事件主题分类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于会议报告的事件主题分类方法,其特征在于,所述双通道特征融合BERT模型依次包括:BERT网络、双通道模块、特征融合模块和分类预测模块;所述BERT网络接收训练文本,将最后一层文本特征向量输入到双通道模块中,经过特征融合模块对双通道模块中多头注意力机制通道输出的全局多维特征和文本卷积通道输出的局部关键特征进行融合得到文本融合特征后,传入分类预测模块输出事件主题类别。

3.根据权利要求1所述的基于会议报告的事件主题分类方法,其特征在于,对所述事件文本集中每个事件文本构建动态...

【技术特征摘要】

1.一种基于会议报告的事件主题分类方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于会议报告的事件主题分类方法,其特征在于,所述双通道特征融合bert模型依次包括:bert网络、双通道模块、特征融合模块和分类预测模块;所述bert网络接收训练文本,将最后一层文本特征向量输入到双通道模块中,经过特征融合模块对双通道模块中多头注意力机制通道输出的全局多维特征和文本卷积通道输出的局部关键特征进行融合得到文本融合特征后,传入分类预测模块输出事件主题类别。

3.根据权利要求1所述的基于会议报告的事件主题分类方法,其特征在于,对所述事件文本集中每个事件文本构建动态提示词,包括:

4.根据权利要求1或2所述的基于会议报告的事件主题分类方法,其特征在于,所述多头注意力机制通道接收文本特征向量后依次经过多头注意力子模块和第一前向网络子模块,其中多头注意力子模块和第一前向网络子模块中均加入了残差连接和层归一化,输出全局多维特征。

5.根据权利要求1或2所述的基于会议报告的事件主题分类方法,其特征在于,所述文本卷积通道采用文本卷积神经网络,所述文本卷积神经网络依次包括:嵌入层、卷积层、最大池化层和特征整合层;所述嵌入层对接收的文本特征向量调整维度后,通过所述卷积层中多个不同大小的卷积核提取出多个卷积结果特征,所述最...

【专利技术属性】
技术研发人员:张熠麦丞程
申请(专利权)人:南京审计大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1