基于Bert预训练模型的医学资讯文章分类系统及分类方法技术方案

技术编号:40546452 阅读:15 留言:0更新日期:2024-03-05 19:04
本发明专利技术公开了一种基于Bert预训练模型的医学资讯文章分类系统及分类方法,包括采集模块、会员模块、日志模块、数据库模块、发布模块,会员模块中包括管理员和普通用户,发布模块包括前端的网页、APP、小程序中的一种或者多种,即最终系统呈现到用户的前端展示部分,所述系统还包括带验证码模组的评论模块,本申请的技术方案能够利用Bert预训练模型将医学咨询文章进行自动的分类,从而减少操作人员负担,提高咨询文章分类的效率,而且系统设置至少两个的权重栏目ID的形式,能够在一定程度上减少差错率。

【技术实现步骤摘要】

本专利技术涉及大数据文献分类,具体为一种基于bert预训练模型的医学资讯文章分类系统及分类方法。


技术介绍

1、在互联网信息资源日新月异的今天,文本分类技术已经广泛地运用于信息数据处理,以应对庞大的数据规模。这一技术,作为自然语言处理(nlp)领域的一个重要研究方向,经历了从依赖人工手动的初级阶段,到二十世纪九十年代机器学习技术的引入,进而发展到现在深度学习和各种新模型的广泛应用。从早期的基于传统机器学习方法的分类器(如支持向量机、朴素贝叶斯算法和神经网络),到近年来深度学习方法的逐步深入,以及最近几年rnn、lstm、bi-lstm、cnn等各种模型的新颖涌现,再到后来的google的bert模型,其在nlp任务中的优异表现,使得预训练模型在文本分类中的应用具有极大的潜力和价值。然而,由于医学领域的信息专业性极强,分类要求极高,目前主要的分类方式仍然是编辑们的人工操作,这就导致了两个问题:一是不同的编辑可能因为知识水平的差异,对于同一篇文章产生不同的分类结果;二是面对数量庞大的网络资讯文章,仅靠编辑的人力分类,既费时又费力,效率不高。为此,提出一种基于b本文档来自技高网...

【技术保护点】

1.基于Bert预训练模型的医学资讯文章分类系统,其特征在于:包括采集模块、会员模块、日志模块、数据库模块、发布模块,

2.根据权利要求1所述的基于Bert预训练模型的医学资讯文章分类系统,其特征在于:所述采集模块的采集方式为爬虫,且所述目标库的地址为白名单地址。

3.根据权利要求1所述的基于Bert预训练模型的医学资讯文章分类系统,其特征在于:所述系统还包括评论模块,所述评论模块允许经过验证的访问者进行评论。

4.根据权利要求3所述的基于Bert预训练模型的医学资讯文章分类系统,其特征在于:所述评论模块中包含验证码模组,所述验证码模组包括前端表象验证...

【技术特征摘要】

1.基于bert预训练模型的医学资讯文章分类系统,其特征在于:包括采集模块、会员模块、日志模块、数据库模块、发布模块,

2.根据权利要求1所述的基于bert预训练模型的医学资讯文章分类系统,其特征在于:所述采集模块的采集方式为爬虫,且所述目标库的地址为白名单地址。

3.根据权利要求1所述的基于bert预训练模型的医学资讯文章分类系统,其特征在于:所述系统还包括评论模块,所述评论模块允许经过验证的访问者进行评论。

4.根据权利要求3所述的基于bert预训练模型的医学资讯文章分类系统,其特征在于:所述评论模块中包含验证码模组,所述验证码模组包括前端表象验证模块和后端静默验证模块。

5...

【专利技术属性】
技术研发人员:黄星辉
申请(专利权)人:上海常笑健康咨询服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1