【技术实现步骤摘要】
本专利技术涉及大数据文献分类,具体为一种基于bert预训练模型的医学资讯文章分类系统及分类方法。
技术介绍
1、在互联网信息资源日新月异的今天,文本分类技术已经广泛地运用于信息数据处理,以应对庞大的数据规模。这一技术,作为自然语言处理(nlp)领域的一个重要研究方向,经历了从依赖人工手动的初级阶段,到二十世纪九十年代机器学习技术的引入,进而发展到现在深度学习和各种新模型的广泛应用。从早期的基于传统机器学习方法的分类器(如支持向量机、朴素贝叶斯算法和神经网络),到近年来深度学习方法的逐步深入,以及最近几年rnn、lstm、bi-lstm、cnn等各种模型的新颖涌现,再到后来的google的bert模型,其在nlp任务中的优异表现,使得预训练模型在文本分类中的应用具有极大的潜力和价值。然而,由于医学领域的信息专业性极强,分类要求极高,目前主要的分类方式仍然是编辑们的人工操作,这就导致了两个问题:一是不同的编辑可能因为知识水平的差异,对于同一篇文章产生不同的分类结果;二是面对数量庞大的网络资讯文章,仅靠编辑的人力分类,既费时又费力,效率不高。
...【技术保护点】
1.基于Bert预训练模型的医学资讯文章分类系统,其特征在于:包括采集模块、会员模块、日志模块、数据库模块、发布模块,
2.根据权利要求1所述的基于Bert预训练模型的医学资讯文章分类系统,其特征在于:所述采集模块的采集方式为爬虫,且所述目标库的地址为白名单地址。
3.根据权利要求1所述的基于Bert预训练模型的医学资讯文章分类系统,其特征在于:所述系统还包括评论模块,所述评论模块允许经过验证的访问者进行评论。
4.根据权利要求3所述的基于Bert预训练模型的医学资讯文章分类系统,其特征在于:所述评论模块中包含验证码模组,所述验证码
...【技术特征摘要】
1.基于bert预训练模型的医学资讯文章分类系统,其特征在于:包括采集模块、会员模块、日志模块、数据库模块、发布模块,
2.根据权利要求1所述的基于bert预训练模型的医学资讯文章分类系统,其特征在于:所述采集模块的采集方式为爬虫,且所述目标库的地址为白名单地址。
3.根据权利要求1所述的基于bert预训练模型的医学资讯文章分类系统,其特征在于:所述系统还包括评论模块,所述评论模块允许经过验证的访问者进行评论。
4.根据权利要求3所述的基于bert预训练模型的医学资讯文章分类系统,其特征在于:所述评论模块中包含验证码模组,所述验证码模组包括前端表象验证模块和后端静默验证模块。
5...
【专利技术属性】
技术研发人员:黄星辉,
申请(专利权)人:上海常笑健康咨询服务有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。