【技术实现步骤摘要】
基于文本挖掘技术的医院挂号科室智能推荐方法
[0001]本专利技术属于医疗服务
,具体是涉及基于文本挖掘技术的医院挂号科室智能推荐方法
。
技术介绍
[0002]医院挂号系统是患者到医院就诊的最前端窗口,为方便患者就医,医院提供了通过电脑
、
手机
、
电话等多种挂号渠道
。
然而,综合性医院科室众多,专业性强,不少科室还存在交叉业务
。
对于患者,尤其是不常生病对医院科室不熟悉的患者来说,经常面临着不知该挂哪个科室的问题
。
此外,一些不常见的病,尤其是疑难杂症,更是不知该挂哪个科室
。
[0003]目前患者通常在挂号前,通过百度等软件在互联网查询,一方面费时费力,另一方面所获信息不一定真实可靠,很可能耽误疾病治疗
。
医院虽然设有一些咨询或分诊台,但在时空上存在不及时
、
不方便的缺点
。
为此,常出现如下的实际情况:患者先根据自己有限的经验,试探性地挂一个科室的号,然后医生在诊断过程中,再推荐挂更合适的科室,该过程不仅造成医院的医疗资源浪费,对于患者,则在时间
、
经济上造成双重浪费
。
因此,在医院提供的各种预约挂号渠道中,研究基于文本挖掘技术的科室智能推荐方法,十分重要和迫切
。
技术实现思路
[0004]本专利技术的目的在于针对现有技术的不足,提供一种基于文本挖掘技术的医院挂号科室智能推荐方法< ...
【技术保护点】
【技术特征摘要】
1.
基于文本挖掘技术的医院挂号科室智能推荐方法,其特征在于该方法包括以下步骤:步骤1:构建临床表现与科室对应样本依据疾病诊断学文本,构建临床表现与疾病
、
科室映射的样本集;步骤2:构建科室的临床表现高频词词典对临床表现文本进行分词,统计词频;构建科室的临床表现高频词词典;步骤3:训练基于
BERT
的改进的分类模型;采用基于
BERT
模型的单文本主题分类微调模型,在学习步骤1生成的样本集时,对
BERT
模型进行改进,获得临床表现与科室的高性能分类模型;步骤4:应用分类模型基于步骤3获得的高性能分类模型,输入患者通过语音或文字输入的临床表现文本,获得模型的科室分类结果和置信度;步骤5:分析分类结果若步骤4输出的科室分类结果的置信度低于阈值,在步骤2建立的科室临床表现词典中,把分类结果所对应科室的词典按词频从高到低推荐给患者,待患者选择后,进入步骤6;否则进入步骤7;步骤6:重新应用分类模型把患者选择的临床表现高频词,拼接到患者前述的临床表现文本中,重新基于步骤3获得的高性能分类模型进行分类,获得科室分类结果和置信度;然后返回步骤5;步骤7:输出科室分类结果把科室结果推荐给患者
。2.
根据权利要求1所述的基于文本挖掘技术的医院挂号科室智能推荐方法,其特征在于:步骤2中采用词频
‑
逆文档频率方法对临床表现文本进行分词
。3.
根据权利要求1所述的基于文本挖掘技术的医院挂号科室智能推荐方法,其特征在于:步骤3中所述的高性能分类模型包括四个
BERT
模型和一个分类器,四个
BERT
模型的输出均输入至所述分类器;其中:第一
BERT
模型由
50%
的样本集训练得到;第二
BERT
模型由关键词词典训练得到;第三
BERT
模型由特殊关键词词典训练得到;第四
BERT
模型由预测样本集训练得到
。4.
根据权利要求3所述的基于文本挖掘技术的医院挂号科室智能推荐方法,其特征在于:所述的关键词词典构建方式如下:采用
jieba
分词对所述
50%
的样本集进行分词;用
TF
‑
IDF
方法计算词项权重,构建为临床表现文本的关键词词典
。5.
根据权利要求4所述的基于文本挖掘技术的医院挂号科室智能推荐方法,其特征在于:所述的特殊关键词词典构建方式如下:从文本关键词词典中筛选出对区分科室起重要作用的特殊关键词,构建为特殊关键词词典;所述的特殊关...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。