一种语义分诊方法及系统技术方案

技术编号:30322619 阅读:12 留言:0更新日期:2021-10-09 23:48
本发明专利技术公开了一种语义分诊方法及系统,方法包括:获取实际问诊数据;将实际问诊数据输入到科室分类模型中,得到目标科室;科室分类模型的建立方法包括:获取历史问诊数据;历史问诊数据包括历史病情描述和对应的历史科室;根据历史问诊数据对长短期记忆网络模型进行训练,得到科室分类模型。现有的分诊方法需要导诊员根据病情描述来人工判断对应的科室,而人工速度是有限的,本发明专利技术利用科室分类模型,只需要输入病情描述,即可自动得到目标科室,提高了分诊的效率;且导诊员完全凭借经验来进行科室分诊,易出错,本发明专利技术利用大量的历史数据训练得到的科室分类模型进行分诊操作,提高了分诊的准确率。了分诊的准确率。了分诊的准确率。

【技术实现步骤摘要】
一种语义分诊方法及系统


[0001]本专利技术涉及科室导诊
,特别是涉及一种语义分诊方法及系统。

技术介绍

[0002]在医院,将患者引入正确的科室是比较费时费力的,需要一个导诊员分析一个患者的病情描述,然后为患者分配一个科室。但是,医院的导诊员由于数量少,患者需要等待很长的时间才能获得分诊的结果。并且,由于患病种类众多,由于专业领域不同,导诊员未必能够给病人一个正确的科室。

技术实现思路

[0003]本专利技术的目的是提供一种语义分诊方法及系统,以提高分诊的效率与准确率。
[0004]为实现上述目的,本专利技术提供了如下方案:
[0005]一种语义分诊方法,所述方法包括:
[0006]获取实际问诊数据;
[0007]将所述实际问诊数据输入到科室分类模型中,得到目标科室;
[0008]所述科室分类模型的建立方法包括:
[0009]获取历史问诊数据;所述历史问诊数据包括历史病情描述和对应的历史科室;
[0010]根据所述历史问诊数据对长短期记忆网络模型进行训练,得到所述科室分类模型。
[0011]可选的,所述根据所述历史问诊数据对长短期记忆网络模型进行训练,得到所述科室分类模型,具体包括:
[0012]将所述历史病情描述输入到所述长短期记忆网络模型中,得到每个历史病情描述对应的各个科室的概率;
[0013]根据概率最大的科室和对应的历史科室判断是否停止训练;
[0014]若是,则将当前训练次数下的长短期记忆网络模型作为所述科室分类模型;
[0015]若否,则更新所述长短期记忆网络模型的参数,并进行下一次训练。
[0016]可选的,在所述将所述历史病情描述输入到所述长短期记忆网络模型中,得到每个历史病情描述对应的各个科室的概率之前,还包括:
[0017]对所述历史病情描述进行预处理。
[0018]可选的,所述对所述历史病情描述进行预处理,具体包括:
[0019]对所述历史病情描述进行数据清洗;
[0020]对数据清洗后的历史病情描述进行分词处理,得到多个词;
[0021]将多个所述词映射到向量空间,得到多个数值数据。
[0022]可选的,所述对所述历史病情描述进行数据清洗,具体包括:
[0023]对所述历史病情描述进行至少一种删改操作;所述删改操作包括字符删除、字母转换、原型转换、空格删除和信息删除;
[0024]所述字符删除为删除所述历史病情描述中的无关字符、非英文字符、非中文字符、非数字字符、非中英文的标点符合和超链接;所述无关字符包括:html标签、乱码、特殊字符和标签;
[0025]所述字母转换为将所述历史病情描述中的英文字母的大写字母转换为小写字母;
[0026]所述原型转换为将英文字母转换为所述英文字母的原型;
[0027]所述空格删除为删除多余空格;
[0028]所述信息删除为删除具有个人信息的文本信息中的至少一种;所述文本信息包括:姓名、联系方式和个人住址。
[0029]可选的,所述根据概率最大的科室和对应的历史科室判断是否停止训练,具体包括:
[0030]对于任意一个所述历史病情描述,判断输出的概率最大的科室与对应的历史科室是否一致;
[0031]统计概率最大的科室与对应的历史科室一致的历史病情描述的个数,得到目标个数;
[0032]根据所述目标个数与所述历史病情描述的总个数,计算当前训练次数下的长短期记忆网络模型的准确率;
[0033]若所述准确率大于设定阈值,则停止训练。
[0034]一种语义分诊系统,所述系统包括:
[0035]实际问诊数据获取模块,用于获取实际问诊数据;
[0036]目标科室确定模块,用于将所述实际问诊数据输入到科室分类模型中,得到目标科室;
[0037]所述科室分类模型的建立方法包括:
[0038]获取历史问诊数据;所述历史问诊数据包括历史病情描述和对应的历史科室;
[0039]根据所述历史问诊数据对长短期记忆网络模型进行训练,得到所述科室分类模型。
[0040]可选的,所述系统还包括:科室分类模型建立模块;
[0041]所述科室分类模型建立模块用于:
[0042]获取历史问诊数据;所述历史问诊数据包括历史病情描述和对应的历史科室;根据所述历史问诊数据对长短期记忆网络模型进行训练,得到所述科室分类模型;
[0043]所述科室分类模型建立模块,具体包括:
[0044]概率确定单元,用于将所述历史病情描述输入到所述长短期记忆网络模型中,得到每个历史病情描述对应的各个科室的概率;
[0045]停止判断单元,用于根据概率最大的科室和对应的历史科室判断是否停止训练;
[0046]科室分类模型生成单元,用于当所述停止判断单元判断为停止训练时,将当前训练次数下的长短期记忆网络模型作为所述科室分类模型;
[0047]继续训练单元,用于当所述停止判断单元判断为继续训练时,更新所述长短期记忆网络模型的参数,并进行下一次训练。
[0048]可选的,所述科室分类模型建立模块,还包括:预处理单元,所述预处理单元用于在所述将所述历史病情描述输入到所述长短期记忆网络模型中,得到每个历史病情描述对
应的各个科室的概率之前,对所述历史病情描述进行预处理。
[0049]可选的,所述停止判断单元,具体包括:
[0050]一致判断子单元,用于对于任意一个所述历史病情描述,判断输出的概率最大的科室与对应的历史科室是否一致;
[0051]统计子单元,用于统计概率最大的科室与对应的历史科室一致的历史病情描述的个数,得到目标个数;
[0052]准确率计算子单元,用于根据所述目标个数与所述历史病情描述的总个数,计算当前训练次数下的长短期记忆网络模型的准确率;
[0053]停止训练子单元,用于当所述准确率大于设定阈值时,停止训练。
[0054]根据本专利技术提供的具体实施例,本专利技术公开了以下技术效果:
[0055]本专利技术公开了一种语义分诊方法及系统,方法包括:获取实际问诊数据;将实际问诊数据输入到科室分类模型中,得到目标科室;科室分类模型的建立方法包括:获取历史问诊数据;历史问诊数据包括历史病情描述和对应的历史科室;根据历史问诊数据对长短期记忆网络模型进行训练,得到科室分类模型。现有的分诊方法需要导诊员根据病情描述来人工判断对应的科室,而人工速度是有限的,本专利技术利用科室分类模型,只需要输入病情描述,即可自动得到目标科室,提高了分诊的效率;且导诊员完全凭借经验来进行科室分诊,易出错,本专利技术利用大量的历史数据训练得到的科室分类模型进行分诊操作,提高了分诊的准确率。
附图说明
[0056]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种语义分诊方法,其特征在于,所述方法包括:获取实际问诊数据;将所述实际问诊数据输入到科室分类模型中,得到目标科室;所述科室分类模型的建立方法包括:获取历史问诊数据;所述历史问诊数据包括历史病情描述和对应的历史科室;根据所述历史问诊数据对长短期记忆网络模型进行训练,得到所述科室分类模型。2.根据权利要求1所述的语义分诊方法,其特征在于,所述根据所述历史问诊数据对长短期记忆网络模型进行训练,得到所述科室分类模型,具体包括:将所述历史病情描述输入到所述长短期记忆网络模型中,得到每个历史病情描述对应的各个科室的概率;根据概率最大的科室和对应的历史科室判断是否停止训练;若是,则将当前训练次数下的长短期记忆网络模型作为所述科室分类模型;若否,则更新所述长短期记忆网络模型的参数,并进行下一次训练。3.根据权利要求2所述的语义分诊方法,其特征在于,在所述将所述历史病情描述输入到所述长短期记忆网络模型中,得到每个历史病情描述对应的各个科室的概率之前,还包括:对所述历史病情描述进行预处理。4.根据权利要求3所述的语义分诊方法,其特征在于,所述对所述历史病情描述进行预处理,具体包括:对所述历史病情描述进行数据清洗;对数据清洗后的历史病情描述进行分词处理,得到多个词;将多个所述词映射到向量空间,得到多个数值数据。5.根据权利要求4所述的语义分诊方法,其特征在于,所述对所述历史病情描述进行数据清洗,具体包括:对所述历史病情描述进行至少一种删改操作;所述删改操作包括字符删除、字母转换、原型转换、空格删除和信息删除;所述字符删除为删除所述历史病情描述中的无关字符、非英文字符、非中文字符、非数字字符、非中英文的标点符合和超链接;所述无关字符包括:html标签、乱码、特殊字符和标签;所述字母转换为将所述历史病情描述中的英文字母的大写字母转换为小写字母;所述原型转换为将英文字母转换为所述英文字母的原型;所述空格删除为删除多余空格;所述信息删除为删除文本信息;所述文本信息包括:姓名、联系方式和个人住址。6.根据权利要求2所述的语义分诊方法,其特征在于,所述根据概率最大的科室和对应的历史科室判断是否停止训练,具体包括:对于任意一个所述历史病情描述,判断输出的概率最大的科室与对应的历史科室是否一致;统计概率最大的科室与对应的历史科...

【专利技术属性】
技术研发人员:张后今曾培基周金龙章昊肖航吴珂仪
申请(专利权)人:华中科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1