【技术实现步骤摘要】
一种医患多轮对话中患者症状阴阳性的识别方法
[0001]本专利技术涉及深度学习领域,特别涉及一种医患多轮对话中患者症状阴阳性的识别方法。
技术介绍
[0002]症状是医患对话中主要讨论的话题之一,患者的症状信息也是对话策略和疾病诊断的关键特征,医生往往会从医患对话中获取患者信息,完成患者疾病的诊断并且提供相关的医疗建议。为了尽可能全面和精准的对患者的症状进行客观描述,需要利用严谨的临床发现的概念对患者状态进行表达,其中最基本的状态就是阴性和阳性,也就是患者是否出现某一症状(如发烧、腹泻等)。
[0003]对于现有技术方案,系统通常在获取患者主诉内容后,将主诉内容与数据库中已进行症状标记的文本进行相似度比对,将匹配度最高的文本对应的症状视为该患者可能出现的症状。但是在实际应用场景中往往存在着以下几种问题,首先,当患者口头描述症状时,由于其并非专业人员,并不能使用较为统一的医学术语,这将导致同一症状的不同表述,给文本比对时造成困难。其次,基于相似度匹配的症状抽取并不能较好的解决在数据库中并不存在的症状的识别问题,使得对症状的识别产生遗漏。
[0004]随着"互联网+医疗"的迅速发展,在线问诊平台逐渐兴起,在线问诊是指医生通过对话和患者进行病情的交流、疾病的诊断并且提供相关的医疗建议。基于人工智能的辅助诊断已经开始服务于医疗行业。在临床诊断中,为了提高医生工作效率,提升问诊准确率,需要更加精准的识别患者症状。然而,在患者症状识别的实际使用中往往存在着以下几个问题:
[0005]首先,由于医学领域需要 ...
【技术保护点】
【技术特征摘要】
1.一种医患多轮对话中患者症状阴阳性的识别方法,其特征在于:包括以下步骤:S1:对医患对话进行症状的命名实体识别,采用命名实体识别技术获取对话中存在的症状实体,抽取症状实体,然后对抽取到的实体进行标准化处理,将症状实体与预定义的症状列表进行映射得到唯一的标准化术语;S2:在考虑医患对话的上下文的情况下,对患者的该标准化后的症状进行全局性阴阳性识别,从而解决对医患对话中提到的问题。2.根据权利要求1所述的一种医患多轮对话中患者症状阴阳性的识别方法,其特征在于:所述S1中首先对数据进行基于BIO模式的数据标注,在该标注模式中,对每一个字进行一个单独的标注,其中“B”表示实体的开始字,“I”表示实体的中间字或结尾字,“O”表示该字不属于任何实体。3.根据权利要求1所述的一种医患多轮对话中患者症状阴阳性的识别方法,其特征在于:所述S1中利用基于BERT的预训练模型对症状命名实体进行抽取,对于每一轮对话,按照以下步骤进行训练:对于每一轮对话,分别在该轮对话的前后分别添加“[CLS]”与“[SEP]”,同时也在对应标注标签的开始和结尾分别添加“[CLS]”与“[SEP]”,其中“[CLS]”表示句子开始,“[SEP]”表示句子结束,均为特殊保留字符,视为单个字,则该轮对话可以表示为X=[x
CLS
,x0,x1,
…
,x
m
,
…
,x
n
,x
SEP
],其中x
m
表示第m个字;将该轮对话送入BERT模型,对于输入X,得到每个字的输出向量E=[E
CLS
,E0,E1,
…
,E
m
,
…
,E
n
,E
SEP
],其中E
m
表示x
m
的输出向量表示,并将每一个输出向量接入全连接网络,通过softmax层后得到每一个字在BIO上的概率分布P
m
=[p
B
,p
I
,p
O
];依据标注的标签和模型预测值计算损失函数;依据损失函数计算梯度,并更新模型参数。4.根据权利要求1所述的一种医患多轮对话中患者症状阴阳性的识别方法,其特征在于:所述S1中采用ElasticSearch与深度学习相结合的方式来对识别到的症状命名实体进行标准化操作,对于医学术语标准化技术,采用先召回后排序的整体结...
【专利技术属性】
技术研发人员:程龙龙,曹琉,崔丙剑,
申请(专利权)人:中电云脑天津科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。