一种判别医学实体的属性的方法、装置及相关产品制造方法及图纸

技术编号:26763945 阅读:30 留言:0更新日期:2020-12-18 23:32
本申请公开了一种判别医学实体的属性的方法、装置及相关产品。首先应用标签生成模型对病历文本进行处理,得到标签串;其后,根据标签串中的属性标签及属性标签的排序,得到病历文本中医学实体的属性标签。医学实体的属性标签即可用于判别医学实体的属性。标签生成模型中第一模型根据实际输入的病历文本动态生成字的向量,该标签生成模型在生成字的属性标签时结合了字的上下文信息,提升了字的属性标签的准确性。第二模型是通过深度学习的方法训练的得到的,可依据第一模型所输出的向量串生成标签串,保证了标签串中标签属性与病历文本中字有序对应。因此相比于现有技术,对于医学实体属性判别的准确率提高。

【技术实现步骤摘要】
一种判别医学实体的属性的方法、装置及相关产品
本申请涉及数据处理
,特别是涉及一种判别医学实体的属性的方法、装置及相关产品。
技术介绍
实体,是指客观存在并可相互区别的事物。医学实体,是指医学领域中有含义的相互区别的事物。例如咳嗽、发热、心脏病等,均属于医学实体。医学实体广泛存在于病历文本中。随着医疗领域的信息化发展,医疗大数据的价值日益突出,电子病历的数据标准化成为医疗数据互通的关键。为了实现电子病历的数据标准化,首先要对病历文本进行结构化提取。在对病历文本进行结构化提取时,通常需要对医学实体的属性进行分析和判别。如“无咳嗽、咳痰”,“咳嗽”和“咳痰”是症状,而“无”修饰的是“咳嗽”和“咳痰”,那么“咳嗽”和“咳痰”就是阴性;而“患者咳嗽、咳痰”中,“咳嗽”和“咳痰”是阳性;而在“无严重咳嗽”和“不宜进行颅内压监测”情况下根据真实语义是无法明确判别阴阳性,即“疑似”。目前在对医学实体的属性进行判别时,通常可以采用基于正则的方法或句子分类的方法。其中,基于正则的方法使用词典直接判断,错误率高;而采用句子分类的方法,当句子过本文档来自技高网...

【技术保护点】
1.一种判别医学实体的属性的方法,其特征在于,包括:/n利用标签生成模型对病历文本进行处理得到标签串;所述标签串包括所述病历文本中字的属性标签;所述标签串中的属性标签的排序与所述病历文本中对应的字的排序一致;/n根据所述标签串中的属性标签及属性标签的排序得到所述病历文本中的医学实体的属性标签;/n所述标签生成模型包括:第一模型和第二模型,所述第一模型的输出作为所述第二模型的输入;所述第二模型为预先利用训练数据深度学习训练后得到的;所述训练数据包括:所述第一模型根据训练语料动态生成的训练向量串和所述训练向量串对应的训练标签串;所述训练向量串中向量的排序与所述训练语料中对应的字的排序一致,且与所述...

【技术特征摘要】
1.一种判别医学实体的属性的方法,其特征在于,包括:
利用标签生成模型对病历文本进行处理得到标签串;所述标签串包括所述病历文本中字的属性标签;所述标签串中的属性标签的排序与所述病历文本中对应的字的排序一致;
根据所述标签串中的属性标签及属性标签的排序得到所述病历文本中的医学实体的属性标签;
所述标签生成模型包括:第一模型和第二模型,所述第一模型的输出作为所述第二模型的输入;所述第二模型为预先利用训练数据深度学习训练后得到的;所述训练数据包括:所述第一模型根据训练语料动态生成的训练向量串和所述训练向量串对应的训练标签串;所述训练向量串中向量的排序与所述训练语料中对应的字的排序一致,且与所述训练标签串中对应的属性标签的排序一致。


2.根据权利要求1所述的方法,其特征在于,所述根据所述标签串中的属性标签及属性标签的排序得到所述病历文本中的医学实体的属性标签,具体包括:
识别所述标签串中连续且一致的属性标签;
根据所述连续且一致的属性标签在所述标签串中的排序,确定所述病历文本中所述连续且一致的属性标签对应的一组字;
将所述一组字拼接为一个医学实体;
将所述连续且一致的属性标签作为拼接得到的医学实体的属性标签。


3.根据权利要求1或2所述的方法,其特征在于,所述病历文本中的医学实体的属性标签为以下任意一种:
阴性、阳性或疑似。


4.根据权利要求3所述的方法,其特征在于,还包括:
从所述病历文本中获得目标语句;所述目标语句包括属性标签为疑似的目标医学实体,所述目标医学实体为所述病历文本中任一医学实体;
从所述训练语料中获得所述目标语句的相似语句;
根据所述目标语句和所述目标语句的相似语句,提取所述目标语句中所述目标医学实体的影响属性。


5.根据权利要求4所述的方法,其特征在于,所述从所述训练语料中获得所述目标语句的相似语句,具体包括:
对所述目标语句进行分词;
获得所述目标语句的多个词向量;
根据所述多个词向量获得目标平均向量;
分别获得所述训练语料中的各个语句对应的平均向量与所述目标平均向量的相似度,根据所述相似度确定所述目标语句的相似语句。

【专利技术属性】
技术研发人员:贾弼然顾文剑蔡巍张霞
申请(专利权)人:沈阳东软智能医疗科技研究院有限公司
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1