一种医案信息的处理方法、装置和设备制造方法及图纸

技术编号:18401281 阅读:32 留言:0更新日期:2018-07-08 20:44
本发明专利技术公开了一种医案信息的处理方法。该方法包括:获取原始医案文本,并将所述原始医案文本划分成至少一个目标文本单元;确定所述目标文本单元的文本特征对应的目标类别;生成目标医案文本,其中,在所述目标医案文本中所述目标文本单元体现为所述目标类别下的文本信息。通过本发明专利技术实施例提供的方法,在结构化的目标医案文本中不同的信息内容分别被划分到了相应的类别下,不仅使得用户能够更顺畅地阅读,而且使得用户能够更快地寻找到需要的信息内容,还使得目标医案文本更利于数据整理和分析。此外,本发明专利技术还公开了一种医案信息的处理装置和设备。

Method, device and device for processing medical record information

The invention discloses a medical case information processing method. The method includes: obtaining the text of the original medical case, dividing the text of the original medical case into at least one target text unit, determining the target category corresponding to the text feature of the target text unit, and generating the target text of medical case, in which the target text unit described in the target medical case text is embodied as the target. Text information under the category. Through the method provided by the embodiment of the invention, the different information content in the structured target medical text is divided into the corresponding categories, which not only enables the user to read more smoothly, but also enables the user to find the required information more quickly, and makes the target medical case text more beneficial to the data whole. Reason and analysis. In addition, the invention also discloses a processing device and device for medical record information.

【技术实现步骤摘要】
一种医案信息的处理方法、装置和设备
本专利技术涉及信息处理
,特别是涉及一种医案信息的处理方法、装置和设备。
技术介绍
目前,医案信息已经成为信息处理技术中十分常见的信息处理对象。由于医案信息能够反映患者的就医情况,医案信息可以用于医生、患者了解患者的历史病症、治疗等情况,也可以用于对大量患者的病症情况、治疗情况进行数据分析。但是,通常能够直接获取到的医案信息,其内容通常是杂乱无章的,也即,各种不同的信息内容不加区分地拼凑在一起。因此,一方面,在向用户显示这样的医案信息时,用户不仅难以顺畅地阅读而且也无法快速寻找到需要的信息内容,另一方面,这样的医案信息不利于信息内容的查找和识别,因此也难以用于数据整理和分析。
技术实现思路
本专利技术所要解决的技术问题是,提供一种医案信息的处理方法、装置和设备,以使得医案信息中各种不同的信息内容能够按照一定的结构格式区分开,实现医案信息的结构化,不仅便于用户阅读和快速寻找需求的信息内容,并且也便于数据整理和分析。第一方面,本专利技术实施例提供了一种医案信息的处理方法,包括:获取原始医案文本,并将所述原始医案文本划分成至少一个目标文本单元;确定所述目标文本单元的文本特征对应的目标类别;生成目标医案文本,其中,在所述目标医案文本中所述目标文本单元体现为所属目标类别下的文本信息。可选的,所述确定所述目标文本单元的文本特征对应的目标类别,可以包括:基于第一机器学习模型,确定所述目标文本单元的文本特征对应的目标类别,其中,所述第一机器学习模型通过对训练样本集中包括的历史医案文本的文本特征与预置类别之间的对应关系进行训练而得到。可选的,所述目标类别可以为用于描述患者信息的类别、用于描述疾病名称的类别、用于描述症状陈述信息的类别、用于描述症状辨别信息的类别、用于描述医嘱信息的类别、或用于描述处方信息的类别。可选的,所述方法还可以包括:从所述原始医案文本中提取用于描述第一特征项的目标特征词;其中,在所述目标医案文本中所述目标特征词体现为属于所述第一特征项的文本信息。可选的,所述从所述原始医案文本中提取用于描述第一特征项的目标特征词,可以包括:从所述原始医案文本中、所述第一特征项所属的目标类别下的文本信息中提取所述用于描述第一特征项的目标特征词。可选的,所述从所述原始医案文本中提取用于描述第一特征项的目标特征词,可以包括:对所述原始医案文本进行分析,得到用于描述所述第一特征项的初始特征词;在标准特征词库中对所述初始特征词进行匹配,得到与所述初始特征词相匹配的标准特征词,作为所述用于描述第一特征项的目标特征词。可选的,所述对所述原始医案文本进行分析,得到用于描述所述第一特征项的初始特征词,可以包括:基于医学专用词库,对所述原始医案文本进行词法分析和/或句法分析,得到所述用于描述所述第一特征项的初始特征词。可选的,所述方法还可以包括:建立用于描述所述第一特征项的初始特征词和目标特征词的对应关系,并体现在所述目标医案文本中。可选的,所述方法还可以包括:确定所述原始医案文本在第二特征项下对应的推断特征词,其中,所述推断特征词为在所述原始医案文本中没有记载的用于描述所述第二特征项的特征词;在所述目标医案文本中所述推断特征词体现为属于所述第二特征项的文本信息。可选的,所述确定所述原始医案文本在第二特征项下对应的推断特征词,可以包括:基于第二机器学习模型,确定所述原始医案文本在所述第二特征项下对应的推断特征词,其中,所述第二机器学习模型通过对训练样本集中包括的历史医案文本与预置的用于描述所述第二特征项的推断特征词之间的对应关系进行训练而得到。可选的,所述生成目标医案文本之后,所述方法还可以包括:查找与所述目标医案文本相匹配的预置医案文本,其中,所述预置医案文本在所述目标类别下的文本信息与所述目标文本单元相同或相似,所述目标类别包括用于描述患者个人信息的类别和/或用于描述患者症状的类别;提取所述预置医案文本中用于描述诊断信息的类别下的文本信息,作为参考诊断信息体现在所述目标医案文本中。可选的,所述获取原始医案文本,可以包括:获取语音形式的医案信息;对所述医案信息进行语音识别,得到所述原始医案文本;或者,获取图像形式的医案信息;对所述医案信息进行图像识别,得到所述原始医案文本。第二方面,本专利技术实施例提供了一种医案信息的处理装置,包括:获取单元,用于获取原始医案文本;划分单元,用于将所述原始医案文本划分成至少一个目标文本单元;第一确定单元,用于确定所述目标文本单元的文本特征对应的目标类别;生成单元,用于生成目标医案文本,其中,在所述目标医案文本中所述目标文本单元体现为所属目标类别下的文本信息。可选的,所述第一确定单元,可以包括:目标类别确定子单元,用于基于第一机器学习模型,确定所述目标文本单元的文本特征对应的目标类别,其中,所述第一机器学习模型通过对训练样本集中包括的历史医案文本的文本特征与预置类别之间的对应关系进行训练而得到。可选的,所述目标类别为用于描述患者信息的类别、用于描述疾病名称的类别、用于描述症状陈述信息的类别、用于描述症状辨别信息的类别、用于描述医嘱信息的类别、或用于描述处方信息的类别。可选的,所述装置还可以包括:第一提取单元,用于从所述原始医案文本中提取用于描述第一特征项的目标特征词;其中,在所述目标医案文本中所述目标特征词体现为属于所述第一特征项的文本信息。可选的,所述第一提取单元,可以包括:目标特征词提取子单元,用于从所述原始医案文本中、所述第一特征项所属的目标类别下的文本信息中提取所述用于描述第一特征项的目标特征词。可选的,所述第一提取单元,可以具体包括:分析子单元和匹配子单元;所述分析子单元,用于对所述原始医案文本进行分析,得到用于所述描述第一特征项的初始特征词;所述匹配子单元,用于在标准特征词库中对所述初始特征词进行匹配,得到与所述初始特征词相匹配的标准特征词,作为所述用于描述第一特征项的目标特征词。可选的,所述匹配子单元,具体可以包括:初始特征词提取子单元,用于基于医学专用词库,对所述原始医案文本进行词法分析和/或句法分析,得到所述用于描述所述第一特征项的初始特征词。可选的,所述装置还可以包括:建立单元,用于描述所述第一特征项的初始特征词和目标特征词的对应关系,并体现在所述目标医案文本中。可选的,所述装置还可以包括:第二确定单元,用于确定所述原始医案文本在第二特征项下对应的推断特征词,其中,所述推断特征词为在所述原始医案文本中没有记载的用于描述所述第二特征项的特征词;在所述目标医案文本中所述推断特征词体现为属于所述第二特征项的文本信息。可选的,所述第二确定单元,可以包括:推断特征词确定子单元,用于基于第二机器学习模型,确定所述原始医案文本在所述第二特征项下对应的推断特征词,其中,所述第二机器学习模型通过对训练样本集中包括的历史医案文本与预置的用于描述所述第二特征项的推断特征词之间的对应关系进行训练而得到。可选的,所述装置还可以包括:查找单元和第二提取单元;所述查找单元,用于查找与所述目标医案文本相匹配的预置医案文本,其中,所述预置医案文本在所述目标类别下的文本信息与所述目标文本单元相同或相似,所述目标类别包括用于描述患者个人信息的类别和/或用于描述患者症状的类别;所述第二本文档来自技高网...

【技术保护点】
1.一种医案信息的处理方法,其特征在于,包括:获取原始医案文本,并将所述原始医案文本划分成至少一个目标文本单元;确定所述目标文本单元的文本特征对应的目标类别;生成目标医案文本,其中,在所述目标医案文本中所述目标文本单元体现为所属目标类别下的文本信息。

【技术特征摘要】
1.一种医案信息的处理方法,其特征在于,包括:获取原始医案文本,并将所述原始医案文本划分成至少一个目标文本单元;确定所述目标文本单元的文本特征对应的目标类别;生成目标医案文本,其中,在所述目标医案文本中所述目标文本单元体现为所属目标类别下的文本信息。2.根据权利要求1所述的方法,其特征在于,所述确定所述目标文本单元的文本特征对应的目标类别,包括:基于第一机器学习模型,确定所述目标文本单元的文本特征对应的目标类别,其中,所述第一机器学习模型通过对训练样本集中包括的历史医案文本的文本特征与预置类别之间的对应关系进行训练而得到。3.根据权利要求1所述的方法,其特征在于,所述目标类别为用于描述患者信息的类别、用于描述疾病名称的类别、用于描述症状陈述信息的类别、用于描述症状辨别信息的类别、用于描述医嘱信息的类别、或用于描述处方信息的类别。4.根据权利要求1所述的方法,其特征在于,还包括:从所述原始医案文本中提取用于描述第一特征项的目标特征词;其中,在所述目标医案文本中所述目标特征词体现为属于所述第一特征项的文本信息。5.根据权利要求4所述的方法,其特征在于,所述从所述原始医案文本中提取用于描述第一特征项的目标特征词,包括:从所述原始医案文本中、所述第一特征项所属的目标类别下的文本信息中提取所述用于描述第一特征项的目标特征词。6.根据权利要求4所述的方法,其特征在于,所述从所述原始医案文本中提取用于描述第一特征项的目标特征词,包括:对所述原始医案文本进行分析,得到用于描述所述第一特征项的初始特征词;在标准特征词库中对所述初始特征词进行匹配,得到与所述初始特征词相匹配的标准特征词,作为所述用于描述第一特征项的目标特征词。7.根据权利要求6所述的方法,其特征在于,所述对所述原始医案文本进行分析,得到用于描述所述第一特征项的初始特征词,包括:基于医学专用词库,对所述原始医案文本进行词法分析和/或句法分析,得到所述用于描述所述第一特征项的初始特征词。8.根据权利要求6所述的方法,其特征在于,还包括:建立用于描述所述第一特征项的初始特征词和目标特征词的对应关系,并体现在所述目标医案文本中。9.根据权利要求1所述的方法,其特征在于,还...

【专利技术属性】
技术研发人员:银磊李明修卜海亮魏世嘉
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1