The invention discloses a medical case information processing method. The method includes: obtaining the text of the original medical case, dividing the text of the original medical case into at least one target text unit, determining the target category corresponding to the text feature of the target text unit, and generating the target text of medical case, in which the target text unit described in the target medical case text is embodied as the target. Text information under the category. Through the method provided by the embodiment of the invention, the different information content in the structured target medical text is divided into the corresponding categories, which not only enables the user to read more smoothly, but also enables the user to find the required information more quickly, and makes the target medical case text more beneficial to the data whole. Reason and analysis. In addition, the invention also discloses a processing device and device for medical record information.
【技术实现步骤摘要】
一种医案信息的处理方法、装置和设备
本专利技术涉及信息处理
,特别是涉及一种医案信息的处理方法、装置和设备。
技术介绍
目前,医案信息已经成为信息处理技术中十分常见的信息处理对象。由于医案信息能够反映患者的就医情况,医案信息可以用于医生、患者了解患者的历史病症、治疗等情况,也可以用于对大量患者的病症情况、治疗情况进行数据分析。但是,通常能够直接获取到的医案信息,其内容通常是杂乱无章的,也即,各种不同的信息内容不加区分地拼凑在一起。因此,一方面,在向用户显示这样的医案信息时,用户不仅难以顺畅地阅读而且也无法快速寻找到需要的信息内容,另一方面,这样的医案信息不利于信息内容的查找和识别,因此也难以用于数据整理和分析。
技术实现思路
本专利技术所要解决的技术问题是,提供一种医案信息的处理方法、装置和设备,以使得医案信息中各种不同的信息内容能够按照一定的结构格式区分开,实现医案信息的结构化,不仅便于用户阅读和快速寻找需求的信息内容,并且也便于数据整理和分析。第一方面,本专利技术实施例提供了一种医案信息的处理方法,包括:获取原始医案文本,并将所述原始医案文本划分成至少一个目标文本单元;确定所述目标文本单元的文本特征对应的目标类别;生成目标医案文本,其中,在所述目标医案文本中所述目标文本单元体现为所属目标类别下的文本信息。可选的,所述确定所述目标文本单元的文本特征对应的目标类别,可以包括:基于第一机器学习模型,确定所述目标文本单元的文本特征对应的目标类别,其中,所述第一机器学习模型通过对训练样本集中包括的历史医案文本的文本特征与预置类别之间的对应关系进行训练而得到。可 ...
【技术保护点】
1.一种医案信息的处理方法,其特征在于,包括:获取原始医案文本,并将所述原始医案文本划分成至少一个目标文本单元;确定所述目标文本单元的文本特征对应的目标类别;生成目标医案文本,其中,在所述目标医案文本中所述目标文本单元体现为所属目标类别下的文本信息。
【技术特征摘要】
1.一种医案信息的处理方法,其特征在于,包括:获取原始医案文本,并将所述原始医案文本划分成至少一个目标文本单元;确定所述目标文本单元的文本特征对应的目标类别;生成目标医案文本,其中,在所述目标医案文本中所述目标文本单元体现为所属目标类别下的文本信息。2.根据权利要求1所述的方法,其特征在于,所述确定所述目标文本单元的文本特征对应的目标类别,包括:基于第一机器学习模型,确定所述目标文本单元的文本特征对应的目标类别,其中,所述第一机器学习模型通过对训练样本集中包括的历史医案文本的文本特征与预置类别之间的对应关系进行训练而得到。3.根据权利要求1所述的方法,其特征在于,所述目标类别为用于描述患者信息的类别、用于描述疾病名称的类别、用于描述症状陈述信息的类别、用于描述症状辨别信息的类别、用于描述医嘱信息的类别、或用于描述处方信息的类别。4.根据权利要求1所述的方法,其特征在于,还包括:从所述原始医案文本中提取用于描述第一特征项的目标特征词;其中,在所述目标医案文本中所述目标特征词体现为属于所述第一特征项的文本信息。5.根据权利要求4所述的方法,其特征在于,所述从所述原始医案文本中提取用于描述第一特征项的目标特征词,包括:从所述原始医案文本中、所述第一特征项所属的目标类别下的文本信息中提取所述用于描述第一特征项的目标特征词。6.根据权利要求4所述的方法,其特征在于,所述从所述原始医案文本中提取用于描述第一特征项的目标特征词,包括:对所述原始医案文本进行分析,得到用于描述所述第一特征项的初始特征词;在标准特征词库中对所述初始特征词进行匹配,得到与所述初始特征词相匹配的标准特征词,作为所述用于描述第一特征项的目标特征词。7.根据权利要求6所述的方法,其特征在于,所述对所述原始医案文本进行分析,得到用于描述所述第一特征项的初始特征词,包括:基于医学专用词库,对所述原始医案文本进行词法分析和/或句法分析,得到所述用于描述所述第一特征项的初始特征词。8.根据权利要求6所述的方法,其特征在于,还包括:建立用于描述所述第一特征项的初始特征词和目标特征词的对应关系,并体现在所述目标医案文本中。9.根据权利要求1所述的方法,其特征在于,还...
【专利技术属性】
技术研发人员:银磊,李明修,卜海亮,魏世嘉,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。