The embodiment of the invention provides an electronic medical record document classification method, device, electronic equipment and storage medium, and relates to the field of data processing technology. The method comprises: a plurality of electronic medical records as the training sample set, and feature extraction of document training samples the electronic medical records documentation; according to the document classification model is trained by type of electronic medical records documentation and document feature; through the document classification model after training with electronic medical records document classification. The technical scheme of the embodiment of the invention can automatically classify the electronic medical record documents based on the multiple dimensions of the electronic medical record, and does not need manual annotation, so that the labor cost can be significantly reduced.
【技术实现步骤摘要】
电子病历文档分类方法、装置、电子设备及存储介质
本专利技术涉及数据处理
,具体而言,涉及一种电子病历文档分类方法、电子病历文档分类装置、电子设备以及计算机可读存储介质。
技术介绍
EMR(ElectronicMedicalRecord,电子病历)是用电子设备保存、管理、传输和重现的数字化的病人医疗记录。目前,几乎所有的EMR系统,都是按照人的维度来整合各种电子病历文档,但是并没有一个明确的标记来表示电子病历文档的类型。因此,在对医院的EMR文档进行数据处理前,需要确认每个EMR文档的类型,如入院记录,病程记录,手术记录等。现有的技术方案中,如果需要对EMR文档分类,往往是采用人工标注的方式对EMR文档进行分类。对于各医院存在的大量的EMR文档,人工标注的方式需要大量的人力成本,并且还容易标注错误。因此,需要提供一种能够解决上述问题中的一个或多个问题的电子病历文档分类方法、电子病历文档分类装置、电子设备以及计算机可读存储介质。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术的目的在于提供一种电子病历文档分类方法、电子病历文档分类装置、电子设备以及计算机可读存储介质,进而至少在一定程度上克服由于相关技术的限制和缺陷而导致的一个或者多个问题。根据本专利技术实施例的第一方面,提供了一种电子病历文档分类方法,包括:将多个电子病历文档作为训练样本集,并提取所述训练样本集中各所述电子病历文档的文档特征;根据各所述电子病历文档的类型以及所述文档特征对文档分类 ...
【技术保护点】
一种电子病历文档分类方法,其特征在于,包括:将多个电子病历文档作为训练样本集,并提取所述训练样本集中各所述电子病历文档的文档特征;根据各所述电子病历文档的类型以及所述文档特征对文档分类模型进行训练;通过训练后的所述文档分类模型对待分类的电子病历文档进行分类。
【技术特征摘要】
1.一种电子病历文档分类方法,其特征在于,包括:将多个电子病历文档作为训练样本集,并提取所述训练样本集中各所述电子病历文档的文档特征;根据各所述电子病历文档的类型以及所述文档特征对文档分类模型进行训练;通过训练后的所述文档分类模型对待分类的电子病历文档进行分类。2.根据权利要求1所述的电子病历文档分类方法,其特征在于,所述电子病历文档分类方法还包括:通过预定编码对所提取的所述训练样本集中各所述电子病历文档的文档特征进行编码;将经编码的各所述电子病历文档的文档特征映射成稀疏向量。3.根据权利要求1或2所述的电子病历文档分类方法,其特征在于,所述文档特征包括文档标题关键词特征、文档内容章节特征、文档内容关键词特征。4.根据权利要求1所述的电子病历文档分类方法,其特征在于,所述文档分类模型为梯度提升决策树模型,根据各所述电子病历文档的类型以及所述文档特征对文档分类模型进行训练,包括:根据各所述电子病历文档的类型以及所述文档特征对所述梯度提升决策树模型进行训练。5.根据权利要求4所述的电子病历文档分类方法,其特征在于,所述梯度提升决策树模型包括多个分类器,所述多个分类器的数量与所述多个电子病历文档的类型的数量相同。6.根据权利要求5所述的电子病历文档分类方法,其特征...
【专利技术属性】
技术研发人员:强晟,
申请(专利权)人:医渡云北京技术有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。