一种病历搜索结果的排序方法和相关装置制造方法及图纸

技术编号:21115728 阅读:35 留言:0更新日期:2019-05-16 08:59
本申请公开了一种病历搜索结果的排序方法和相关装置。通过对病历库中电子病历的各个病历文书的字段进行分类,获得所述电子病历对应的第一权重;通过对所述电子病历的所有已分类字段的值域进行聚类统计,获得所述电子病历对应的第二权重;最终根据搜索词,以及所述病历库中各个电子病历对应的所述第一权重和所述第二权重,对搜索到的电子病历排序。该方法可以基于已有的医疗电子病历模型使用,从而便捷高效地实现病历文书中的字段分类。此外该方法适用于与现有相关性排序算法结合,在排序过程中一并考虑电子病历的重要程度和相关度,将更符合搜索词的电子病历优先排列,因此提升用户满意度,提升用户获取其搜索期望的电子病历的效率。

【技术实现步骤摘要】
一种病历搜索结果的排序方法和相关装置
本申请涉及医疗
,特别是涉及一种病历搜索结果的排序方法和相关装置。
技术介绍
病历是病人在医院诊断治疗全过程的原始记录。现如今,电子病历(ElectronicMedicalRecord,EMR)通常包含多个病历文书,例如:病案首页、病程记录、检查检验结果、医嘱、手术记录、护理记录等,还可包括病人在医院获得的其他相关服务的记录。参见图1,该图展示了一份电子病历样例。病历库或病历管理系统中通常存储由海量病人的电子病历。在医疗
,利用病历库或病历管理系统能够在一定程度上提高医院相关工作人员的办公效率。但是由于海量数据的存在,搜索所需病历的难度也在逐渐提高。这不但对搜索算法提出了较高的要求,同时也对病历搜索结果的排序方法提出了较高的要求。目前已有一些技术,按照相关性、时间或者病历文书分词所得的字段的重要程度,将病历搜索结果加以排序。但是,这些排序方法各自存在缺陷。按照相关性排序,没有考虑到搜索词在文档中的位置。这样,即便排序在前的病历搜索结果与搜索词的匹配度很高,但是病历搜索结果中命中的字段的重要性可能并不高。按照时间排序,仅仅可以实现病历从新到旧或者从旧到新的排序效果;维度单一,所适应的搜索结果呈现需求也比较单一。按照字段重要程度排序,容易受到电子病历的病历文书的结构化程度影响。例如,电子病历的某些病历文书可能是结构化数据、非结构化数据或半结构化数据。结构化数据,即是指可以使用关系型数据库表示和存储,表现为二维形式的数据。非结构化数据,即没有固定结构的数据,例如图片、文档等。半结构化数据,又称自描述结构的数据,其不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但是包含相关标记,用来分割语义元素以及对记录和字段进行分层,常见的半结构化数据有XML和JSON等。对于很多非结构化数据,需要对其进行分词以增加字段,相比于结构化数据,非结构化数据的字段的值域统计准确性难以保证,从而,即便是重要字段,由于值域不准确也会影响排序结果。因此,排序在前的搜索结果也不一定是用户最满意的电子病历,从而影响电子病历的获取效率。基于上述排序方法存在的缺陷,如何对病历搜索结果进行排序以提高电子病历的获取效率,已经成为本领域急需解决的技术问题。
技术实现思路
基于上述问题,本申请提供了一种病历搜索结果的排序方法和相关装置方法,以提高电子病历的获取效率,提升用户满意度。本申请实施例公开了如下技术方案:第一方面,本申请提供一种病历搜索结果的排序方法,包括:通过对病历库中电子病历的各个病历文书的字段进行分类,获得所述电子病历对应的第一权重;通过对所述电子病历的所有已分类字段的值域进行聚类统计,获得所述电子病历对应的第二权重;根据搜索词,以及所述病历库中各个电子病历对应的所述第一权重和所述第二权重,对搜索到的电子病历排序。可选地,所述通过对病历库中电子病历的各个病历文书的字段进行分类,获得所述电子病历对应的第一权重,具体包括:利用医疗分类词库对所述病历库中所述电子病历的各个病历文书的字段进行类别标记;所述医疗分类词库包括:疾病词库、症状词库、药品词库、检验词库、检查词库和手术词库;所述病历文书中每标记一个字段,进行累加计数,标记结束后获得各个所述病历文书对应的计数结果;根据各个所述病历文书对应的计数结果,获得所述电子病历对应的第一权重。可选地,所述根据各个所述病历文书对应的计数结果,获得所述电子病历对应的第一权重,具体包括:根据各个所述病历文书对应的计数结果,获得各个所述病历文书对应的文书权重;根据各个所述病历文书对应的计数结果和各个所述病历文书对应的文书权重,获得所述电子病历对应的所述第一权重。可选地,所述根据各个所述病历文书对应的计数结果和各个所述病历文书对应的文书权重,获得所述电子病历对应的所述第一权重,具体包括:将各个所述病历文书对应的计数结果与文书权重相乘,获得各个所述病历文书对应的乘积结果;将各个所述病历文书对应的所述乘积结果进行累加,得到累加结果,并将所述累加结果作为所述电子病历对应的第一权重。可选地,所述通过对所述电子病历的所有已分类字段的值域进行聚类统计,获得所述电子病历对应的第二权重,具体包括:通过对所述病历库中所有字段的值域进行聚类统计,获得各个类别对应的第一统计结果;所述第一统计结果中包括所述类别下的各个字段的值域的值以及所述各个字段的值域的值对应的统计次数;利用同义词词库对所述第一统计结果中同义的值进行归一处理和统计,获得各个类别对应的第二统计结果;通过对所述电子病历的所有已分类字段进行聚类统计,获得各个类别对应的第三统计结果;所述第三统计结果中包括所述类别下的各个所述已分类字段的值域的值以及各个所述已分类字段的值域的值对应的统计次数;利用各个类别对应的所述第三统计结果和各个类别对应的第二统计结果,获得所述电子病历对应的第二权重。可选地,所述利用各个类别对应的所述第三统计结果和各个类别对应的第二统计结果,获得所述电子病历对应的第二权重,具体包括:根据所述第二统计结果中各个值以及所述各个值对应的统计次数,获得所述各个值的权重;将同一类别对应的所述第三统计结果和第二统计结果进行字段值域的匹配,如果匹配成功,且所述第三统计结果中所述已分类字段的值域有值,则将匹配成功的值的权重与预设值相加,获得所述已分类字段的字段权重;如果匹配失败,且所述第三统计结果中所述已分类字段的值域有值,则将所述已分类字段的字段权重设为所述预设值;如果所述第三统计结果中所述已分类字段的值域无值,则将所述已分类字段的字段权重设为0;将所述电子病历的所有所述已分类字段的字段权重累加,获得所述电子病历对应的所述第二权重。可选地,上述方法还包括:所述病历库更新时,更新所述第一统计结果。可选地,所述根据搜索词,以及所述病历库中各个电子病历对应的所述第一权重和所述第二权重,对搜索到的电子病历排序,具体包括:根据所述搜索词,利用BM25算法对所述病历库中各个电子病历进行打分,获得各个所述电子病历的初始分值;将所述初始分值大于预设分值的电子病历作为搜索到的电子病历;将所述搜索到的电子病历的初始分值、所述搜索到的电子病历对应的第一权重以及所述搜索到的电子病历对应的第二权重相加,获得所述搜索到的电子病历的最终分值;将各个所述搜索到的电子病历按照最终分值降序排列。可选地,在所述根据搜索词,以及所述病历库中各个电子病历对应的所述第一权重和所述第二权重,对搜索到的电子病历排序之前,所述方法还包括:将所述电子病历的数据使用倒排索引的方式索引至搜索引擎中。第二方面,本申请提供一种病历搜索结果的排序装置,包括:病历第一权重获取模块,用于通过对病历库中电子病历的各个病历文书的字段进行分类,获得所述电子病历对应的第一权重;病历第二权重获取模块,用于通过对所述电子病历的所有已分类字段的值域进行聚类统计,获得所述电子病历对应的第二权重;病历排序模块,用于根据搜索词,以及所述病历库中各个电子病历对应的所述第一权重和所述第二权重,对搜索到的电子病历排序。相较于现有技术,本申请具有以下有益效果:本申请提供的一种病历搜索结果的排序方法,通过对病历库中电子病历的各个病历文书的字段进行分类,获得所述电子病历对应的第一权重;通过对所述本文档来自技高网
...

【技术保护点】
1.一种病历搜索结果的排序方法,其特征在于,包括:通过对病历库中电子病历的各个病历文书的字段进行分类,获得所述电子病历对应的第一权重;通过对所述电子病历的所有已分类字段的值域进行聚类统计,获得所述电子病历对应的第二权重;根据搜索词,以及所述病历库中各个电子病历对应的所述第一权重和所述第二权重,对搜索到的电子病历排序。

【技术特征摘要】
1.一种病历搜索结果的排序方法,其特征在于,包括:通过对病历库中电子病历的各个病历文书的字段进行分类,获得所述电子病历对应的第一权重;通过对所述电子病历的所有已分类字段的值域进行聚类统计,获得所述电子病历对应的第二权重;根据搜索词,以及所述病历库中各个电子病历对应的所述第一权重和所述第二权重,对搜索到的电子病历排序。2.根据权利要求1所述的方法,其特征在于,所述通过对病历库中电子病历的各个病历文书的字段进行分类,获得所述电子病历对应的第一权重,具体包括:利用医疗分类词库对所述病历库中所述电子病历的各个病历文书的字段进行类别标记;所述医疗分类词库包括:疾病词库、症状词库、药品词库、检验词库、检查词库和手术词库;所述病历文书中每标记一个字段,进行累加计数,标记结束后获得各个所述病历文书对应的计数结果;根据各个所述病历文书对应的计数结果,获得所述电子病历对应的第一权重。3.根据权利要求2所述的方法,其特征在于,所述根据各个所述病历文书对应的计数结果,获得所述电子病历对应的第一权重,具体包括:根据各个所述病历文书对应的计数结果,获得各个所述病历文书对应的文书权重;根据各个所述病历文书对应的计数结果和各个所述病历文书对应的文书权重,获得所述电子病历对应的所述第一权重。4.根据权利要求3所述的方法,其特征在于,所述根据各个所述病历文书对应的计数结果和各个所述病历文书对应的文书权重,获得所述电子病历对应的所述第一权重,具体包括:将各个所述病历文书对应的计数结果与文书权重相乘,获得各个所述病历文书对应的乘积结果;将各个所述病历文书对应的所述乘积结果进行累加,得到累加结果,并将所述累加结果作为所述电子病历对应的第一权重。5.根据权利要求1-4任一项所述的方法,其特征在于,所述通过对所述电子病历的所有已分类字段的值域进行聚类统计,获得所述电子病历对应的第二权重,具体包括:通过对所述病历库中所有字段的值域进行聚类统计,获得各个类别对应的第一统计结果;所述第一统计结果中包括所述类别下的各个字段的值域的值以及所述各个字段的值域的值对应的统计次数;利用同义词词库对所述第一统计结果中同义的值进行归一处理和统计,获得各个类别对应的第二统计结果;通过对所述电子病历的所有已分类字段进行聚类统计,获得各个类别对应的第三统计结果;所述第三统计结果中包括所述类别下的各个所述已分类字段的值域的值以及各个所述已分类字段的值域的值对应的...

【专利技术属性】
技术研发人员:任彩红胡可云陈联忠
申请(专利权)人:北京嘉和美康信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1