本公开涉及排序模型的自训练方法、排序模型、医疗文本的处理方法、医疗文本的处理装置及计算机可读存储介质,方法包括获取具有排序标注的文本;提取文本中的医学特征信息;基于从文本中获取的手术信息,获取表征手术的属性信息;将医学特征信息和属性信息与排序标注构建关联关系,以能够基于关联关系将包含医学特征信息和属性信息的待排序文本中的手术项按排序标注的方式排序;或包括:获取包含手术项的文本;提取医学特征信息;基于从该文本中获取的手术信息,获取属性信息;根据医学特征信息和属性信息,按照所述关联关系对该文本的手术项排序。通过本公开的各实施例能够准确高效地标准化处理完整的医疗文本,整理出有序的手术信息。
【技术实现步骤摘要】
自训练方法、模型、处理方法、装置及存储介质
本公开涉及医疗文本智能处理
,具体涉及一种排序模型的自训练方法、排序模型、医疗文本的处理方法、医疗文本的处理装置及计算机可读存储介质。
技术介绍
在针对医疗文本处理过程中,对涉及到手术信息的整理,手术的编码的顺序是有要求的,尤其是第一手术信息的确定,直接关系到DRG分组的结果。一般临床医生在书写手术的时候是没注意手术顺序的,或者手术编码的顺序是错误的。
技术实现思路
本公开意图提供一种排序模型的自训练方法、排序模型、医疗文本的处理方法、医疗文本的处理装置及计算机可读存储介质,能够准确高效地标准化处理完整的医疗文本,整理出有序的手术信息。根据本公开的方案之一,提供一种排序模型的自训练方法,包括:获取具有排序标注的文本;提取文本中的医学特征信息;基于从文本中获取的手术信息,获取表征手术的属性信息;将所述医学特征信息和属性信息与排序标注构建关联关系,以能够基于所述关联关系将包含所述医学特征信息和属性信息的待排序文本中的手术项按所述排序标注的方式排序。在一些实施例中,其中,所述提取文本中的医学特征信息,包括:基于文本中以下至少一项信息,提取文本中的医学特征信息:诊断信息、检查信息、检验信息、病程信息、用药信息、医疗器械信息。在一些实施例中,其中,所述基于从文本中获取的手术信息,获取表征手术的属性信息,包括:从文本中提取包含手术编码的手术名称;对照手术属性信息表,获取所述属性信息;其中:所述手术属性表包括:标准手术名称、标准手术编码,以及与这些标准手术名称和标准手术编码对应的属性信息。在一些实施例中,其中,所述属性信息,包括以下至少一项:手术类型信息;手术等级信息;手术费用信息。在一些实施例中,其中,所述从文本中提取包含手术编码的手术名称,包括:将原始手术信息与标准手术信息表的标准词匹配,获得匹配关系;基于匹配关系,筛选出分别包含原始手术信息和标准词的待处理手术信息;通过分类算法,对所述待处理手术信息进行归一化处理,得到编码后的手术名称。在一些实施例中,还包括:基于海量获取的具有排序标注的文本,迭代进行训练。根据本公开的方案之一,提供一种排序模型,其特征在于,所述排序模型根据如上述的方法训练得到。根据本公开的方案之一,提供基于如上述的排序模型的医疗文本的处理方法,包括:获取包含手术项的文本;提取该文本中的医学特征信息;基于从该文本中获取的手术信息,获取表征手术的属性信息;根据所述医学特征信息和属性信息,按照所述关联关系对该文本的手术项排序。根据本公开的方案之一,提供基于如上述的排序模型的医疗文本的处理装置,包括:文本输入模块,其配置为用于获取包含手术项的文本;提取模块,其配置为用于提取该文本中的医学特征信息;获取模块,其配置为用于基于从该文本中获取的手术信息,获取表征手术的属性信息;排序模块,其配置为用于根据所述医学特征信息和属性信息,按照所述关联对该文本的手术项排序。根据本公开的方案之一,提供计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现:根据上述的排序模型的自训练方法;或者根据上述的医疗文本的处理方法。本公开的各种实施例的排序模型的自训练方法、排序模型、医疗文本的处理方法、医疗文本的处理装置及计算机可读存储介质,通过获取具有排序标注的文本;提取文本中的医学特征信息;基于从文本中获取的手术信息,获取表征手术的属性信息;将所述医学特征信息和属性信息与排序标注构建关联,以能够将包含所述医学特征信息和属性信息的文本中的手术项按所述排序标注的方式排序;以及在上述训练方法基础上,获取包含手术项的文本;提取该文本中的医学特征信息;基于从该文本中获取的手术信息,获取表征手术的属性信息;根据所述医学特征信息和属性信息,按照所述关联对该文本的手术项排序,从而能够在提取医疗文本中的多个手术信息的基础上,对完整医疗文本进行处理,结合从医疗文本中提取的医学特征信息得到有序的手术信息。本公开通过上述处理方法,不仅仅实现把临床医生写出来的临床诊断和手术名称编码到标准的术语上,针对临床医生写的手术名称不够详细,以及文本中没有手术顺序的,或者手术编码的顺序是错误的,还能够智能地结合病历文书进行细化和完善,结合从医疗文本中提取的医学特征信息输出有序的主要手术,完整、准确、高效地表达各种医学信息,从而提升医学研究、医疗诊治的精确性和效率。应当理解,前面的大体描述以及后续的详细描述只是示例性的和说明性的,并非对所要求保护的本公开的限制。附图说明在未必按照比例绘制的附图中,不同视图中相似的附图标记可以表示相似的构件。具有字母后缀的相似附图标记或具有不同字母后缀的相似附图标记可以表示相似构件的不同实例。附图通常作为示例而非限制地图示各种实施例,并且与说明书和权利要求书一起用于解释所公开的实施例。图1示出本公开实施例涉及的排序模型的自训练方法的一种流程图;图2示出本公开实施例涉及的医疗文本的处理方法的一种流程图;图3示出本公开实施例涉及的医疗文本的处理装置的一种架构图;图4示出本公开各种实施例涉及的手术属性信息表。具体实施方式为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。为了保持本公开实施例的以下说明清楚且简明,本公开省略了已知功能和已知部件的详细说明。本公开涉及医疗文本的处理,用于针对医学信息的解析,以及手术信息的排序整理。在针对医疗文本处理过程中,对涉及到手术信息的整理,手术的编码的顺序是有要求的,尤其是第一手术信息的确定,直接关系到DRG分组的结果。一般临床医生在书写手术的时候是没注意手术顺序的,或者手术编码的顺序是错误的。需要考虑针对临床医生写的手术名称不够详细,以及数据中没有手术顺序的,或者手术编码的顺序是错误的各种情形,按自学习得到的规律进行排序。作为方案之一,如图1所示,结合图4,本公开的实施例提供了一种排序模型的自训练方法,包括:S101:获取具有排序标注的文本;S102:提取文本中的医学特征信息;S103:基于从文本中获取的手术信息本文档来自技高网...
【技术保护点】
1.排序模型的自训练方法,包括:/n获取具有排序标注的文本;/n提取文本中的医学特征信息;/n基于从文本中获取的手术信息,获取表征手术的属性信息;/n将所述医学特征信息和属性信息与排序标注构建关联关系,以能够基于所述关联关系将包含所述医学特征信息和属性信息的待排序文本中的手术项按所述排序标注的方式排序。/n
【技术特征摘要】
1.排序模型的自训练方法,包括:
获取具有排序标注的文本;
提取文本中的医学特征信息;
基于从文本中获取的手术信息,获取表征手术的属性信息;
将所述医学特征信息和属性信息与排序标注构建关联关系,以能够基于所述关联关系将包含所述医学特征信息和属性信息的待排序文本中的手术项按所述排序标注的方式排序。
2.根据权利要求1所述的方法,其中,所述提取文本中的医学特征信息,包括:
基于文本中以下至少一项信息,提取文本中的医学特征信息:
诊断信息、检查信息、检验信息、病程信息、用药信息、医疗器械信息。
3.根据权利要求2所述的方法,其中,所述基于从文本中获取的手术信息,获取表征手术的属性信息,包括:
从文本中提取包含手术编码的手术名称;
对照手术属性信息表,获取所述属性信息;
其中:
所述手术属性表包括:
标准手术名称、标准手术编码,以及与这些标准手术名称和标准手术编码对应的属性信息。
4.根据权利要求3所述的方法,其中,所述属性信息,包括以下至少一项:
手术类型信息;
手术等级信息;
手术费用信息。
5.根据权利要求3所述的方法,其中,所述从文本中提取包含手术编码的手术名称,包括:
将原始手术信息与标准手术信息表的标准词匹配,获得匹配关系;
基于匹配关系,筛选出分别包含原始...
【专利技术属性】
技术研发人员:郑永升,梁平,姜轩,
申请(专利权)人:杭州依图医疗技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。