医学数据的处理方法、装置及存储介质制造方法及图纸

技术编号:28321593 阅读:25 留言:0更新日期:2021-05-04 13:02
本公开涉及医学数据的处理方法、医学数据的处理装置及计算机可读存储介质,其中处理方法包括:获取原始医学数据;提取所述原始医学数据所包含的医学用词;当所述原始医学数据所包含的医学用词被指定为共用词的情况下,按顺序依次解析该医学用词与其他用词的关联关系,直至有其他用词与该医学用词不存在关联关系;将存在关联关系的该医学用词和其他用词作为独立的目标用词。处理装置包括:获取单元;提取模块;解析模块;生成模块。通过本公开的各实施例能够准确地实现对医学数据进行标准化处理,从而得到医学含义精准的医学数据。

【技术实现步骤摘要】
医学数据的处理方法、装置及存储介质
本公开涉及医学数据智能处理
,具体涉及一种医学数据的处理方法、医学数据的处理装置及计算机可读存储介质。
技术介绍
在基于包含医学数据的诸如病历、报告的数据分析过程中,在书写或者生成医学报告、病历时,出于书写方便考虑,存在一些简写,这些简写中往往就是由一些共用词而引发的。由于医学术语存在专业性,一般人难以理解包含共用词的准确含义。各种实际场景下的医疗数据存在各种数据问题,直接用关键词匹配的方法去识别医疗文本中医学术语的效果差,不能准确得出上述情况下准确的数据处理结果。
技术实现思路
本公开意图提供一种医学数据的处理方法、医学数据的处理装置及计算机可读存储介质,能够准确地实现对医学数据进行标准化处理,从而得到医学含义精准的医学数据。根据本公开的方案之一,提供一种医学数据的处理方法,包括:获取原始医学数据;提取所述原始医学数据所包含的医学用词;当所述原始医学数据所包含的医学用词存在于预设的共用词库的情况下,按顺序依次解析该医学用词与其他用词的关联关系,直至有其他用词与该医学用词不存在关联关系;将存在关联关系的该医学用词和其他用词作为独立的目标用词。在一些实施例中,其中,所述按顺序,包括:按位置相对于该医学用词由近至远的顺序。在一些实施例中,其中,所述按位置相对于该医学用词由近至远的顺序,包括:按照该医学用词在原始医学数据中其所处语句中向前的方向;和/或按照该医学用词在原始医学数据中其所处语句中向后的方向。在一些实施例中,其中,关联关系的解析方式,包括:将该医学用词和其他用词组合;对照标准医学信息表,如果组合后的用词包含于所述标准医学信息表中,则认为存在关联关系。在一些实施例中,其中,所述原始医学数据所包含的医学用词被指定为共用词,包括:该医学用词存在于预设的共用词库;所述预设的共用词库,构建方式包括:标注基础共用词,建立共用词库;通过预训练的深度学习模型维护共用词库。在一些实施例中,其中,判断原始医学数据所包含的医学用词是否存在于预设的共用词库的方式,包括:解析原始医学数据所包含的医学用词与所述共用词库中每一个共用词的匹配度;在匹配度大于预设条件的情况下,判断为原始医学数据所包含的医学用词存在于预设的共用词库。根据本公开的方案之一,提供医学数据的处理装置,包括:获取单元,其配置为用于获取原始医学数据;提取模块,其配置为用于提取所述原始医学数据所包含的医学用词;解析模块,其配置为用于当所述原始医学数据所包含的医学用词存在于预设的共用词库的情况下,按顺序依次解析该医学用词与其他用词的关联关系,直至有其他用词与该医学用词不存在关联关系;生成模块,其配置为用于将存在关联关系的该医学用词和其他用词作为独立的目标用词。在一些实施例中,其中,所述解析模块,进一步配置为用于:将该医学用词和其他用词组合;对照标准医学信息表,如果组合后的用词包含于所述标准医学信息表中,则认为存在关联关系。在一些实施例中,其中,所述解析模块,进一步配置为用于:解析原始医学数据所包含的医学用词与所述共用词库中每一个共用词的匹配度;在匹配度大于预设条件的情况下,判断为原始医学数据所包含的医学用词存在于预设的共用词库。根据本公开的方案之一,提供计算机可读存储介质,其上存储有计算机可执行指令,所述计算机可执行指令由处理器执行时,实现:根据上述的医学数据的处理方法。本公开的各种实施例的医学数据的处理方法、医学数据的处理装置及计算机可读存储介质,通过获取原始医学数据;提取所述原始医学数据所包含的医学用词;当所述原始医学数据所包含的医学用词存在于预设的共用词库的情况下,按顺序依次解析该医学用词与其他用词的关联关系,直至有其他用词与该医学用词不存在关联关系;将存在关联关系的该医学用词和其他用词作为独立的目标用词,从而针对包含各种医学信息、医学用词、医学标注等词汇实体内容的原始医学数据进行词汇实体的提取,在提取的词汇实体属于一些共用词的情况下,解析该词汇实体所包含的医学含义与前后用词之间的关联关系,目的之一在于根据解析出的关联关系,对原始医学数据进行处理,并通过输出整理后的医学用词实现准确描述原始医学数据中所需要表达的真实、完整的医学含义。通过各实施例的实现方式,本公开至少在于能够提出一种可以在指定的医学术语库下,适配不同的文本阅读理解规则,实现医学文本中医学术语识别、分析的方法、装置,在实际应用场景中,针对诸如手术病历数据、诊断报告数据等处理中,本公开各实施例通过包括算法在内的实现效果准召率可以达到97%以上,每条数据的处理速度约为2毫秒,极大提升了医学诊治以及医学研究的准确性、可靠性和高效性。应当理解,前面的大体描述以及后续的详细描述只是示例性的和说明性的,并非对所要求保护的本公开的限制。附图说明在未必按照比例绘制的附图中,不同视图中相似的附图标记可以表示相似的构件。具有字母后缀的相似附图标记或具有不同字母后缀的相似附图标记可以表示相似构件的不同实例。附图通常作为示例而非限制地图示各种实施例,并且与说明书和权利要求书一起用于解释所公开的实施例。图1示出本公开实施例涉及的医学数据的处理方法的一种流程图;图2示出本公开实施例涉及的医学数据的处理装置的一种架构图。具体实施方式为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。除非另外定义,本公开使用的技术术语或者科学术语应当为本公开所属领域内具有一般技能的人士所理解的通常意义。“包括”或者“包含”等类似的词语意指出现该词前面的元件或者物件涵盖出现在该词后面列举的元件或者物件及其等同,而不排除其他元件或者物件。为了保持本公开实施例的以下说明清楚且简明,本公开省略了已知功能和已知部件的详细说明。本公开涉及医学数据的处理方法,用于针对原始医学数据中所描述的医学含义的准确表达和输出,以得出医学数据精准的分析结果。在基于包含医学数据的诸如病历、报告的数据分析过程中,由于医生在书写医学报告、病历时,书写和记录习惯方式不统一,在书写或者生成医学报告、病历时,出于书写方便考虑,存在一些简写,这些简写中往往就是由一些共用词而引发的。如大小便是大便和小便的一种简写,其中“便”就是一个共用词,需要同时结合前后文中可能出现的“大”或者“小”进行语义上的组合,构成“大便”和“小便”两个能够判断准确以及详细含义用词。通过这个简单示例,可以知道实际临床数据分析和判读场景中,医学术语专业性非常强,一般人难以理解包含共本文档来自技高网...

【技术保护点】
1.医学数据的处理方法,包括:/n获取原始医学数据;/n提取所述原始医学数据所包含的医学用词;/n当所述原始医学数据所包含的医学用词被指定为共用词的情况下,按顺序依次解析该医学用词与其他用词的关联关系,直至有其他用词与该医学用词不存在关联关系;/n将存在关联关系的该医学用词和其他用词作为独立的目标用词。/n

【技术特征摘要】
1.医学数据的处理方法,包括:
获取原始医学数据;
提取所述原始医学数据所包含的医学用词;
当所述原始医学数据所包含的医学用词被指定为共用词的情况下,按顺序依次解析该医学用词与其他用词的关联关系,直至有其他用词与该医学用词不存在关联关系;
将存在关联关系的该医学用词和其他用词作为独立的目标用词。


2.根据权利要求1所述的方法,其中,所述按顺序,包括:
按位置相对于该医学用词由近至远的顺序。


3.根据权利要求2所述的方法,其中,所述按位置相对于该医学用词由近至远的顺序,包括:
按照该医学用词在原始医学数据中其所处语句中向前的方向;和/或
按照该医学用词在原始医学数据中其所处语句中向后的方向。


4.根据权利要求3所述的方法,其中,关联关系的解析方式,包括:
将该医学用词和其他用词组合;
对照标准医学信息表,如果组合后的用词包含于所述标准医学信息表中,则认为存在关联关系。


5.根据权利要求1所述的方法,其中,所述原始医学数据所包含的医学用词被指定为共用词,包括:该医学用词存在于预设的共用词库;
所述预设的共用词库,构建方式包括:
标注基础共用词,建立共用词库;
通过预训练的深度学习模型维护共用词库。


6.根据权利要求1至5中任一项所述的方法,其中,判断原始医学数据所包含的医学用词是否存在于预设的共用词...

【专利技术属性】
技术研发人员:郑永升周世正梁平
申请(专利权)人:杭州依图医疗技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1