病人数据挖掘制造技术

技术编号:2865828 阅读:212 留言:0更新日期:2012-04-11 18:40
本发明专利技术为挖掘高质量结构化的临床信息提供了一种数据挖掘框架。该数据挖掘框架包括数据挖掘器(350),它根据知识库(330)中包含的领域专用的知识从计算机化的病人记录(CPR)(310)挖掘医疗信息。数据挖掘器(350)包括用于从CPR提取信息的部件,随时间以有原则的方式组合所有可用证据的部件(354),以及从这个组合过程做出推理的部件(356)。所挖掘的医疗信息被存储在结构化的CPR(380)中,该CPR可以是一个数据仓库。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及数据挖掘,更具体而言,涉及用于从病人医疗记录挖掘高质量结构化的临床信息。
技术介绍
卫生保健提供者累积了大量的临床信息的存储。然而,挖掘临床信息的努力已经证明并不成功。一般而言,数据挖掘是一个确定在数据信息中心库里存储的数据中的有用模式或关系的过程。通常,数据挖掘涉及分析非常大量的信息来发现隐藏在数据中的趋势。由卫生保健组织维护的临床信息通常是非结构化的。因此,难以用常规方法进行挖掘。此外,因为临床信息被收集是用来治疗病人的,而不是(例如)用于临床试验的,它可能包含遗漏的、错误的和不一致的数据。通常关键结果和变量都完全没有记录下来。尽管很多卫生保健提供者以相对结构化的格式维护计帐信息,这种信息受限于保险公司的需求。也就是说,计帐信息通常只捕获需要用来处理医疗索赔的信息,并且更重要地反映病人的“记帐视图”,即对最大偿还的帐单编码。结果是,从临床角度来看计帐信息通常包含不准确的和遗漏的数据。此外,研究表明记帐代码在比例惊人(通常为10%到20%)的病人中是不正确的。假定挖掘临床信息能够导致很难甚至不可能达到的境界,就希望提供用于挖掘高质量结构化的临床信息的技术,并且提供这样的技术将是非常有利的。
技术实现思路
本专利技术提供了一种数据挖掘框架,用于挖掘高质量结构化的临床信息。在本专利技术的各个实施例中,提供了一种系统和方法,用于从病人记录挖掘信息。多个数据源被访问。至少一些数据源可能是非结构化的。系统包括一个领域知识库,该领域知识库包含用于挖掘数据源的领域专用标准。一个数据挖掘器被配置为使用领域专用标准来挖掘数据源,以创建结构化的临床信息。优选地,该数据挖掘器包括提取部件,用于从数据源提供信息以创建一组概率断言;组合部件,用于组合所述组概率断言以创建一个或多个统一标准的概率断言;以及推理部件,用于从一个或多个统一标准的概率断言推理病人状态。该提取部件可以使用领域专用标准来从数据源提取信息。同样,该组合部件可以使用领域专用标准来组合概率断言,该推理部件可以使用领域专用标准来推理病人状态。病人状态仅仅是人们可能关心的、与病人有关的变量的集合,例如,病情和诊断。该提取部件可以被配置为从自由文本治疗记录中提取关键短语。其它自然语言处理/自然语言理解方法也可以用来代替短语提取或与其一起使用,以便从自由文本中提取信息。数据源可以包括医疗信息、财务信息和人口统计信息中的一个或多个。医疗信息可以包括自由文本信息、医疗图像信息、实验室信息、处方药信息和波形信息中的一个或多个。概率值可以被指派给概率断言。结构化的临床信息可能包括涉及所存储的信息的概率信息。结构化的临床信息可以存储在数据仓库中。结构化的临床信息可能包括纠正过的信息,包括纠正过的ICD-9诊断代码。(国际疾病分类法,第9次修订,临床修订(ICD-9-CM)是基于世界卫生组织的第9次修订,国际疾病分类法(ICD-9)。ICD-9-CM是向与美国的医院医疗服务相关的诊断和手续指派代码的官方系统。最近已经发布了第10次修订(ICD-10),它与第9次修订(ICD-9)有所不同;希望能够很快实施)该系统可以按任意间隔、周期间隔或在线模式下来运行。在按间隔运行时,当系统被运行时,数据源被挖掘。在在线模式下,数据源可以被连续不断地被挖掘。用于挖掘数据源的领域专用标准可以包括机构专用领域知识。例如,这可能包括与在特定医院可以得到的数据、医院的文档结构、医院的政策、医院的方针以及医院的任意变化有关的信息。领域专用标准还可以包括疾病专用的领域知识。例如,疾病专用的领域知识可以包括影响疾病危险的各种因素、疾病进展信息、并发症信息、与疾病有关的结果和变量、与疾病有关的措施以及由医疗实体建立的方针和政策。此外,信息中心库接口可以用来访问数据挖掘器所用的数据源中包含的信息的至少一些。这个信息中心库接口可以是一个可配置的数据接口。该可配置的数据接口可以根据正在研究哪家医院而变化。数据源可以包括结构化的和非结构化的信息。结构化的信息可以在适当的地方被转换成标准化的单元。非结构化的信息可以包括ASCII文本串、DICOM(医学数字成像和通信)格式的图像信息、以及基于领域知识而划分的文本文档。在本专利技术的多种实施例中,可以使用因特网来运行数据挖掘器。所创建的结构化临床信息也可以用因特网访问。在本专利技术的多种实施例中,可以把数据挖掘器作为一个服务而运行。例如,几家医院可以参与这个服务以挖掘它们的病人信息,并且这个信息可以存储在由服务提供商维护的数据仓库中。该服务也可以由第三方服务提供商(即,与医院无关的实体)来执行。本专利技术的这些和其它方面、特征和优势从下面结合附图对优选实施例的详细描述中可以清楚地看到。附图说明图1是一个计算机处理系统的框图,根据本专利技术的一种实施例可以将本专利技术应用于它。图2展示了示例性的计算机化的病人记录(CPR);并且图3展示了用于挖掘高质量结构化的临床信息的示例性数据挖掘框架。具体实施例方式为了辅助对本专利技术的清晰理解,这里提供了一些说明性实例,它们描述了本专利技术的确定方面。但是,应该理解这些说明并不是为了限制本专利技术的范围,而是为了描述与本专利技术相关的确定概念。还应该理解本专利技术可以用多种形式的硬件、软件、固件、专用处理器或它们的组合来实现。优选地,本专利技术在软件中被实现为确实包括在程序存储设备上的程序。程序可被上载到包含任意合适的体系结构的机器上并由其执行。优选地,该机器被实现在拥有下列硬件的计算机平台上例如一个或多个中央处理单元(CPU)、一个随机访问存储器(RAM)和输入/输出(I/O)接口。该计算机平台还包括操作系统和微指令代码。这里所描述的多个进程和函数可以是通过操作系统执行的微指令代码的一部分或者程序的一部分(或者是它们的组合)。另外,多种其它外围设备可以被连接到该计算机平台,诸如附加数据存储设备和打印设备。应该理解,因为附图中所描绘的组成系统部件或和方法步骤中的一些优选地以软件实现,系统部件(或过程步骤)之间的实际连接随着本专利技术的规划方式会有所不同。图1是计算机处理系统100的框图,依照本专利技术的一种实施例可以将本专利技术应用于它。系统100包括至少一个处理器(下文称处理器)102,它通过系统总线104和其它部件可操作地相耦合。只读存储器(ROM)106,随机访问存储器(RAM)108、I/O接口110、网络接口112和外部存储器114都与系统总线104可操作地相耦合。各种外围设备,例如显示设备、盘式存储设备(例如,磁盘或光盘存储设备)、键盘和鼠标,可以通过I/O接口110或网络接口112与系统总线104可操作地相耦合。计算机系统100可以是独立系统或通过网络接口112与网络相连。网络接口112可以是硬布线接口。然而,在多种示例性实施例中,网络接口112可以包括适于向另一设备传送信息或从另一设备传出信息的任意设备,诸如通用异步收发器(UART)、并行数字接口、软件接口或已知或后来开发的软件和硬件的任意组合。网络接口可以连接到不同类型的网络,包括局域网(LAN)、广域网(WAN)、内联网、虚拟专用网(VPN)和因特网。外部存储器114可以用由处理器102所管理的数据库管理系统(DBMS)来实现,并驻留在像硬盘这样的存储器上。但是,应该意识到外部存储器114可以实现在一个本文档来自技高网...

【技术保护点】
一种从病人记录产生结构化的临床信息的系统,包括:多个包含病人信息的数据源,至少有一些病人信息是非结构化的;一个包含用于挖掘数据源的领域专用标准的领域知识库;和一个数据挖掘器,用于使用领域专用标准从数据源提取临床信息以 创建结构化的临床信息。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:RB劳S桑迪尔亚C阿米斯RS尼库莱斯库AK格尔TR瓦里克
申请(专利权)人:美国西门子医疗解决公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1