基于住院病案首页的肿瘤登记随访数据处理方法及系统技术方案

技术编号:27774410 阅读:51 留言:0更新日期:2021-03-23 13:05
本发明专利技术公开了一种基于住院病案首页的肿瘤登记随访数据处理方法及系统,该方法包括步骤:获得肿瘤患者的住院病案首页文本;从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。通过本发明专利技术,不仅可以完善记录肿瘤登记随访数据,而且可以从重复多余的信息中抽取出有效数据,避免重复冗余数据对后期例如发病率分析的影响,继而提高分析结果的准确性。

【技术实现步骤摘要】
基于住院病案首页的肿瘤登记随访数据处理方法及系统
本专利技术涉及医疗信息处理
,具体涉及一种基于住院病案首页的肿瘤登记随访数据处理方法及系统。
技术介绍
肿瘤登记是国际公认的关于人群肿瘤发病信息收集的标准方法,目的是了解人群中恶性肿瘤的发病、死亡和生存状况,为肿瘤病因研究提供依据。传统的肿瘤登记随访主要由人工登记,然后基于行政区域逐级上报。人工登记方式受登记人员主观因素影响导致误差大,漏报高且效率低。随着计算机技术的发展,有人提出了基于计算机实现的登记系统,例如公开号为CN109243551A的中国专利技术专利申请提出了一种肿瘤登记随访网络直报系统,各登记处可将其汇总的数据直接上报系统,系统再将所有登记处上报的数据进行汇总。虽然该系统也会对重卡数据进行筛选,但是也仅仅是筛选重卡数据,而对于同一患者持有同一张卡也可能登记多条数据,且各登记处也是基于人工汇总方式获得数据,因此该方方案依然存在数据冗余或重复的情况,继而会导致依据肿瘤登记数据进行例如发病率计算等分析的结果不准确。
技术实现思路
为了改善现有技术中存在的肿瘤登记随访数据中存在着大量重复冗余数据的技术问题,提供一种基于住院病案首页的肿瘤登记随访数据处理方法及系统,可以消除重复或冗余的数据,以提高肿瘤登记随访数据的准确性,继而为后续数据分析提供更可靠的数据支持,例如提高发病率分析的准确性。为实现上述目的,本专利技术采用的技术方案如下:一方面,本专利技术实施例提供了一种基于住院病案首页的肿瘤登记随访数据处理方法,包括以下步骤:获得肿瘤患者的住院病案首页文本文本;从所述住院病案首页文本文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。上述方案从单一肿瘤患者的角度而言的,针对于同一患者,先提取住院病案首页文本,然后再对住院病案首页文本中的信息进行分析。肿瘤的确诊都需要通过医院进行,确诊的过程中也需要住院,继而会产生住院病案,住院病案都会根据规定记录相关信息,因此病案首页文本中记载的信息的真实性准确性有保障,继而通过提取住院病案首页文本中的字段信息进行分析,避免了人工统计,不仅效率高,而且准确度高,准确度高体现在两方面,一是病案首页文本这个数据来源准确,二是机器处理的客观性更强,可以避免人为错误。数据真实准确,继而基于肿瘤信息进行的例如发病率、死亡率等分析的结果的准确度也被提高。另外,通过对肿瘤诊断编码的分析,继而剔除重复或冗余的肿瘤信息,由于肿瘤诊断编码是病案首页文本中必有的字段信息,且诊断编码有相应的标准,可以保障准确性,因此基于肿瘤诊断编码进行重复冗余分析,可以有效保障本方案的可行性及可靠性。所述肿瘤信息还包括确诊时间;所述当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息的步骤,包括:当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息。确诊时间是肿瘤分析的一项重要参数,也是病案首页文本中的必有字段,记录确诊时间最早的肿瘤信息,更有利于对该种肿瘤的起始时间、发病历史等进行分析。也就是说,可以进行更多的分析,继而扩大肿瘤数据的应用面,还可以解决因时间记录不准确而导致后续肿瘤分析结果不准确的技术问题。所述当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息的步骤,包括:判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息;判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息,其中,优先级由高到低的排序为:C76、C80、C96>Z51.0、Z51.1>C77-C79>D00-D09,D32-D33、D42-D43、D45-D47独立为一级。研究分析,肿瘤的影响很大,在其病变过程中可能会引起很多其他部位的病变,即是说,虽然在不同住院病案中记录着不同的肿瘤诊断编码,但是很可能也是由于原有肿瘤病变引起的。上述方案中,肿瘤诊断编码是采用国际通用的ICD-10编码,通过对肿瘤诊断编码进行分类,即C00-C75、C81-C95为一类,C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1为另一类,针对于不同类别的肿瘤诊断编码进行不同处理,可以进一步消除实际为同一肿瘤导致的其他变异而引起的数据重复,进一步提高肿瘤登记随访数据的准确性。所述判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息的步骤,包括:将同一肿瘤患者的多条肿瘤信息按照确诊时间进行排序;按照时间先后依次遍历,针对于肿瘤诊断编码为C00-C75或者C81-C95中的任一种的肿瘤信息,若当前肿瘤信息中的肿瘤诊断编码首次出现,则保留该条肿瘤信息;若当前肿瘤信息中的肿瘤诊断编码非首次出现,则剔除该条肿瘤信息。若多条肿瘤信息中包含C82-C85中的任一种或多种肿瘤诊断编码时,则只保留该多条肿瘤信息中确诊时间最早的一条肿瘤信息。所述判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息的步骤,包括:所述多条肿瘤信息中,若肿瘤诊断编码仅包含D32-D33、D42-D43、D45-D47中的一种或多种,则仅保留确诊时间最早的一条肿瘤信息;若肿瘤诊断编码仅包含C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种或多种,则仅保留确诊时间最早的一条肿瘤信息;若肿瘤诊断编码中包含D32-D33、D42-D43、D45-D47中的一种或多种,且包含C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种或多种,则保留肿瘤诊断编码为D32-D33、D42-D43、D45-D47中任一种中,确诊时间最早的一条肿瘤信息,以及肿瘤诊断编码为C77-C79、C76、C80、C96、D00-D09、Z51.0、Z51.1中的任一种中,确诊时间最早的一条肿瘤信息。采用以下方式判断肿瘤诊断编码是否重复:若所述肿瘤诊断编码中不包含小数点,则直接根据肿瘤诊断编码中本文档来自技高网...

【技术保护点】
1.一种基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,包括以下步骤:/n获得肿瘤患者的住院病案首页文本;/n从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;/n当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。/n

【技术特征摘要】
1.一种基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,包括以下步骤:
获得肿瘤患者的住院病案首页文本;
从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;
当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。


2.根据权利要求1所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,所述肿瘤信息还包括确诊时间;所述当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息的步骤,包括:当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息。


3.根据权利要求2所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,所述当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息的步骤,包括:
判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息;
判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息,其中,优先级由高到低的排序为:C76、C80、C96>Z51.0、Z51.1>C77-C79>D00-D09,D32-D33、D42-D43、D45-D47独立为一级。


4.根据权利要求3所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,所述判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息的步骤,包括:
将同一肿瘤患者的多条肿瘤信息按照确诊时间进行排序;
按照时间先后依次遍历,针对于肿瘤诊断编码为C00-C75或者C81-C95中的任一种的肿瘤信息,若当前肿瘤信息中的肿瘤诊断编码首次出现,则保留该条肿瘤信息;若当前肿瘤信息中的肿瘤诊断编码非首次出现,则剔除该条肿瘤信息。


5.根据权利要求4所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,若多条肿瘤信息中包含C82-C85中的任一种或多种肿瘤诊断编码时,则只保留该多条肿瘤信息中确诊时间最早的一条肿瘤信息。


6.根据权利要求3所述的基于住院...

【专利技术属性】
技术研发人员:刘潇霞乔良张文彬
申请(专利权)人:四川省肿瘤医院
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1