【技术实现步骤摘要】
基于住院病案首页的肿瘤登记随访数据处理方法及系统
本专利技术涉及医疗信息处理
,具体涉及一种基于住院病案首页的肿瘤登记随访数据处理方法及系统。
技术介绍
肿瘤登记是国际公认的关于人群肿瘤发病信息收集的标准方法,目的是了解人群中恶性肿瘤的发病、死亡和生存状况,为肿瘤病因研究提供依据。传统的肿瘤登记随访主要由人工登记,然后基于行政区域逐级上报。人工登记方式受登记人员主观因素影响导致误差大,漏报高且效率低。随着计算机技术的发展,有人提出了基于计算机实现的登记系统,例如公开号为CN109243551A的中国专利技术专利申请提出了一种肿瘤登记随访网络直报系统,各登记处可将其汇总的数据直接上报系统,系统再将所有登记处上报的数据进行汇总。虽然该系统也会对重卡数据进行筛选,但是也仅仅是筛选重卡数据,而对于同一患者持有同一张卡也可能登记多条数据,且各登记处也是基于人工汇总方式获得数据,因此该方方案依然存在数据冗余或重复的情况,继而会导致依据肿瘤登记数据进行例如发病率计算等分析的结果不准确。
技术实现思路
为了改善现有技术中存在的肿瘤登记随访数据中存在着大量重复冗余数据的技术问题,提供一种基于住院病案首页的肿瘤登记随访数据处理方法及系统,可以消除重复或冗余的数据,以提高肿瘤登记随访数据的准确性,继而为后续数据分析提供更可靠的数据支持,例如提高发病率分析的准确性。为实现上述目的,本专利技术采用的技术方案如下:一方面,本专利技术实施例提供了一种基于住院病案首页的肿瘤登记随访数据处理方法,包括以下步骤 ...
【技术保护点】
1.一种基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,包括以下步骤:/n获得肿瘤患者的住院病案首页文本;/n从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;/n当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。/n
【技术特征摘要】
1.一种基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,包括以下步骤:
获得肿瘤患者的住院病案首页文本;
从所述住院病案首页文本中提取出肿瘤信息,所述肿瘤信息包括肿瘤诊断编码;
当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息。
2.根据权利要求1所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,所述肿瘤信息还包括确诊时间;所述当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留其中一条或两条肿瘤信息的步骤,包括:当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息。
3.根据权利要求2所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,所述当所述肿瘤信息为多条,且肿瘤诊断编码重复或冗余时,仅保留确诊时间最早的一条或两条肿瘤信息的步骤,包括:
判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息;
判断多条肿瘤信息中的肿瘤诊断编码中是否仅包含C77-C79、C76、C80、C96、D32-D33、D42-D43、D45-D47、D00-D09、Z51.0、Z51.1中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否冗余,如果冗余则仅保留肿瘤诊断编码优先级最高的一条或两条肿瘤信息,其中,优先级由高到低的排序为:C76、C80、C96>Z51.0、Z51.1>C77-C79>D00-D09,D32-D33、D42-D43、D45-D47独立为一级。
4.根据权利要求3所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,所述判断多条肿瘤信息中的肿瘤诊断编码中是否包含C00-C75或者C81-C95中的任一种或多种,如果是,则判断多条肿瘤信息中的肿瘤诊断编码是否重复,如果重复,则仅保留确诊时间最早的一条肿瘤信息的步骤,包括:
将同一肿瘤患者的多条肿瘤信息按照确诊时间进行排序;
按照时间先后依次遍历,针对于肿瘤诊断编码为C00-C75或者C81-C95中的任一种的肿瘤信息,若当前肿瘤信息中的肿瘤诊断编码首次出现,则保留该条肿瘤信息;若当前肿瘤信息中的肿瘤诊断编码非首次出现,则剔除该条肿瘤信息。
5.根据权利要求4所述的基于住院病案首页的肿瘤登记随访数据处理方法,其特征在于,若多条肿瘤信息中包含C82-C85中的任一种或多种肿瘤诊断编码时,则只保留该多条肿瘤信息中确诊时间最早的一条肿瘤信息。
6.根据权利要求3所述的基于住院...
【专利技术属性】
技术研发人员:刘潇霞,乔良,张文彬,
申请(专利权)人:四川省肿瘤医院,
类型:发明
国别省市:四川;51
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。