一种肿瘤登记自动编码系统技术方案

技术编号:26175409 阅读:33 留言:0更新日期:2020-10-31 14:08
本发明专利技术涉及公共卫生信息技术领域,尤其涉及一种肿瘤登记自动编码系统。本发明专利技术的有益效果是:通用性:本发明专利技术在于建立一套适用于肿瘤登记管理信息业务需求的肿瘤登记自动编码系统。本发明专利技术编码结果对象是参照世界卫生组织ICD‑10、ICCC和ICD‑O‑3编码标准体系构建,同时符合国际癌症研究中心(International Agency for Research on Cancer,IARC)对肿瘤登记工作的要求标准,具有标准化和通用性。本发明专利技术可以用于个人电脑桌面程序开发,也可以用于大型数据管理系统的开发,将大大提高相关信息系统开发、医院肿瘤病例数据计算机自动交换水平。

【技术实现步骤摘要】
一种肿瘤登记自动编码系统
本专利技术涉及公共卫生信息
,尤其涉及一种肿瘤登记自动编码系统。
技术介绍
伴随着工业化、城镇化和人口老龄化的进程加快,加之慢性感染、不健康生活方式的广泛流行和环境污染、职业暴露等因素的逐渐累积,我国恶性肿瘤发病率和死亡率呈现逐年上升趋势。大量研究显示,我国居民全死因顺位中,恶性肿瘤为仅次于心脑血管疾病的第二位死亡原因。以肝癌、胃癌、食管癌为主的发展中国家癌谱和以肺癌、乳腺癌、结直肠癌为主的发达国家癌谱将在我国并存。我国癌症所导致的疾病负担和经济负担不断攀升,已成为我国劳动力人口损失和居民因病致贫返贫的重要原因,癌症成为威胁民众健康和生命质量的重大公共卫生问题。肿瘤登记是系统性、经常性收集有关肿瘤及肿瘤病人信息的统计制度,是癌症防治工作的基础。肿瘤登记的目的是监测人群癌症负担以及发展趋势,为病因学研究提供原始资料,有效评价癌症防治措施的效果,为制定癌症防控策略提供依据。为此国家制定了《肿瘤登记管理办法》,以保障肿瘤登记工作的顺利开展,其中特别强调了肿瘤编码和质量控制。肿瘤登记除了收集患者疾病信息之外,最重要的是收集肿瘤各项诊断信息包括解剖学部位、形态学、行为学、性别及分化程度等关键信息,同时按照国际标准进行编码,包括ICD-10编码、ICD-O-3编码以及ICCC编码。由于肿瘤原始分类信息繁杂(解剖学大类70种、解剖学细类331种、形态学553种、行为学4种、性别2种、分化程度9种),基于原始分类信息的编码成为海量组合,记忆困难,即便是具有长期病案编码经验的人员也需要借助编码工具书字典进行查询,迫切需要计算机自动编码技术解决此问题,提高工作效率。国际癌症研究中心(InternationalAgencyforResearchonCancer,IARC)开发了用于肿瘤登记的软件CanReg4和CanReg5,并实现了汉化,可以完成肿瘤个案数据的逐条录入和编码生成。由于肿瘤登记自动编码技术一直不被我国所掌握,目前全国肿瘤登记的编码生成、编码校对和验证一直依赖该软件进行,但不能完成批处理或嵌入医院信息系统,基于医院病案系统的肿瘤登记大数据批量自动编码处理存在短板,医院病案人员、肿瘤登记信息录入和管理编码水平不一、编码标准也难以整齐划一,全国肿瘤登记的全人群覆盖工作也面临该技术瓶颈。肿瘤登记自动编码技术作为肿瘤登记系统的基础,是肿瘤管理信息化建设必须解决的关键性技术问题之一,是肿瘤管理信息标准化、规范化进程的基础性工作。国外对肿瘤登记自动编码的工作也十分重视,分别投入大量资金研究相关的编码与标准工作。但因国情不同,国外的工作成果无法直接在中国应用。国内虽然已有一些对疾病的编码标准,但因这些标准所面对的对象仅仅基于世界卫生组织公布的ICD-10编码、ICD-O-3编码以及ICCC编码等结果类编码,国内用于生成这些结果编码的自动化过程编码技术尚未见报道,编码自动化的瓶颈一直制约相关信息系统的研发。
技术实现思路
本专利技术所要解决的技术问题是克服现有技术中存在的不足,提供一种肿瘤登记自动编码系统,建立一套适用于肿瘤登记管理信息业务需求的肿瘤登记自动编码系统,编码的制定具有标准化、系统性、适用性、稳定性、统一性,便于计算机生成等特性。本专利技术是通过以下技术方案予以实现:一种肿瘤登记自动编码系统,包括肿瘤诊断信息采集模块、肿瘤诊断信息层次确定模块、肿瘤登记编码计算生成模块和肿瘤诊断信息验算纠错模块;肿瘤诊断信息分类采集模块将肿瘤原始非结构化文本诊断,形成结构化诊断信息,包括肿瘤的解剖学大类、解剖学细类、形态学、行为学、性别及分化程度变量;肿瘤诊断信息层次确定模块将肿瘤结构化诊断信息按照各变量分类标准进行分类编码,具体标准为:解剖学大类70种、解剖学细类331种、形态学553种、行为学4种、性别2种、分化程度9种;肿瘤登记编码计算生成模块根据一定编码规则计算生成各变量编码矩阵组合,同存储于数据库的编码字典进行匹配,自动生成肿瘤登记编码,其中包括疾病和有关健康问题的国际统计分类第十版编码,儿童肿瘤国际分类编码以及国际疾病分类肿瘤学专辑第三版编码;肿瘤诊断信息验算纠错模块对肿瘤诊断信息和编码进行验算纠错,对肿瘤诊断原始变量给出修改及完善提示,包括零概率编码事件错误提示与小概率编码事件处理两个过程,小概率编码事件处理过程包括建立小概率编码事件规则和小概率编码事件错误修改两个步骤。根据上述技术方案,优选地,所述肿瘤诊断信息层次确定模块中:(1)解剖学大类编码为二位阿拉伯数字,共70种;(2)解剖学细类编码为三位阿拉伯数字,共331种;(3)形态学编码为四位阿拉伯数字共,553种;(4)行为学编码为一位阿拉伯数字,共4种;(5)性别编码为1位阿拉伯数字,共2种;(6)分化程度编码为1位阿拉伯数字,共9种。根据上述技术方案,优选地,所述肿瘤登记编码计算生成模块中,各变量编码矩阵组合包括:(1)依次为解剖学细类编码、形态学编码和行为学编码,为八位阿拉伯数字,共563749种组合,对应男女非特异性肿瘤ICD-10编码字典;(2)依次为解剖学细类编码、形态学编码、行为学编码和性别编码,为九位阿拉伯数字,共636种组合,对应男女特异性肿瘤ICD-10编码字典;(3)依次为解剖学细类编码和形态学编码,为七位阿拉伯数字,共253215种组合,对应儿童肿瘤ICCC编码字典。根据上述技术方案,优选地,所述肿瘤登记编码计算生成模块中,当各变量编码矩阵组合同时符合权利要求3所述的三类编码字典对应后,自动生成该病例的ICD-10、ICCC和ICD-O-3编码,其中ICD-O-3编码,为解剖学细类编码(以C开头,含有小数点的五位数码)/形态学编码(四位阿拉伯数字)/行为学编码(一位阿拉伯数字)/分化程度编码(一位阿拉伯数字)的十一位组合编码。根据上述技术方案,优选地,所述肿瘤诊断信息验算纠错模块中的零概率编码事件错误提示为:各变量编码矩阵组合未能满足权利3中所述的编码字典对应,为不可能发生的编码组合,即在解剖学细类编码、形态学编码、行为学编码、性别编码选择中存在至少一项错误,该错误编码组合将不能被系统接受,并提示肿瘤登记医务人员进行修改订正,直至满足上述条件后方可保存记录。根据上述技术方案,优选地,所述肿瘤诊断信息验算纠错模块中的小概率编码事件规则为:各变量编码矩阵组合虽然能够满足所述的编码字典对应,但所对应生成的ICD-10、ICCC编码极为少见,为罕见编码,不排除存在小概率错误的可能,包括年龄与形态学、年龄与解剖学大类、年龄与解剖学大类及形态学、性别与形态学、性别与解剖学大类、解剖学大类与行为学,共25种小概率编码事件规则。根据上述技术方案,优选地,所述肿瘤诊断信息验算纠错模块中的小概率编码事件错误修改过程为所述小概率编码事件规则,通过计算机查询语句自动筛选出的错误记录,供肿瘤登记医务人员核实确认或订正。根据上述技术方案,优选地,所述三类肿瘤自动编码对应本文档来自技高网
...

【技术保护点】
1.一种肿瘤登记自动编码系统,其特征在于:包括肿瘤诊断信息采集模块、肿瘤诊断信息层次确定模块、肿瘤登记编码计算生成模块和肿瘤诊断信息验算纠错模块;/n肿瘤诊断信息分类采集模块将肿瘤原始非结构化文本诊断,形成结构化诊断信息,包括肿瘤的解剖学大类、解剖学细类、形态学、行为学、性别及分化程度变量;/n肿瘤诊断信息层次确定模块将肿瘤结构化诊断信息按照各变量分类标准进行分类编码,具体标准为:解剖学大类70种、解剖学细类331种、形态学553种、行为学4种、性别2种、分化程度9种;/n肿瘤登记编码计算生成模块根据一定编码规则计算生成各变量编码矩阵组合,同存储于数据库的编码字典进行匹配,自动生成肿瘤登记编码,其中包括疾病和有关健康问题的国际统计分类第十版编码,儿童肿瘤国际分类编码以及国际疾病分类肿瘤学专辑第三版编码;/n肿瘤诊断信息验算纠错模块对肿瘤诊断信息和编码进行验算纠错,对肿瘤诊断原始变量给出修改及完善提示,包括零概率编码事件错误提示与小概率编码事件处理两个过程,小概率编码事件处理过程包括建立小概率编码事件规则和小概率编码事件错误修改两个步骤。/n

【技术特征摘要】
1.一种肿瘤登记自动编码系统,其特征在于:包括肿瘤诊断信息采集模块、肿瘤诊断信息层次确定模块、肿瘤登记编码计算生成模块和肿瘤诊断信息验算纠错模块;
肿瘤诊断信息分类采集模块将肿瘤原始非结构化文本诊断,形成结构化诊断信息,包括肿瘤的解剖学大类、解剖学细类、形态学、行为学、性别及分化程度变量;
肿瘤诊断信息层次确定模块将肿瘤结构化诊断信息按照各变量分类标准进行分类编码,具体标准为:解剖学大类70种、解剖学细类331种、形态学553种、行为学4种、性别2种、分化程度9种;
肿瘤登记编码计算生成模块根据一定编码规则计算生成各变量编码矩阵组合,同存储于数据库的编码字典进行匹配,自动生成肿瘤登记编码,其中包括疾病和有关健康问题的国际统计分类第十版编码,儿童肿瘤国际分类编码以及国际疾病分类肿瘤学专辑第三版编码;
肿瘤诊断信息验算纠错模块对肿瘤诊断信息和编码进行验算纠错,对肿瘤诊断原始变量给出修改及完善提示,包括零概率编码事件错误提示与小概率编码事件处理两个过程,小概率编码事件处理过程包括建立小概率编码事件规则和小概率编码事件错误修改两个步骤。


2.根据权利要求1所述的一种肿瘤登记自动编码系统,其特征在于:所述肿瘤诊断信息层次确定模块中:
(1)解剖学大类编码为二位阿拉伯数字,共70种;
(2)解剖学细类编码为三位阿拉伯数字,共331种;
(3)形态学编码为四位阿拉伯数字共,553种;
(4)行为学编码为一位阿拉伯数字,共4种;
(5)性别编码为1位阿拉伯数字,共2种;
(6)分化程度编码为1位阿拉伯数字,共9种。


3.根据权利要求1所述的一种肿瘤登记自动编码系统,其特征在于:所述肿瘤登记编码计算生成模块中,各变量编码矩阵组合包括:
(1)依次为解剖学细类编码、形态学编码和行为学编码,为八位阿拉伯数字,共563749种组合,对应男女非特异性肿瘤ICD-10编码字典;
(2)依次为解剖学细类编码、形态学编码、行为学编码和性别编码,为九位阿拉伯数字,共636种组合,对应男女特异性肿瘤ICD-10编码字典;
(3)依次为解剖学细类编码和形态学编码,为七位阿拉伯...

【专利技术属性】
技术研发人员:王德征
申请(专利权)人:天津市疾病预防控制中心
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1