基于原始手术数据的手术分类编码方法技术

技术编号:24251963 阅读:42 留言:0更新日期:2020-05-22 23:47
本发明专利技术涉及医疗信息化技术领域及人工智能技术领域,尤其涉及一种基于原始手术数据的手术分类编码方法及系统,包括如下步骤:接收原始手术数据;对输入的原始手术数据进行预处理;以国际手术标准分类编码ICD‑9‑CM‑3进行检索,判断;查询入院记录,病程记录和出院记录;使用双向手术数据实体识别模型和神经实体权重关系判别网络,根据预处理后的原始手术数据和获取的病人病历中的信息进行编码,输出编码结果及准确性评估结果。本发明专利技术自动编码相比人力更加高效,快捷,且分类稳定,可实现在短时间内大批量的对原始病历进行编码分类,可以为医疗领域的大数据应用及人工智能快速准备和整理数据。

Operation classification coding method based on original operation data

【技术实现步骤摘要】
基于原始手术数据的手术分类编码方法
本专利技术涉及医疗信息化
及人工智能
,尤其涉及一种基于原始手术数据的手术分类编码方法及系统。
技术介绍
随着国家医疗改革的不断深入,以及医疗布局的全面化。医疗数据信息化大大的限制了医疗改革和医疗服务的全方面的提升。在医疗大数据及人工智能全面发展的时期,医疗数据信息化开始展露端倪,开始对诊疗过程提供辅助决策和提供信息支持等,可以帮助医生提高效率,能够极大的减轻医生的工作。在这医疗信息化的进化史上医疗数据的标准化一直是有待解决,有待提高的一个难题。诊断编码,手术编码,药品编码等分类标准便是医疗数据标准化的重中之重。我们的系统便是针对手术编码,为医院的手术编码提供技术支持(1)医院编码人员对于标准手术编码的理解参差不齐,导致编码结果存在差异。在医院手术编码的编码和分类工作是人工完成的,因为受制于人力少(甚至很多医院并没有编码员),编码人员素质参差不齐,编码人员对标准的解读和对编码字典庞大内容的把握程度参差不齐。所以每天医院中人工对码的数量有限,并且存在一些误判的情况。编码人员的编码粗细程度及判断标准也因人而异,不同医院的数据一块上报、审查、交流时就会非常明显的看到这些问题,甚至同一所医院不同编码人员之间、同一编码人员不同时期,编码结果也存在差异。(2)医生个性化、自定义输入的实际手术与标准手术编码库不完全兼容。由于手术编码库中包含的手术不能完全覆盖医院日常的所有手术,并且对于同一个手术,由于汉语的特殊性,同一疾病概念表述方式的极端多样性且行业内并不存在统一标准医疗术语这种规范,不同的医生使用的手术的名称写法以及结构也不尽相同,五花八门,使用的别名有很大差异;加上标准手术字典的更新需要很长时间(国标ICD9-CM3,上次更新2011),并不能及时覆盖最新出现的手术和其名称;而且这么多年随着技术的更新出现了很多新型的术式,新型的手术辅助器械等等。且对于特定诊断的分型,标准编码的详细程度达不到医生的临床实际要求;又或者医生在书写手术时会附加一些额外详细信息,而标准诊断编码库对于额外信息的带来的区别分类是无法体现的;再者,医生在书写手术时,也会使用一些只有业内熟悉的简写简称或者缩写,而这些也不是标准手术编码库所收录的。从根本上来说,医生是从他们的角度来书写手术,方便今后自己查看,而不是从编码分类的角度来看,很多医生都不了解手术编码中标准手术是什么,而且也不会记,如果强制医生书写标准手术无疑会给医生带来很大的麻烦。上述各种原因导致了在医院实际业务中绝大多数医生在填写手术的时候使用程序选择手术或者由医生自己手写手术,都存在很大的麻烦。(3)各个医院存在标准手术编码标准不统一的情况目前多家医院采用国家标准根据自己医院的需求和意愿修改的版本,修改和重订版本需要投入大量的人力物力。所有很多医院的手术编码版本老套不统一,甚至有的医院并非采用国家标准进行延伸和修订。不利于病人手术数据的统一处理和统一上报。(4)大数据,医疗数据规范化的形势要求,手术编码更加的规范更加的准确。现在医疗信息的不完善、不统一极大的限制了医疗信息平台和医疗信息仓库的搭建。规范,全面的医疗信息平台和医疗信息仓库的搭建。目前的医疗大数据,医疗人工智能,辅助诊疗,医疗动态监测等功能的进一步完善,也需要标准编码工作更加准确,更加规范,编码的数据量也要更加的庞大。
技术实现思路
本专利技术针对上述四个问题,提供了一种基于原始手术数据的手术分类编码方法,根据医生输入手术,结合对病历的解析分词和语义理解,自动对照标准诊断库ICD-9-CM-3进行编码,并评估医生输入手术的正确性。为了实现上述目的,本专利技术采用如下技术方案:一种基于原始手术数据的手术分类编码方法,其特征在于包括如下步骤:(1):接收输入数据:所述输入数据位原始手术数据;(2):对输入的原始手术数据进行预处理,预处理包括:去除标点符号,将异体字转换成正体字,将全角字符转换为半角字符;(3):以步骤(2)得到的预处理结果国际手术标准分类编码ICD-9-CM-3中检索,判断是否得到结果,如果得到结果,则直接输出编码结果;若否,进入步骤(4);(4):根据医生输入的原始手术的的病人的病案号,去查询入院记录,病程记录和出院记录,获取病人的年龄,性别,疾病,以及手术过程描述;(5):使用双向手术数据实体识别模型和神经实体权重关系判别网络,根据预处理后的原始手术数据和获取的病人病历中的信息进行编码,输出编码结果及准确性评估结果;所述的双向手术数据实体识别模型的计算方式为其中p表示概率,D为当前输入的原始的手术文本,L为D所对应的数据标记,d表示D其中一条数据,p(L|D)表示已知原始手术文本的情况下模型输出的金标准数据标记的概率,lj表示对应d中第j个字的数据标记,θ为双向手术数据识别与编码模型所有参数的集合,集合中包括ωk,Bm和fk,gm这两个函数的参数,Z为归一化因子,保证模型输出的结果是介于0到1之间的实数,fk为实体类别转移判别函数,ωk为fk的权值,gm为双向特征映射语言模型,Bm为其对应的权值,模型的训练过程为用0到1之间的均匀分布随机初始化ωk,Bm和fk,gm这两个函数的参数,argmax表示求可以使p(L|D)取值最大的ωk,Bm和fk,gm这两个函数的参数的集合,当使用双向手术数据识别与编码模型进行推断的时候,p(L|D)输出的值大于0.5表示当前的数据属于某个实体类型。具体的g(lj,dj)=P(lj|dj)建模过程为其中,u为第u个可能标记,|u|为总共可能得标记数量,di表示d中第j个字,Θg表示g(lj,dj)的参数的集合,argmax表示求可以使P(lj|dj)最大化的参数的集合;所述的神经实体关系判别网络的计算方式为其中σ是sigmoid函数,F是神经实体权重关系判别网络的输出,h1=g(lj,dj)、h2=g(lj,dj),表示矩阵级联,linear(x)=Φx+bias其中Φ是映射参数,表示偏置截距,u是可学习参数,∈表示属于,为实数空间,l是语言序列长度,h_dim是自定义的隐层的维度,其中η是超参数,经过大量测试训练η为8时,实体权重关系判别更符合编码员的编码方式。在建模过程中要使F和数据标记C的误差最小化,也就是其中ΘF表示神经实体权重关系判别网络的参数的集合,CE表示交叉熵,即|K|为类别数,k为当前类别,γ为数据标记,为模型预测输出;神经实体关系判别网络用于根据双向手术数据实体识别模型识别的各个实体,计算实体权重,最终得出结果结果,输出到交互界面或者指定文件中或数据库中。上述的基于原始手术数据的手术分类编码方法,所述的标准手术名称包含手术术式、手术部位、疾病性质、手术入路、手术的辅助器材、操作方式、手术专有名词。上述的基于原始手术数据的手术分类编码方法,所述的标准手术名称为手术部位和手术术式。有益效果:1.解决了医生原始手本文档来自技高网
...

【技术保护点】
1.一种基于原始手术数据的手术分类编码方法,其特征在于包括如下步骤:/n(1):接收输入数据:所述输入数据位原始手术数据;/n(2):对输入的原始手术数据进行预处理,预处理包括:去除标点符号,将异体字转换成正体字,将全角字符转换为半角字符;/n(3):以步骤(2)得到的预处理结果国际手术标准分类编码ICD-9-CM-3中检索,判断是否得到结果,如果得到结果,则直接输出编码结果;若否,进入步骤(4);/n(4):根据医生输入的原始手术的的病人的病案号,去查询入院记录,病程记录和出院记录,获取病人的年龄,性别,疾病,以及手术过程描述;/n(5):使用双向手术数据实体识别模型和神经实体权重关系判别网络,根据预处理后的原始手术数据和获取的病人病历中的信息进行编码,输出编码结果及准确性评估结果;/n所述的双向手术数据实体识别模型的计算方式为/n

【技术特征摘要】
1.一种基于原始手术数据的手术分类编码方法,其特征在于包括如下步骤:
(1):接收输入数据:所述输入数据位原始手术数据;
(2):对输入的原始手术数据进行预处理,预处理包括:去除标点符号,将异体字转换成正体字,将全角字符转换为半角字符;
(3):以步骤(2)得到的预处理结果国际手术标准分类编码ICD-9-CM-3中检索,判断是否得到结果,如果得到结果,则直接输出编码结果;若否,进入步骤(4);
(4):根据医生输入的原始手术的的病人的病案号,去查询入院记录,病程记录和出院记录,获取病人的年龄,性别,疾病,以及手术过程描述;
(5):使用双向手术数据实体识别模型和神经实体权重关系判别网络,根据预处理后的原始手术数据和获取的病人病历中的信息进行编码,输出编码结果及准确性评估结果;
所述的双向手术数据实体识别模型的计算方式为



其中p表示概率,D为当前输入的原始的手术文本,L为D所对应的数据标记,d表示D其中一条数据,p(L|D)表示已知原始手术文本的情况下模型输出的金标准数据标记的概率,lj表示对应d中第j个字的数据标记,θ为双向手术数据识别与编码模型所有参数的集合,集合中包括ωk,Bm和fk,gm这两个函数的参数,Z为归一化因子,保证模型输出的结果是介于0到1之间的实数,fk为实体类别转移判别函数,ωk为fk的权值,gm为双向特征映射语言模型,Bm为其对应的权值,模型的训练过程为用0到1之间的均匀分布随机初始化ωk,Bm和fk,gm这两个函数的参数,argmax表示求可以使p(L|D)取值最大的ωk,Bm和fk,gm这两个函数的参数的集合,当使用双向手术数据识别与编码模...

【专利技术属性】
技术研发人员:桑波吴军高希余李福友李森蔡相鹏李亮张述睿
申请(专利权)人:山东众阳健康科技集团有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1