一种获取电子病历文本的疾病名称标识的数据处理系统技术方案

技术编号:40982402 阅读:19 留言:0更新日期:2024-04-18 21:28
本发明专利技术涉及数据处理领域,尤其涉及一种获取电子病历文本的疾病名称标识的数据处理系统,当计算机程序被处理器执行时,实现以下步骤:基于初始关键词的词向量和主类疾病名称对应的主关键词的词向量之间的相似度,筛选得到第一候选疾病名称列表并去重得到第一中间疾病名称列表,从而结合初始关键词和主类关键词之间的相似度,以及初始关键词在病历文本中的出现次数获取到第一疾病名称标识列表,提高了第一疾病名称标识的获取准确性;然后结合初始关键词的词向量、第一疾病名称标识列表、第一副类疾病名称信息列表和第二副类疾病名称信息列表,进一步获取到电子病历文本对应的目标病历名称标识,提高了目标病历名称标识的获取准确性。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,特别是涉及一种获取电子病历文本的疾病名称标识的数据处理系统


技术介绍

1、drg(疾病诊断相关分组)是专门用于医疗保险预付款制度的分类编码标准,根据病人的年龄、性别、住院天数、临床诊断天数、临床诊断、病症、手术、疾病严重程度,合并症与并发症及转归等因素把病人分入多个诊断相关组,在分级上进行科学测算,给予定额预付款,可以辅助提高医院的精益运营管理以及绩效管理能力,在医疗领域具有广泛的应用前景。

2、在医疗领域,drg目录可以分为主目、亚目和细目三个层级,通过病人的病历文本和主目、亚目、细目名称之间的相似性,分别获取到病历文本对应的主目、亚目和细目,进一步综合对应的主目、亚目和细目获取到详细的疾病名称标识。由于drg目录中包括若干个主目,且每一主目包括若干个亚目,每一亚目包括若干个细目,使得疾病名称标识的复杂度较高,现有的疾病名称标识获取方法仅根据病历文本和主目、亚目、细目名称之间的相似性来获取疾病名称标识时的准确性较低。

3、因此,如何提高电子病历文本的疾病名称标识的获取准确性成为亟待解决的问题。

本文档来自技高网...

【技术保护点】

1.一种获取电子病历文本的疾病名称标识的数据处理系统,其特征在于,所述系统包括处理器和存储有计算机程序的存储器,所述存储器中还存储有电子病历文本的初始关键词向量集A0={A01,A02,……,A0i,……,A0m}、主类疾病名称信息列表L0、第一副类疾病名称信息列表L1和第二副类疾病名称信息列表L2,其中,A0i是指所述电子病历文本的第i个初始关键词的词向量,L0包括n个预设的主类疾病名称、每一主类疾病名称对应的主类疾病名称标识以及主类疾病名称向量集B0={B01,B02,……,B0j,……,B0n},B0j是指第j个主类疾病名称对应的主关键词的词向量,i=1,2,……,m,m是指所述电...

【技术特征摘要】

1.一种获取电子病历文本的疾病名称标识的数据处理系统,其特征在于,所述系统包括处理器和存储有计算机程序的存储器,所述存储器中还存储有电子病历文本的初始关键词向量集a0={a01,a02,……,a0i,……,a0m}、主类疾病名称信息列表l0、第一副类疾病名称信息列表l1和第二副类疾病名称信息列表l2,其中,a0i是指所述电子病历文本的第i个初始关键词的词向量,l0包括n个预设的主类疾病名称、每一主类疾病名称对应的主类疾病名称标识以及主类疾病名称向量集b0={b01,b02,……,b0j,……,b0n},b0j是指第j个主类疾病名称对应的主关键词的词向量,i=1,2,……,m,m是指所述电子病历文本的初始关键词的总数量,j=1,2,……,n,当所述计算机程序被处理器执行时,实现以下步骤:

2.根据权利要求1所述的数据处理系统,其特征在于,所述存储器中还存储有电子病历文本和每一主类疾病名称对应的主关键词,a0和b0通过如下步骤获取:

3.根据权利要求1所述的数据处理系统,其特征在于,c0ij=(a0i·b0j)/(||a0i||×||b0j||),其中,||a0i||是指a0i的模,||b0j|...

【专利技术属性】
技术研发人员:王志鹏王军江
申请(专利权)人:奇点智保北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1