System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种获取电子病历文本的疾病名称标识的数据处理系统技术方案_技高网

一种获取电子病历文本的疾病名称标识的数据处理系统技术方案

技术编号:40982402 阅读:2 留言:0更新日期:2024-04-18 21:28
本发明专利技术涉及数据处理领域,尤其涉及一种获取电子病历文本的疾病名称标识的数据处理系统,当计算机程序被处理器执行时,实现以下步骤:基于初始关键词的词向量和主类疾病名称对应的主关键词的词向量之间的相似度,筛选得到第一候选疾病名称列表并去重得到第一中间疾病名称列表,从而结合初始关键词和主类关键词之间的相似度,以及初始关键词在病历文本中的出现次数获取到第一疾病名称标识列表,提高了第一疾病名称标识的获取准确性;然后结合初始关键词的词向量、第一疾病名称标识列表、第一副类疾病名称信息列表和第二副类疾病名称信息列表,进一步获取到电子病历文本对应的目标病历名称标识,提高了目标病历名称标识的获取准确性。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,特别是涉及一种获取电子病历文本的疾病名称标识的数据处理系统


技术介绍

1、drg(疾病诊断相关分组)是专门用于医疗保险预付款制度的分类编码标准,根据病人的年龄、性别、住院天数、临床诊断天数、临床诊断、病症、手术、疾病严重程度,合并症与并发症及转归等因素把病人分入多个诊断相关组,在分级上进行科学测算,给予定额预付款,可以辅助提高医院的精益运营管理以及绩效管理能力,在医疗领域具有广泛的应用前景。

2、在医疗领域,drg目录可以分为主目、亚目和细目三个层级,通过病人的病历文本和主目、亚目、细目名称之间的相似性,分别获取到病历文本对应的主目、亚目和细目,进一步综合对应的主目、亚目和细目获取到详细的疾病名称标识。由于drg目录中包括若干个主目,且每一主目包括若干个亚目,每一亚目包括若干个细目,使得疾病名称标识的复杂度较高,现有的疾病名称标识获取方法仅根据病历文本和主目、亚目、细目名称之间的相似性来获取疾病名称标识时的准确性较低。

3、因此,如何提高电子病历文本的疾病名称标识的获取准确性成为亟待解决的问题。


技术实现思路

1、针对上述技术问题,本专利技术采用的技术方案为一种获取电子病历文本的疾病名称标识的数据处理系统,所述系统包括处理器和存储有计算机程序的存储器,存储器中还存储有电子病历文本的初始关键词向量集a0={a01,a02,……,a0i,……,a0m}、主类疾病名称信息列表l0、第一副类疾病名称信息列表l1和第二副类疾病名称信息列表l2,其中,a0i是指电子病历文本的第i个初始关键词的词向量,l0包括n个预设的主类疾病名称、每一主类疾病名称对应的主类疾病名称标识以及主类疾病名称向量集b0={b01,b02,……,b0j,……,b0n},b0j是指第j个主类疾病名称对应的主关键词的词向量,i=1,2,……,m,m是指电子病历文本的初始关键词的总数量,j=1,2,……,n,当计算机程序被处理器执行时,实现以下步骤:

2、s100,根据a0和b0,获取到a0对应的主类疾病名称相似度集c0={c01,c02,……,c0i,……,c0m},其中,c0i={c0i1,c0i2,……,c0ij,……,c0in},c0ij是指a0i和b0j之间的相似度。

3、s200,将满足c0ij>△c0的c0ij对应的主类疾病名称作为第一候选疾病名称,获取到第一候选疾病名称列表d0,其中,△c0为第一预设阈值。

4、s300,对d0去重得到第一中间疾病名称列表d1={d11,d12,……,d1k,……,d1t},其中,d1k是指第k个第一中间疾病名称,k=1,2,……,t,t为第一中间疾病名称的总数量。

5、s400,根据c0和d1,获取到d1对应的主类疾病名称中间相似度集c1={c11,c12,……,c1k,……,c1t},其中,c1k={c1k1,c1k2,……,c1kx,……,c1kr(k)},c1kx是指d1k对应的主类疾病名称在c0中对应的大于△c0的第x个主类疾病名称相似度,x=1,2,……,r(k),r(k)是指d1k对应的主类疾病名称在c0中对应的大于△c0的主类疾病名称相似度的总数量。

6、s500,根据c1和a0,获取到d1对应的第一出现频次集e1={e11,e12,……,e1k,……,e1t},其中,e1k={e1k1,e1k2,……,e1kx,……,e1kr(k)},e1kx=q1kx/m,q1kx为c1kx对应的初始关键词的词向量在a0中的出现次数。

7、s600,根据c1和e1,获取到d1对应的第一选取概率集s1={s11,s12,……,s1k,……,s1t},其中,d1k对应的第一选取概率s1k=σx=1r(k)(e1kx*c1kx)/r(k)。

8、s700,将满足s1k>△s1的s1k对应的第一中间疾病名称对应的主类疾病名称标识作为第一疾病名称标识,获取到第一疾病名称标识列表w1,其中,△s1为第二预设阈值。

9、s800,根据a0、w1、l1和l2,获取到电子病历文本对应的目标病历名称标识。

10、本专利技术与现有技术相比具有明显的有益效果,借由上述技术方案,本专利技术提供的获取电子病历文本的疾病名称标识的数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有以下有益效果:基于初始关键词的词向量和主类疾病名称对应的主关键词的词向量之间的相似度,来筛选得到第一候选疾病名称列表,并对第一候选疾病名称列表去重得到第一中间疾病名称列表,进一步获取到第一中间疾病名称列表对应的主类疾病名称中间相似度集和对应的第一出现频次集,从而可以结合初始关键词和主类关键词之间的相似度,以及初始关键词在病历文本中的出现次数来表征每一第一中间疾病名称被选取为第一疾病名称标识的概率,来对所有的第一中间疾病名称进行筛选,最终获取到第一疾病名称标识列表,从而提高了第一疾病名称标识的获取准确性;然后结合初始关键词的词向量、第一疾病名称标识列表、第一副类疾病名称信息列表和第二副类疾病名称信息列表,进一步获取到电子病历文本对应的目标病历名称标识,提高了目标病历名称标识的获取准确性。

本文档来自技高网...

【技术保护点】

1.一种获取电子病历文本的疾病名称标识的数据处理系统,其特征在于,所述系统包括处理器和存储有计算机程序的存储器,所述存储器中还存储有电子病历文本的初始关键词向量集A0={A01,A02,……,A0i,……,A0m}、主类疾病名称信息列表L0、第一副类疾病名称信息列表L1和第二副类疾病名称信息列表L2,其中,A0i是指所述电子病历文本的第i个初始关键词的词向量,L0包括n个预设的主类疾病名称、每一主类疾病名称对应的主类疾病名称标识以及主类疾病名称向量集B0={B01,B02,……,B0j,……,B0n},B0j是指第j个主类疾病名称对应的主关键词的词向量,i=1,2,……,m,m是指所述电子病历文本的初始关键词的总数量,j=1,2,……,n,当所述计算机程序被处理器执行时,实现以下步骤:

2.根据权利要求1所述的数据处理系统,其特征在于,所述存储器中还存储有电子病历文本和每一主类疾病名称对应的主关键词,A0和B0通过如下步骤获取:

3.根据权利要求1所述的数据处理系统,其特征在于,C0ij=(A0i·B0j)/(||A0i||×||B0j||),其中,||A0i||是指A0i的模,||B0j||是指B0j的模。

4.根据权利要求1所述的数据处理系统,其特征在于,S800具体包括如下步骤:

5.根据权利要求4所述的数据处理系统,其特征在于,L1包括P个预设的第一副类疾病名称、每一第一副类疾病名称对应的第一副类疾病名称标识、每一第一副类疾病名称对应的主类疾病名称和第一副类疾病名称向量集B1={B11,B12,……,B1p,……,B1P},B1u是指第p个第一副类疾病名称对应的第一副类关键词的词向量,p=1,2,……,P,S810具体包括如下步骤:

6.根据权利要求5所述的数据处理系统,其特征在于,△S1>△S2。

7.根据权利要求5所述的数据处理系统,其特征在于,L2包括G个预设的第二副类疾病名称、每一第二副类疾病名称对应的第二副类疾病名称标识、每一第二副类疾病名称对应的第一副类疾病名称和第二副类疾病名称向量集B2={B22,B22,……,B2g,……,B2G},B2g是指第g个第二副类疾病名称对应的第二副类关键词的词向量,g=1,2,……,G,S820具体包括如下步骤:

8.根据权利要求7所述的数据处理系统,其特征在于,S830具体包括如下步骤:

...

【技术特征摘要】

1.一种获取电子病历文本的疾病名称标识的数据处理系统,其特征在于,所述系统包括处理器和存储有计算机程序的存储器,所述存储器中还存储有电子病历文本的初始关键词向量集a0={a01,a02,……,a0i,……,a0m}、主类疾病名称信息列表l0、第一副类疾病名称信息列表l1和第二副类疾病名称信息列表l2,其中,a0i是指所述电子病历文本的第i个初始关键词的词向量,l0包括n个预设的主类疾病名称、每一主类疾病名称对应的主类疾病名称标识以及主类疾病名称向量集b0={b01,b02,……,b0j,……,b0n},b0j是指第j个主类疾病名称对应的主关键词的词向量,i=1,2,……,m,m是指所述电子病历文本的初始关键词的总数量,j=1,2,……,n,当所述计算机程序被处理器执行时,实现以下步骤:

2.根据权利要求1所述的数据处理系统,其特征在于,所述存储器中还存储有电子病历文本和每一主类疾病名称对应的主关键词,a0和b0通过如下步骤获取:

3.根据权利要求1所述的数据处理系统,其特征在于,c0ij=(a0i·b0j)/(||a0i||×||b0j||),其中,||a0i||是指a0i的模,||b0j|...

【专利技术属性】
技术研发人员:王志鹏王军江
申请(专利权)人:奇点智保北京科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1