System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 医疗数据的代码转换方法、装置、设备及存储介质制造方法及图纸_技高网

医疗数据的代码转换方法、装置、设备及存储介质制造方法及图纸

技术编号:41130727 阅读:3 留言:0更新日期:2024-04-30 18:00
本申请提供了一种医疗数据的代码转换方法、装置、设备及存储介质,其中,方法包括:对待匹配字符串进行分词,得到待匹配字符串的待匹配词语序列;并确定待匹配字符串与标准字符串集合中各标准字符串的匹配度;根据待匹配字符串与标准字符串集合中各标准字符串的匹配度,对标准字符串集合中的标准字符串进行过滤,得到候选标准字符串;对待匹配字符串与各候选标准字符串进行匹配处理,得到待匹配字符串对应的目标标准字符串。通过匹配度对标准字符串进行过滤得到候选字符串,可以优先过滤掉一批标准字符串,从而缩小标准字符串的范围,减小编辑距离计算阶段的复杂度,有效提升现有的字符串匹配映射技术的性能。

【技术实现步骤摘要】

本申请涉及字符匹配,具体而言,涉及一种医疗数据的代码转换方法、装置、设备及存储介质


技术介绍

1、字符串匹配技术常被应用于自动转码工具,例如医疗代码转换场景中,可以通过自动转码工具实现院内项目向标准目录的映射,从而完成院内代码向标准代码的转换工作。

2、目前的字符串匹配技术是对给定的字符串和字符串集合直接进行编辑距离计算,从而得到相似度符合阈值的字符串集合。

3、然而,在实际的医疗代码转换场景中,由于字符串数量多,因此进行编辑距离计算阶段的复杂度也较高,所以现有的字符串匹配映射技术存在性能低的问题。


技术实现思路

1、本申请的目的在于,针对上述现有技术中的不足,提供一种医疗数据的代码转换方法、装置、设备及存储介质,以解决现有技术中字符串匹配映射技术性能低的问题。

2、为实现上述目的,本申请采用的技术方案如下:

3、第一方面,本申请提供了一种医疗数据的代码转换方法,所述方法包括:

4、获取待匹配字符串,所述待匹配字符串用于表征待转换的医疗数据;

5、对所述待匹配字符串进行分词,得到所述待匹配字符串的待匹配词语序列;

6、根据所述待匹配词语序列和标准医疗目录对应的标准字符串集合中各标准字符串的分词后词语序列,确定所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度;

7、根据所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度,对所述标准字符串集合中的标准字符串进行过滤,得到至少一个候选标准字符串;

8、对所述待匹配字符串与各所述候选标准字符串进行匹配处理,得到所述待匹配字符串对应的目标标准字符串,并将所述目标标准字符串对应的标准代码作为所述待转换的医疗数据的标准代码。

9、可选的,所述根据所述待匹配词语序列和标准医疗目录对应的标准字符串集合中各标准字符串的分词后词语序列,确定所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度,包括:

10、分别确定所述待匹配词语序列中各待匹配词语与所述分词后词语序列的左匹配度和右匹配度,并根据所述左匹配度和所述右匹配度确定各所述待匹配词语对应的匹配度;

11、根据待匹配词语序列中各待匹配词语的匹配度,确定所述待匹配字符串与所述标准字符串的匹配度。

12、可选的,所述分别确定所述待匹配词语序列中各待匹配词语与所述分词后词语序列的左匹配度和右匹配度,包括:

13、将所述待匹配词语与所述分词后词语序列中对应的词语进行匹配,确定所述待匹配词语与所述分词后词语序列中对应的词语的在先相等字符的个数,并根据所述在先相等字符的个数确定所述待匹配词语与所述分词后词语序列的左匹配度;

14、确定所述待匹配词语与所述分词后词语序列中对应的词语的在后相等字符的个数,并根据所述在后相等字符的个数确定所述待匹配词语与所述分词后词语序列的右匹配度。

15、可选的,所述根据所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度,对所述标准字符串集合中的标准字符串进行过滤,得到至少一个候选标准字符串,包括:

16、若所述待匹配字符串的长度与所述第一标准字符串的长度满足第一预设条件,且,所述待匹配字符串的长度与第一匹配度的差值满足所述第一预设条件,且,所述第一标准字符串的长度与第一匹配度的差值满足所述第一预设条件,且,所述第一匹配度满足第二预设条件,则确定所述第一标准字符串为一个候选标准字符串;

17、其中,所述第一标准字符串为所述标准字符串集合中的任意一个标准字符串,所述第一匹配度为所述待匹配字符串与所述第一标准字符串的匹配度。

18、可选的,所述对所述待匹配字符串与各所述候选标准字符串进行匹配处理,得到所述待匹配字符串对应的目标标准字符串,包括:

19、基于编辑距离算法分别对所述待匹配字符串以及各所述候选标准字符串进行模糊匹配;

20、根据模糊匹配的结果,得到所述待匹配字符串对应的目标标准字符串。

21、可选的,所述根据所述待匹配词语序列和标准医疗目录对应的标准字符串集合中各标准字符串的分词后词语序列,确定所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度之前,包括:

22、对所述标准字符串集合中各标准字符串分别进行分词,得到各标准字符串的分词后词语序列。

23、可选的,所述待转换的医疗数据包括如下至少一项:药品数据、服务项目数据;所述药品数据对应的待匹配字符串中包括如下至少一项:药品名称、药品剂型;所述服务项目数据对应的待匹配字符串中包括如下至少一项:主项目、次项目、二次手术信息、特殊属性、医院等级、加收内容信息、手术入路信息、操作规范信息、方法内容信息、标准类型信息。

24、第二方面,本申请提供了一种医疗数据的代码转换装置,所述装置包括:

25、获取模块,用于:获取待匹配字符串,所述待匹配字符串用于表征待转换的医疗数据;

26、分词模块,用于:对所述待匹配字符串进行分词,得到所述待匹配字符串的待匹配词语序列;

27、确定模块,用于:根据所述待匹配词语序列和标准医疗目录对应的标准字符串集合中各标准字符串的分词后词语序列,确定所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度;

28、过滤模块,用于:根据所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度,对所述标准字符串集合中的标准字符串进行过滤,得到至少一个候选标准字符串;

29、匹配模块,用于:对所述待匹配字符串与各所述候选标准字符串进行匹配处理,得到所述待匹配字符串对应的目标标准字符串,并将所述目标标准字符串对应的标准代码作为所述待转换的医疗数据的标准代码。

30、可选的,所述确定模块还用于:

31、分别确定所述待匹配词语序列中各待匹配词语与所述分词后词语序列的左匹配度和右匹配度,并根据所述左匹配度和所述右匹配度确定各所述待匹配词语对应的匹配度;

32、根据待匹配词语序列中各待匹配词语的匹配度,确定所述待匹配字符串与所述标准字符串的匹配度。

33、可选的,所述确定模块还用于:

34、将所述待匹配词语与所述分词后词语序列中对应的词语进行匹配,确定所述待匹配词语与所述分词后词语序列中对应的词语的在先相等字符的个数,并根据所述在先相等字符的个数确定所述待匹配词语与所述分词后词语序列的左匹配度;

35、确定所述待匹配词语与所述分词后词语序列中对应的词语的在后相等字符的个数,并根据所述在后相等字符的个数确定所述待匹配词语与所述分词后词语序列的右匹配度。

36、可选的,所述过滤模块还用于:

37、若所述待匹配字符串的长度与所述第一标准字符串的长度满足第一预设条件,且,所述待匹配字符串的长度与第一匹配度的差值满足所述第一预设条件,且,所述第一标准字符串的长度与第一匹配度本文档来自技高网...

【技术保护点】

1.一种医疗数据的代码转换方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配词语序列和标准医疗目录对应的标准字符串集合中各标准字符串的分词后词语序列,确定所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度,包括:

3.根据权利要求2所述的方法,其特征在于,所述分别确定所述待匹配词语序列中各待匹配词语与所述分词后词语序列的左匹配度和右匹配度,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度,对所述标准字符串集合中的标准字符串进行过滤,得到至少一个候选标准字符串,包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述待匹配字符串与各所述候选标准字符串进行匹配处理,得到所述待匹配字符串对应的目标标准字符串,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配词语序列和标准医疗目录对应的标准字符串集合中各标准字符串的分词后词语序列,确定所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度之前,包括:

7.根据权利要求1-6任一项所述的方法,其特征在于,所述待转换的医疗数据包括如下至少一项:药品数据、服务项目数据;所述药品数据对应的待匹配字符串中包括如下至少一项:药品名称、药品剂型;所述服务项目数据对应的待匹配字符串中包括如下至少一项:主项目、次项目、二次手术信息、特殊属性、医院等级、加收内容信息、手术入路信息、操作规范信息、方法内容信息、标准类型信息。

8.一种医疗数据的代码转换装置,其特征在于,包括:

9.一种电子设备,其特征在于,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的程序指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述程序指令,以执行时执行如权利要求1至7任一所述的医疗数据的代码转换方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如权利要求1至7任一所述的医疗数据的代码转换方法的步骤。

...

【技术特征摘要】

1.一种医疗数据的代码转换方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配词语序列和标准医疗目录对应的标准字符串集合中各标准字符串的分词后词语序列,确定所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度,包括:

3.根据权利要求2所述的方法,其特征在于,所述分别确定所述待匹配词语序列中各待匹配词语与所述分词后词语序列的左匹配度和右匹配度,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配字符串与所述标准字符串集合中各标准字符串的匹配度,对所述标准字符串集合中的标准字符串进行过滤,得到至少一个候选标准字符串,包括:

5.根据权利要求1所述的方法,其特征在于,所述对所述待匹配字符串与各所述候选标准字符串进行匹配处理,得到所述待匹配字符串对应的目标标准字符串,包括:

6.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配词语序列和标准医疗目录对应的标准字符串集合中各标准字符串的分词后词语序列,确定所述待匹配字符串与...

【专利技术属性】
技术研发人员:陈文君王剑斌黄智勇杨晓王涛赵大平孙嘉明董津陈旭尤江
申请(专利权)人:卫宁健康科技集团股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1