词汇关联方法、词汇关联装置以及可读存储介质制造方法及图纸

技术编号:37149963 阅读:16 留言:0更新日期:2023-04-06 22:04
本发明专利技术提出了一种词汇关联方法、词汇关联装置以及可读存储介质,词汇关联方法包括:获取第一词汇集合;将第一词汇集合中的第一词汇,替换为第一目标词汇,得到第二词汇集合,第一词汇为第一词汇集合中语义相匹配的词汇,第一目标词汇为多个第一词汇中的词汇;对预设词汇进行分割处理,得到至少两个第一字符段;根据至少两个第一字符段,确定第二词汇集合中的第二目标词汇,第二目标词汇中的至少两个第二字符段与至少两个第一字符段相匹配;建立预设词汇与第二目标词汇的关联关系,预设词汇与至少一个第二目标词汇相对应。少一个第二目标词汇相对应。少一个第二目标词汇相对应。

【技术实现步骤摘要】
词汇关联方法、词汇关联装置以及可读存储介质


[0001]本专利技术涉及医疗词汇领域,具体而言,涉及一种词汇关联方法、词汇关联装置以及可读存储介质。

技术介绍

[0002]目前,不同地区不同的医疗系统的医学术语不规范,阻碍了医学领域的信息交流。医疗系统内存在大量语义相同但书写格式不同的词汇,阻碍了数据整理的速度,也难以保证不同医疗系统的结果的准确性。同时,对医学术语进行大数据量的整体匹配时,对医疗系统的性能要求较高,不能保证医疗系统的运行的流畅性和稳定性。

技术实现思路

[0003]本专利技术旨在至少解决现有技术或相关技术中存在的技术问题之一。
[0004]有鉴于此,本专利技术的第一方面在于提供一种词汇关联方法。
[0005]本专利技术的第二方面在于提供一种词汇关联装置。
[0006]本专利技术的第三方面在于提供一种词汇关联装置。
[0007]本专利技术的第四方面在于提供一种可读存储介质。
[0008]本专利技术的一个实施例提出了一种词汇关联方法,包括:获取第一词汇集合;将第一词汇集合中的第一词汇,替换为第一目标词汇,得到第二词汇集合,第一词汇为第一词汇集合中语义相匹配的词汇,第一目标词汇为多个第一词汇中的词汇;对预设词汇进行分割处理,得到至少两个第一字符段;根据至少两个第一字符段,确定第二词汇集合中的第二目标词汇,第二目标词汇中的至少两个第二字符段与至少两个第一字符段相匹配;建立预设词汇与第二目标词汇的关联关系,预设词汇与至少一个第二目标词汇相对应。
[0009]在该实施例中,能够根据用户需求提取医学术语的分类对应的第一词汇集合,能够针对性地对集合进行提取,将第一词汇集合中的第一词汇,替换为第一目标词汇,得到第二词汇集合,能够提前对词汇集合进行预处理,能够对医疗系统中医学术语规范化,便于后续对相同语义的医学术语的自动匹配,从而保证在科研工作时进行数据归纳整理的速度,保证研究成果的准确性,进而利于医学资源的共享和医生之间的沟通,便于医学文献的编辑和医学知识的传播。对预设词汇进行分割处理,得到至少两个第一字符段,能够减少医疗系统匹配的计算量。根据至少两个第一字符段,确定第二词汇集合中的第二目标词汇,实现了对相同语义的医学术语的自动匹配,相比于人工筛选,能够快速、准确地筛选出符合用户需求的医学术语,从而便于对医疗系统中医学术语的规范化管理和标准化建设。建立预设词汇与第二目标词汇的关联关系,便于后续利用关联关系对医疗系统进行术语的规范化管理和标准化建设,从而实现不同医疗系统中数据的互通和共享,提高医学领域的专业化程度。
[0010]另外,本专利技术提供的上述实施例中的词汇关联方法还可以具有如下附加技术特征:
[0011]在上述实施例中,根据至少两个第一字符段,确定第二词汇集合中的第二目标词汇包括:获取第一字符段与第二字符段之间的匹配参数;将匹配参数大于预设匹配参数的第二字符段对应的词汇,确定为第三目标词汇;获取多个第三目标词汇的第一语义信息;根据第一语义信息筛选多个第三目标词汇中的第二目标词汇,第二目标词汇的语义与预设词汇的语义相匹配。
[0012]在该实施例中,获取第一字符段与第二字符段之间的匹配参数,便于后续与用户设置的预设参数进行比对。将匹配参数大于预设匹配参数的第二字符段对应的词汇,确定为第三目标词汇,能够筛选出满足用户需求的词汇。获取多个第三目标词汇的第一语义信息,能够根据语义信息对词汇进行筛选,从而保证词汇匹配的准确性。根据第一语义信息筛选多个第三目标词汇中的第二目标词汇,第二目标词汇的语义与预设词汇的语义相匹配,能够在匹配过程中根据用户预先设置的对应关系,避免极为相近的术语出现不应该匹配的现象的发生,剔除不满足匹配要求的词汇和不满足预设对应关系的词汇,相比于人工筛选,能够进一步提高匹配的准确性,保证医疗系统的结果的准确性,减少后续复核的工作量。
[0013]在上述任一实施例中,将匹配参数大于预设匹配参数的第二字符段对应的词汇,确定为第三目标词汇,包括::获取至少两个第一字符段的字符长度;根据预设字符长度,筛选第一字符段中的第一目标字符段和第二目标字符段,第一目标字符段的字符长度小于预设字符长度,第二目标字符段的字符长度大于等于预设字符长度;分别获取第一目标字符段的匹配参数,以及第二目标字符段的匹配参数;将匹配参数大于预设匹配参数的第二字符段对应的词汇,确定为第三目标词汇。
[0014]在该实施例中,获取至少两个第一字符段的字符长度,便于后续根据字符长度选择不同的匹配算法。根据预设字符长度,筛选第一字符段中的第一目标字符段和第二目标字符段,根据不同长度的目标字符段选择不同的匹配算法,与相关技术中使用单一算法相比,减小算法得到的结果的偏差。分别获取第一目标字符段的匹配参数,以及第二目标字符段的匹配参数,能够提高匹配的准确性,从而提高医疗系统的匹配精度。将匹配参数大于预设匹配参数的第二字符段对应的词汇,确定为第三目标词汇,能够筛选出满足用户需求的词汇,剔除不满足匹配要求的词汇,保证医疗系统的结果的准确性,减少后续复核的工作量。
[0015]在上述任一实施例中,分别获取第一目标字符段的匹配参数,以及第二目标字符段的匹配参数,包括:根据第一目标字符段中的字符间距,确定第一目标字符段的匹配参数;以及根据第二目标字符段中每个字符的权重值,确定第二目标字符段的匹配参数,每个字符的权重值与每个字符在第二目标字符段中的位置相关联。
[0016]在该实施例中,根据第一目标字符段中的字符间距,确定第一目标字符段的匹配参数,能够根据字符的距离进行匹配参数的计算。根据第二目标字符段中每个字符的权重值,确定第二目标字符段的匹配参数,每个字符的权重值与每个字符在第二目标字符段中的位置相关联,能够根据用户预设与位置相关联的权重值对字符进行计算,从而实现了针对不同的长度采用不同的算法计算公式,减少匹配计算的误差,提高匹配计算的准确性,减少后续复核的工作量。
[0017]在上述任一实施例中,将第一词汇集合中的第一词汇,替换为第一目标词汇,得到第二词汇集合包括:确定多个第一词汇中每个第一词汇的第二语义信息;根据多个第二语
义信息,确定多个第一词汇中的第一目标词汇;通过第一目标词汇,替换第一词汇集合中的多个第一词汇,以得到第二词汇集合。
[0018]在该实施例中,获取多个第一词汇中的每个第一词汇的第二语义信息,能够在匹配计算之前,便于对第一词汇进行预处理。根据多个第二语义信息,确定多个第一词汇中的第一目标词汇,能够便于后续将多个第一词汇统一替换为第一目标词汇,将多个含义相同但有着不同表达方法的术语规范化。通过第一目标词汇,替换第一词汇集合中的多个第一词汇,以得到第二词汇集合,实现了在匹配之前对第一词汇的规范化处理,利于医学资源的共享和医生之间的沟通,便于医学文献的编辑和医学知识的传播。
[0019]在上述任一实施例中,对预设词汇进行分割处理,得到至少两个第一字符段之前,还包括:识别第一词汇集合中的预设符号;去除第一词汇集合中的预设符号。
[0020]在该实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种词汇关联方法,其特征在于,包括:获取第一词汇集合;将所述第一词汇集合中的第一词汇,替换为第一目标词汇,得到第二词汇集合,所述第一词汇为所述第一词汇集合中语义相匹配的词汇,所述第一目标词汇为所述多个第一词汇中的词汇;对预设词汇进行分割处理,得到至少两个第一字符段;根据所述至少两个第一字符段,确定所述第二词汇集合中的第二目标词汇,所述第二目标词汇中的至少两个第二字符段与所述至少两个第一字符段相匹配;建立所述预设词汇与所述第二目标词汇的关联关系,所述预设词汇与至少一个第二目标词汇相对应。2.根据权利要求1所述的词汇关联方法,其特征在于,所述根据所述至少两个第一字符段,确定所述第二词汇集合中的第二目标词汇包括:获取所述第一字符段与所述第二字符段之间的匹配参数;将所述匹配参数大于预设匹配参数的第二字符段对应的词汇,确定为第三目标词汇;获取多个所述第三目标词汇的第一语义信息;根据所述第一语义信息筛选多个所述第三目标词汇中的所述第二目标词汇,所述第二目标词汇的语义与所述预设词汇的语义相匹配。3.根据权利要求2所述的词汇关联方法,其特征在于,所述将所述匹配参数大于预设匹配参数的第二字符段对应的词汇,确定为第三目标词汇,包括::获取所述至少两个第一字符段的字符长度;根据预设字符长度,筛选所述第一字符段中的第一目标字符段和第二目标字符段,所述第一目标字符段的字符长度小于所述预设字符长度,所述第二目标字符段的字符长度大于等于所述预设字符长度;分别获取所述第一目标字符段的匹配参数,以及所述第二目标字符段的匹配参数;将所述匹配参数大于预设匹配参数的第二字符段对应的词汇,确定为所述第三目标词汇。4.根据权利要求2所述的词汇关联方法,其特征在于,所述分别获取所述第一目标字符段的匹配参数,以及所述第二目标字符段的匹配参数,包括:根据所述第一目标字符段中的字符间距,确定所述第一目标字符段的匹配参数;以及根据所述第二目标字符段中每个字符的权重值,确定所述第二目标字符段的匹配参数,所述每个字符的权重值与所述每个字符在所述第二目标字符段中的位...

【专利技术属性】
技术研发人员:凌昌昌王海鹏王国栋
申请(专利权)人:北大医疗信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1