名词匹配方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号:21161780 阅读:25 留言:0更新日期:2019-05-22 08:29
本发明专利技术公开一种名词匹配方法、装置、设备及计算机可读存储介质,所述方法包括:当接收到待匹配名词时,将待匹配名词和预设词链模型对比,确定预设词链模型中与待匹配名词对应的第一分词集合;读取预设标准词库中的各标准词,并将各标准词逐一和预设词链模型对比,确定预设词链模型中与各标准词对应的第二分词集合;在第一分词集合和各第二分词集合之间分别生成并集集合,并调用各并集集合分别和待匹配名词以及各标准词对比,生成各第一对比结果和各第二对比结果;根据各第一对比结果和各第二对比结果,确定各标准词中与待匹配名词匹配的目标标准词,完成待匹配名词的匹配。通过待匹配名词与各标准词之间的相似度得分进行匹配,提高了匹配准确性。

Noun Matching Method, Device, Equipment and Computer Readable Storage Media

The invention discloses a noun matching method, device, device and computer readable storage medium. The method includes: when receiving a matching noun, comparing the matching noun and the presupposition word chain model, determining the first participle set corresponding to the matching noun in the presupposition word chain model, reading the standard words in the presupposition standard word library, and one by one and presupposition words. The second participle set corresponding to each standard word in the presupposed word chain model is determined by comparing the chain model; the union set is generated between the first participle set and each second participle set, and the union set is invoked to compare with the matched noun and each standard word separately to generate the first and second comparison results; according to the first comparison results and the second comparison results. The target standard words matched with the matched nouns in each standard word are determined, and the matching of the matched nouns is completed. The matching accuracy is improved by matching the similarity scores between the nouns to be matched and the standard words.

【技术实现步骤摘要】
名词匹配方法、装置、设备及计算机可读存储介质
本专利技术主要涉及数据处理
,具体地说,涉及一种名词匹配方法、装置、设备及计算机可读存储介质。
技术介绍
医药领域中涉及到众多表征疾病名称、药品名称、诊断手段的标准词,且各标准词的长度不一,存在某些包含众多字的标准词;医疗人员在将该类包含众多字的标准词输入到就诊人员的病历时,通常写简称,或者省略其中的个别字。医疗机构为了对病历进行规范化管理或者医保机构在依据病历进行医保报销时,均需要先为其中简写或省略的名词匹配标准词。目前在对医药领域中简写或省略的名词匹配标准词时,通常将各标准词逐个和简写或省略的名词进行对比匹配;因简写或省略的名词以多种形式存在,而标准词则以固定形式存在,使得标准词不能准确的表征各简写或省略的名词含义,导致为简写或省略的名词所匹配的标准词不准确。
技术实现思路
本专利技术的主要目的是提供一种名词匹配方法、装置、设备及计算机可读存储介质,旨在解决现有技术中为医药领域中简写或省略的名词所匹配的标准词不准确的问题为实现上述目的,本专利技术提供一种名词匹配方法,所述名词匹配方法包括以下步骤:当接收到待匹配名词时,将所述待匹配名词和预设词链模型对比,确定所述预设词链模型中与所述待匹配名词对应的第一分词集合;读取预设标准词库中的各标准词,并将各所述标准词逐一和所述预设词链模型对比,确定所述预设词链模型中与各所述标准词对应的第二分词集合;在所述第一分词集合和各所述第二分词集合之间分别生成并集集合,并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比,生成各第一对比结果和各第二对比结果;根据各所述第一对比结果和各所述第二对比结果,确定各所述标准词中与所述待匹配名词匹配的目标标准词,完成所述待匹配名词的匹配。优选地,所述将所述待匹配名词和预设词链模型对比,确定所述预设词链模型中与所述待匹配名词对应的第一分词集合的步骤包括:统计所述待匹配名词中所具有的汉字个数,并根据所述汉字个数确定所述待匹配名词的层级级数;读取所述待匹配名词中的目标汉字,并将各所述目标汉字和所述预设词链模型中的各分词集合对比,确定各所述目标汉字在各层级级数上的关联分词集合;将各所述关联分词集合基于所述层级级数进行合并,生成所述待匹配名词在各层级级数上的第一分词集合。优选地,所述在所述第一分词集合和各所述第二分词集合之间分别生成并集集合,并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比,生成各第一对比结果和各第二对比结果的步骤包括:将所述第一分词集合分别和各所述第二分词集合基于各所述层级级数进行合并操作,生成各个并集集合;针对每一个并集集合执行如下步骤:基于所述层级级数读取所述并集集合中的各标准分词,形成在各所述层级级数上的分词序列,逐一将在各所述层级级数上所述分词序列中的各标准分词和所述待匹配名词对比,生成所述待匹配名词在各所述层级级数上的第一对比结果;逐一将在各所述层级级数上所述分词序列中的各标准分词和所述并集集合对应的标准词对比,生成所述标准词在各所述层级级数上的第二对比结果。优选地,所述逐一将在各所述层级级数上所述分词序列中的各标准分词和所述待匹配名词对比,生成所述待匹配名词在各所述层级级数上的第一对比结果的步骤包括:基于所述层级级数将所述分词序列中的各标准分词分别和所述待匹配名词对比,判断所述分词序列中的各标准分词是否存在于所述待匹配名词中;若所述分词序列中的标准分词存在于所述待匹配名词中,则生成第一分词值,并将所述第一分词值配置到所述分词序列中该标准分词所在的位置;若所述分词序列中的标准分词不存在于所述待匹配名词中,则生成第二分词值,并将所述第二分词值配置到所述分词序列中该标准分词所在的位置;在检测到各所述层级级数上的所述分词序列中各标准分词均和所述待匹配名词对比完成后,基于所述层级级数将配置到所述分词序列中各位置的所述第一分词值和所述第二分词值,形成所述待匹配名词在各所述层级级数上的第一对比结果。优选地,所述根据各所述第一对比结果和各所述第二对比结果,确定各所述标准词中与所述待匹配名词匹配的目标标准词的步骤包括:从各所述第一对比结果中任意抓取一项第一对比结果作为目标第一对比结果,并根据与生成所述目标第一对比结果对应的并集集合,从各所述第二对比结果中确定对应的目标第二对比结果;将所述目标第一对比结果和所述目标第二对比结果基于各所述层级级数形成层级结果对,并将各所述层级结果对传输到预设公式中,根据所述预设公式,生成各所述层级结果对之间的相似度得分;将各所述相似度得分进行对比,确定各所述相似度得分中的得分最大值,并检测各所述第一对比结果是否均生成对应的得分最大值;若各所述第一对比结果均生成对应的得分最大值,则根据各所述得分最大值,确定各所述标准词中与所述待匹配名词匹配的目标标准词。优选地,所述根据各所述得分最大值,确定各所述标准词中与所述待匹配名词匹配的目标标准词的步骤包括:将各所述得分最大值进行对比,确定各所述得分最大值中数值最大的目标得分值,并将所述目标得分值对应的标准词确定为与所述待匹配名词匹配的目标标准词。优选地,所述当接收到待匹配名词时,将所述待匹配名词和预设词链模型对比的步骤之前包括:当接收到对名词进行匹配的触发请求时,读取所述触发请求中的标准库识别码,并将所述标准库识别码和预设标识码对比,确定各所述预设标识码中与所述标准库识别码对应的目标预设标识码;将与所述目标预设标识码对应的标准词库确定为预设标准词库,并将与所述预设标准词库对应的词链模型确定为预设词链模型。此外,为实现上述目的,本专利技术还提出一种名词匹配装置,所述名词匹配装置包括:对比模块,用于当接收到待匹配名词时,将所述待匹配名词和预设词链模型对比,确定所述预设词链模型中与所述待匹配名词对应的第一分词集合;读取模块,用于读取预设标准词库中的各标准词,并将各所述标准词逐一和所述预设词链模型对比,确定所述预设词链模型中与各所述标准词对应的第二分词集合;生成模块,用于在所述第一分词集合和各所述第二分词集合之间分别生成并集集合,并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比,生成各第一对比结果和各第二对比结果;匹配模块,用于根据各所述第一对比结果和各所述第二对比结果,确定各所述标准词中与所述待匹配名词匹配的目标标准词,完成所述待匹配名词的匹配。此外,为实现上述目的,本专利技术还提出一种名词匹配设备,所述名词匹配设备包括:存储器、处理器、通信总线以及存储在所述存储器上的名词匹配程序;所述通信总线用于实现处理器和存储器之间的连接通信;所述处理器用于执行所述名词匹配程序,以实现以下步骤:当接收到待匹配名词时,将所述待匹配名词和预设词链模型对比,确定所述预设词链模型中与所述待匹配名词对应的第一分词集合;读取预设标准词库中的各标准词,并将各所述标准词逐一和所述预设词链模型对比,确定所述预设词链模型中与各所述标准词对应的第二分词集合;在所述第一分词集合和各所述第二分词集合之间分别生成并集集合,并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比,生成各第一对比结果和各第二对比结果;根据各所述第一对比结果和各所述第二对比结果,确定各所述标准词中与所述待匹配名词匹配的目标标准词,完成所述待匹配名词的本文档来自技高网...

【技术保护点】
1.一种名词匹配方法,其特征在于,所述名词匹配方法包括以下步骤:当接收到待匹配名词时,将所述待匹配名词和预设词链模型对比,确定所述预设词链模型中与所述待匹配名词对应的第一分词集合;读取预设标准词库中的各标准词,并将各所述标准词逐一和所述预设词链模型对比,确定所述预设词链模型中与各所述标准词对应的第二分词集合;在所述第一分词集合和各所述第二分词集合之间分别生成并集集合,并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比,生成各第一对比结果和各第二对比结果;根据各所述第一对比结果和各所述第二对比结果,确定各所述标准词中与所述待匹配名词匹配的目标标准词,完成所述待匹配名词的匹配。

【技术特征摘要】
1.一种名词匹配方法,其特征在于,所述名词匹配方法包括以下步骤:当接收到待匹配名词时,将所述待匹配名词和预设词链模型对比,确定所述预设词链模型中与所述待匹配名词对应的第一分词集合;读取预设标准词库中的各标准词,并将各所述标准词逐一和所述预设词链模型对比,确定所述预设词链模型中与各所述标准词对应的第二分词集合;在所述第一分词集合和各所述第二分词集合之间分别生成并集集合,并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比,生成各第一对比结果和各第二对比结果;根据各所述第一对比结果和各所述第二对比结果,确定各所述标准词中与所述待匹配名词匹配的目标标准词,完成所述待匹配名词的匹配。2.如权利要求1所述的名词匹配方法,其特征在于,所述将所述待匹配名词和预设词链模型对比,确定所述预设词链模型中与所述待匹配名词对应的第一分词集合的步骤包括:统计所述待匹配名词中所具有的汉字个数,并根据所述汉字个数确定所述待匹配名词的层级级数;读取所述待匹配名词中的目标汉字,并将各所述目标汉字和所述预设词链模型中的各分词集合对比,确定各所述目标汉字在各层级级数上的关联分词集合;将各所述关联分词集合基于所述层级级数进行合并,生成所述待匹配名词在各层级级数上的第一分词集合。3.如权利要求2所述的名词匹配方法,其特征在于,所述在所述第一分词集合和各所述第二分词集合之间分别生成并集集合,并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比,生成各第一对比结果和各第二对比结果的步骤包括:将所述第一分词集合分别和各所述第二分词集合基于各所述层级级数进行合并操作,生成各个并集集合;针对每一个并集集合执行如下步骤:基于所述层级级数读取所述并集集合中的各标准分词,形成在各所述层级级数上的分词序列,逐一将在各所述层级级数上所述分词序列中的各标准分词和所述待匹配名词对比,生成所述待匹配名词在各所述层级级数上的第一对比结果;逐一将在各所述层级级数上所述分词序列中的各标准分词和所述并集集合对应的标准词对比,生成所述标准词在各所述层级级数上的第二对比结果。4.如权利要求3所述的名词匹配方法,其特征在于,所述逐一将在各所述层级级数上所述分词序列中的各标准分词和所述待匹配名词对比,生成所述待匹配名词在各所述层级级数上的第一对比结果的步骤包括:基于所述层级级数将所述分词序列中的各标准分词分别和所述待匹配名词对比,判断所述分词序列中的各标准分词是否存在于所述待匹配名词中;若所述分词序列中的标准分词存在于所述待匹配名词中,则生成第一分词值,并将所述第一分词值配置到所述分词序列中该标准分词所在的位置;若所述分词序列中的标准分词不存在于所述待匹配名词中,则生成第二分词值,并将所述第二分词值配置到所述分词序列中该标准分词所在的位置;在检测到各所述层级级数上的所述分词序列中各标准分词均和所述待匹配名词对比完成后,基于所述层级级数将配置到所述分词序列中各位置的所述第一分词值和所述第二分词值,形成所述待匹配名词在各所述层级级数上...

【专利技术属性】
技术研发人员:黄越陈明东
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1