名词匹配方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：21161780 阅读：25 留言：0更新日期：2019-05-22 08:29

本发明专利技术公开一种名词匹配方法、装置、设备及计算机可读存储介质，所述方法包括：当接收到待匹配名词时，将待匹配名词和预设词链模型对比，确定预设词链模型中与待匹配名词对应的第一分词集合；读取预设标准词库中的各标准词，并将各标准词逐一和预设词链模型对比，确定预设词链模型中与各标准词对应的第二分词集合；在第一分词集合和各第二分词集合之间分别生成并集集合，并调用各并集集合分别和待匹配名词以及各标准词对比，生成各第一对比结果和各第二对比结果；根据各第一对比结果和各第二对比结果，确定各标准词中与待匹配名词匹配的目标标准词，完成待匹配名词的匹配。通过待匹配名词与各标准词之间的相似度得分进行匹配，提高了匹配准确性。

Noun Matching Method, Device, Equipment and Computer Readable Storage Media

The invention discloses a noun matching method, device, device and computer readable storage medium. The method includes: when receiving a matching noun, comparing the matching noun and the presupposition word chain model, determining the first participle set corresponding to the matching noun in the presupposition word chain model, reading the standard words in the presupposition standard word library, and one by one and presupposition words. The second participle set corresponding to each standard word in the presupposed word chain model is determined by comparing the chain model; the union set is generated between the first participle set and each second participle set, and the union set is invoked to compare with the matched noun and each standard word separately to generate the first and second comparison results; according to the first comparison results and the second comparison results. The target standard words matched with the matched nouns in each standard word are determined, and the matching of the matched nouns is completed. The matching accuracy is improved by matching the similarity scores between the nouns to be matched and the standard words.

全部详细技术资料下载

【技术实现步骤摘要】
名词匹配方法、装置、设备及计算机可读存储介质
本专利技术主要涉及数据处理
，具体地说，涉及一种名词匹配方法、装置、设备及计算机可读存储介质。
技术介绍
医药领域中涉及到众多表征疾病名称、药品名称、诊断手段的标准词，且各标准词的长度不一，存在某些包含众多字的标准词；医疗人员在将该类包含众多字的标准词输入到就诊人员的病历时，通常写简称，或者省略其中的个别字。医疗机构为了对病历进行规范化管理或者医保机构在依据病历进行医保报销时，均需要先为其中简写或省略的名词匹配标准词。目前在对医药领域中简写或省略的名词匹配标准词时，通常将各标准词逐个和简写或省略的名词进行对比匹配；因简写或省略的名词以多种形式存在，而标准词则以固定形式存在，使得标准词不能准确的表征各简写或省略的名词含义，导致为简写或省略的名词所匹配的标准词不准确。
技术实现思路
本专利技术的主要目的是提供一种名词匹配方法、装置、设备及计算机可读存储介质，旨在解决现有技术中为医药领域中简写或省略的名词所匹配的标准词不准确的问题为实现上述目的，本专利技术提供一种名词匹配方法，所述名词匹配方法包括以下步骤：当接收到待匹配名词时，将所述待匹配名词和预设词链模型对比，确定所述预设词链模型中与所述待匹配名词对应的第一分词集合；读取预设标准词库中的各标准词，并将各所述标准词逐一和所述预设词链模型对比，确定所述预设词链模型中与各所述标准词对应的第二分词集合；在所述第一分词集合和各所述第二分词集合之间分别生成并集集合，并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比，生成各第一对比结果和各第二对比结果；根据各所述第...

【技术保护点】
1.一种名词匹配方法，其特征在于，所述名词匹配方法包括以下步骤：当接收到待匹配名词时，将所述待匹配名词和预设词链模型对比，确定所述预设词链模型中与所述待匹配名词对应的第一分词集合；读取预设标准词库中的各标准词，并将各所述标准词逐一和所述预设词链模型对比，确定所述预设词链模型中与各所述标准词对应的第二分词集合；在所述第一分词集合和各所述第二分词集合之间分别生成并集集合，并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比，生成各第一对比结果和各第二对比结果；根据各所述第一对比结果和各所述第二对比结果，确定各所述标准词中与所述待匹配名词匹配的目标标准词，完成所述待匹配名词的匹配。

【技术特征摘要】
1.一种名词匹配方法，其特征在于，所述名词匹配方法包括以下步骤：当接收到待匹配名词时，将所述待匹配名词和预设词链模型对比，确定所述预设词链模型中与所述待匹配名词对应的第一分词集合；读取预设标准词库中的各标准词，并将各所述标准词逐一和所述预设词链模型对比，确定所述预设词链模型中与各所述标准词对应的第二分词集合；在所述第一分词集合和各所述第二分词集合之间分别生成并集集合，并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比，生成各第一对比结果和各第二对比结果；根据各所述第一对比结果和各所述第二对比结果，确定各所述标准词中与所述待匹配名词匹配的目标标准词，完成所述待匹配名词的匹配。2.如权利要求1所述的名词匹配方法，其特征在于，所述将所述待匹配名词和预设词链模型对比，确定所述预设词链模型中与所述待匹配名词对应的第一分词集合的步骤包括：统计所述待匹配名词中所具有的汉字个数，并根据所述汉字个数确定所述待匹配名词的层级级数；读取所述待匹配名词中的目标汉字，并将各所述目标汉字和所述预设词链模型中的各分词集合对比，确定各所述目标汉字在各层级级数上的关联分词集合；将各所述关联分词集合基于所述层级级数进行合并，生成所述待匹配名词在各层级级数上的第一分词集合。3.如权利要求2所述的名词匹配方法，其特征在于，所述在所述第一分词集合和各所述第二分词集合之间分别生成并集集合，并调用各所述并集集合分别和所述待匹配名词以及各所述标准词对比，生成各第一对比结果和各第二对比结果的步骤包括：将所述第一分词集合分别和各所述第二分词集合基于各所述层级级数进行合并操作，生成各个并集集合；针对每一个并集集合执行如下步骤：基于所述层级级数读取所述并集集合中的各标准分词，形成在各所述层级级数上的分词序列，逐一将在各所述层级级数上所述分词序列中的各标准分词和所述待匹配名词对比，生成所述待匹配名词在各所述层级级数上的第一对比结果；逐一将在各所述层级级数上所述分词序列中的各标准分词和所述并集集合对应的标准词对比，生成所述标准词在各所述层级级数上的第二对比结果。4.如权利要求3所述的名词匹配方法，其特征在于，所述逐一将在各所述层级级数上所述分词序列中的各标准分词和所述待匹配名词对比，生成所述待匹配名词在各所述层级级数上的第一对比结果的步骤包括：基于所述层级级数将所述分词序列中的各标准分词分别和所述待匹配名词对比，判断所述分词序列中的各标准分词是否存在于所述待匹配名词中；若所述分词序列中的标准分词存在于所述待匹配名词中，则生成第一分词值，并将所述第一分词值配置到所述分词序列中该标准分词所在的位置；若所述分词序列中的标准分词不存在于所述待匹配名词中，则生成第二分词值，并将所述第二分词值配置到所述分词序列中该标准分词所在的位置；在检测到各所述层级级数上的所述分词序列中各标准分词均和所述待匹配名词对比完成后，基于所述层级级数将配置到所述分词序列中各位置的所述第一分词值和所述第二分词值，形成所述待匹配名词在各所述层级级数上...

【专利技术属性】
技术研发人员：黄越，陈明东，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人