词链模型的生成方法、装置、设备及计算机可读存储介质制造方法及图纸

技术编号：21115966 阅读：17 留言：0更新日期：2019-05-16 09:03

本发明专利技术公开一种词链模型的生成方法、装置、设备及计算机可读存储介质，所述方法包括：读取预设标准词库中的标准词以及与所述标准词对应的各目标分词，将各所述目标分词拆分为单个的目标汉字；根据所述预设标准词库中的各标准分词，确定各所述目标汉字在各层级上的字链模型，其中所述层级的级数与所述标准词中汉字的数量对应；将各所述目标汉字在各层级上的字链模型进行合并，生成所述标准词在各层级上的分词集合，并根据所述分词集合，形成所述标准词的词链模型。本方案将标准词依据划分的标准分词形成词链模型，通过词链模型中各标准分词之间的相关性实现对非标准词的匹配，简化了匹配操作，同时提高匹配的效率以及自动化程度。

全部详细技术资料下载

【技术实现步骤摘要】
词链模型的生成方法、装置、设备及计算机可读存储介质
本专利技术主要涉及数据处理
，具体地说，涉及一种词链模型的生成方法、装置、设备及计算机可读存储介质。
技术介绍
医药领域中涉及到众多表征疾病名称、药品名称、诊断手段的标准词，而市面上也涉及到多种表征标准词的非标准词；为了规范化管理，通常需要为各非标准词匹配对应的标准词；在匹配前将各标准词划分为各个分词，而通过各个分词实现对非标准词的匹配。在用各标准词的分词为非标准词匹配对应的标准词时，匹配的准确性与分词结果相关；因非标准词的形式多种多样，而分词的形式较为固定，使得在匹配的过程中需要针对不同的非标准词调整分词结果，来确保匹配的准确性。此调整的过程增加了匹配的复杂性，降低了匹配效率，匹配的自动化程度低。
技术实现思路
本专利技术的主要目的是提供一种词链模型的生成方法、装置、设备及计算机可读存储介质，旨在解决现有技术中通过调整分词结果来对非匹配词进行匹配，导致匹配过程复杂，匹配效率低的问题。为实现上述目的，本专利技术提供一种词链模型的生成方法，所述词链模型的生成方法包括以下步骤：读取预设标准词库中的标准词以及与所述标准词对应的各目标分词，将各所述目标分词拆分为单个的目标汉字；根据所述预设标准词库中的各标准分词，确定各所述目标汉字在各层级上的字链模型，其中所述层级的级数与所述标准词中汉字的数量对应；将各所述目标汉字在各层级上的字链模型进行合并，生成所述标准词在各层级上的分词集合，并根据所述分词集合，形成所述标准词的词链模型。优选地，所述根据所述预设标准词库中的各标准分词，确定各所述目标汉字在各层级上的字链模型的...

【技术保护点】
1.一种词链模型的生成方法，其特征在于，所述词链模型的生成方法包括以下步骤：读取预设标准词库中的标准词以及与所述标准词对应的各目标分词，将各所述目标分词拆分为单个的目标汉字；根据所述预设标准词库中的各标准分词，确定各所述目标汉字在各层级上的字链模型，其中所述层级的级数与所述标准词中汉字的数量对应；将各所述目标汉字在各层级上的字链模型进行合并，生成所述标准词在各层级上的分词集合，并根据所述分词集合，形成所述标准词的词链模型。

【技术特征摘要】
1.一种词链模型的生成方法，其特征在于，所述词链模型的生成方法包括以下步骤：读取预设标准词库中的标准词以及与所述标准词对应的各目标分词，将各所述目标分词拆分为单个的目标汉字；根据所述预设标准词库中的各标准分词，确定各所述目标汉字在各层级上的字链模型，其中所述层级的级数与所述标准词中汉字的数量对应；将各所述目标汉字在各层级上的字链模型进行合并，生成所述标准词在各层级上的分词集合，并根据所述分词集合，形成所述标准词的词链模型。2.如权利要求1所述的词链模型的生成方法，其特征在于，所述根据所述预设标准词库中的各标准分词，确定各所述目标汉字在各层级上的字链模型的步骤包括：将各所述目标汉字和各所述标准分词对比，确定包含各所述目标汉字的目标标准分词；统计各所述目标标准分词中所包括的汉字个数，将具有相同所述汉字个数的各目标标准分词形成各所述目标汉字在各层级上的字链模型。3.如权利要求2所述的词链模型的生成方法，其特征在于，所述将各所述目标汉字在各层级上的字链模型进行合并，生成所述标准词在各层级上的分词集合的步骤包括：读取各所述目标汉字所生成的各所述字链模型中在同一层级上的目标字链模型，并将各所述目标字链模型中所具有的所述目标标准分词进行合并，形成字链集合；判断所述字链集合中是否存在重复的所述目标标准分词，若存在重复的所述目标标准分词，则将重复的所述目标标准分词从所述字链集合中删除，并检测各所述目标汉字在各层级上是否均形成所述字链集合；若各所述目标汉字在各层级上均形成所述字链集合，则将各所述字链集合确定为所述标准词在各层级上的分词集合。4.如权利要求3所述的词链模型的生成方法，其特征在于，所述根据所述分词集合，形成所述标准词的词链模型的步骤包括：将所述标准词和各层级上分词集合中的目标标准分词对比，从各层级上的分词集合中确定包括各个数量所述目标汉字的目标分词集合；当所述目标分词集合中的目标标准分词包括所述目标汉字的数量和所述标准词中汉字数量一致时，将各所述目标分词集合形成所述标准词在各所述层级上的词链模型。5.如权利要求4所述的词链模型的生成方法，其特征在于，所述将具有相同所述汉字个数的各目标标准分词形成各所述目标汉字在各层级上的字链模型的步骤之后包括：判断所述目标汉字中是否存...

【专利技术属性】
技术研发人员：黄越，陈明东，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人