药品索引方法、药品检索方法及系统技术方案

技术编号:24289745 阅读:15 留言:0更新日期:2020-05-26 20:05
本发明专利技术提供一种药品索引方法、药品检索方法及系统,属于信息检索技术领域。所述方法包括:获取不同属性分类的药品描述符集合,获取与每种属性分类对应的药品增量描述符集合;利用预设多模式匹配算法模型,按每种属性分类,结合药品描述符集合中药品标识符或药品增量描述符集合中药品标识符,构建与药品描述符集合中药品描述符和药品增量描述符集合中药品增量描述符对应的映射关系,通过映射关系,获得与每个属性分类下药品描述符对应的自动机;获取药品说明书数据的字符串集合,提取并利用字符串集合中药品描述符和药品标识符,索引药品说明书数据于药品说明书数据库,配置自动机通过映射关系与药品说明书数据库链接。本发明专利技术用于药品索引和检索。

Drug index method, drug search method and system

【技术实现步骤摘要】
药品索引方法、药品检索方法及系统
本专利技术涉及信息检索
,具体地涉及一种用于药品说明书的数据索引方法、一种用于药品说明书的数据检索方法、一种用于药品信息的系统、一种装置和一种计算机可读存储介质。
技术介绍
检索药品电子说明书已经越来越成为一个大众的需求,但检索结果常常不够准确。现有的技术维护一个药品说明书数据库,通过药品信息,搜索该药的电子版药品说明书,比如:检索仁和牌布洛芬缓释胶囊。出现结果可能是其它品牌的布洛芬缓释胶囊。这是因为在医药行业里,描述一个药品一般用药品通用名,但实际药品通用名并不能完整表达一个药品,多厂商可能生产同一款药品。即使同一厂商生产的同一款药,药品规格也会有差别,造成药品说明书上的一些差别,而一般的检索工具只是检索药品通用名,并不能精确检索到一款药,所以准确地查找一款药品的电子说明书并不容易。AC自动机是一种多模式匹配算法,其原理是利用KMP算法和trie树结构,高效的完成模式匹配。完成匹配后需要再加入最长字符串选择算法,挑出匹配结果里最长的字符串。比如:要把“地氯雷他定治疗过敏性鼻炎”这句话中的地氯雷他定抽取出来。首先使用AC自动机先把收集的每一个药品成分作为一个匹配模式,全部加载进AC自动机。然后,AC自动机匹配出这句话里的成分有:“地氯雷他定”和“氯雷他定”,这时用最长字符串选择算法,选出里面最长的字符串“地氯雷他定”。
技术实现思路
本专利技术的目的是提供一种药品索引方法、药品检索方法及系统,而现有技术使用药品批准文号(药品批准文号是药品监督管理部门批准,规定药品的唯一编号)确定该药的说明书,但是检索药品的批准文号常常获取不到或容易被遗忘,此时,将导致用户提供的药品信息无法精确匹配药品说明书。在检索药品说明书时,不同的人可能使用不同的表述,比如:拉米夫定片就有拉米夫定片,贺甘定,拉米夫定多种表述,需要设置合适的匹配方案才可保证查询的准确率。本专利技术是一种使用药品名称、规格、厂商综合匹配药品说明书的方案,最大限度提升检索药品的说明书准确率,既可以用于用户查询药品说明书,也可以用于医药系统查询药品说明书。为了实现上述目的,本专利技术实施例提供一种用于药品说明书的数据索引方法,该数据索引方法包括:S1)获取不同属性分类的药品描述符集合,并获取与每种属性分类对应的药品增量描述符集合,其中,所述药品增量描述符集合包括与所述药品描述符集合中药品标识符对应的别名描述符、同义词描述符和曾用名描述符;S2)利用预设多模式匹配算法模型,按每种属性分类,结合所述药品描述符集合中药品标识符或所述药品增量描述符集合中药品标识符,构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机;S3)获取药品说明书数据的字符串集合,提取并利用所述字符串集合中药品描述符和药品标识符,索引所述药品说明书数据于药品说明书数据库,然后配置所述自动机通过所述映射关系与所述药品说明书数据库链接,其中,所述字符串集合被配置为至少具有所有属性分类中部分的属性分类。可选的,步骤S1)中获取不同属性分类的药品描述符集合,具体为:确定当前药品,将所述当前药品的名属性,分类为病症属性分类、通用名属性分类、化学名属性分类、商品名属性分类和药品厂商属性分类;获取所述当前药品的名,再根据分类的名属性,对应所述当前药品的药品标识符,分别形成病症集合、通用名集合、化学名集合、商品名集合和药品厂商集合,将形成的集合作为不同属性分类的药品描述符集合。可选的,步骤S1)中获取与每种属性分类对应的药品增量描述符集合,包括:收集与分类的名属性对应的药品通用名别名词典、化学名别名词典、商品名别名词典、病症同义词词典和药品厂商曾用名及别名词典,将收集的归一化词典作为药品增量描述符集合。可选的,步骤S2)中构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机,具体为:将所述病症集合与所述病症同义词词典进行关联映射,将所述通用名集合与所述通用名别名词典进行关联映射,将所述化学名集合与所述化学名别名词典进行关联映射,以及将所述商品名集合与所述商品名别名词典进行关联映射,在关联映射完成后,分别获得病症映射关系、通用名映射关系、化学名映射关系和商品名映射关系;根据所述病症映射关系、所述通用名映射关系、所述化学名映射关系和所述商品名映射关系,分别构建病症自动机、通用名自动机、化学名自动机和商品名自动机。可选的,步骤S2)中构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机,具体为:对所述药品厂商集合中药品厂商名的字符串进行分割,再对分割后的字符串结合预设厂商名过滤规则进行过滤,利用过滤后得到的字符串更新所述药品厂商集合中药品厂商名;将所述药品厂商曾用名及别名词典与更新后的药品厂商集合进行关联映射,获得厂商名映射关系,根据所述厂商名映射关系,构建厂商名自动机。可选的,步骤S3)中在获取药品说明书数据的字符串集合之前,还包括:获取药品说明书的结构化数据,若所述结构化数据中与一个药品描述符(例如批准文号)对应的药品说明书为至少两个药品说明书,则根据所述至少两个药品说明书的不同修订时间,选取所述至少两个药品说明书中一个药品说明书与所述一个药品描述符对应;通过选取后的结构化数据,生成药品说明书数据。可选的,在通过选取后的结构化数据,生成药品说明书数据之前,还包括:若所述结构化数据中与一个药品描述符对应的药品说明书为至少两个药品说明书且具有相同修订时间,过滤所述至少两个药品说明书的空字符串,选取与所述至少两个药品说明书中剩余的、具有最长的字符串对应的药品说明书,作为所述一个药品描述符对应的药品说明书。可选的,步骤S3)中提取所述字符串集合中药品描述符和药品标识符,索引所述药品说明书数据于药品说明书数据库,具体为:至少选取所述属性分类中部分的属性分类,按所述部分的属性分类,提取所述字符串集合中关于批准文号、通用名、规格、化学名、商品名、药品厂商和适应病症的短字符串(相对药品说明书而言)集合,其中,通过预设正则模板提取所述字符串集合中批准文号的短字符串,通过所述病症自动机提取所述字符串集合中适应病症的短字符串;通过所述短字符串集合中短字符串和与所述药品说明书数据对应的药品标识符进行索引,并记录索引的短字符串和药品标识符、以及所述药品说明书数据于药品说明书数据库,其中,所述短字符串作为所述药品说明书数据的药品描述符。可选的,该数据索引方法还包括:S4)至少按照所有属性分类中部分的属性分类,配置用户输入字符串的字段类型,其中,所述字段类型被配置为至少具有批准文号、药品名称、规格、本文档来自技高网...

【技术保护点】
1.一种用于药品说明书的数据索引方法,其特征在于,该数据索引方法包括:/nS1)获取不同属性分类的药品描述符集合,并获取与每种属性分类对应的药品增量描述符集合,其中,所述药品增量描述符集合包括与所述药品描述符集合中药品标识符对应的别名描述符、同义词描述符和曾用名描述符;/nS2)利用预设多模式匹配算法模型,按每种属性分类,结合所述药品描述符集合中药品标识符或所述药品增量描述符集合中药品标识符,构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机;/nS3)获取药品说明书数据的字符串集合,提取并利用所述字符串集合中药品描述符和药品标识符,索引所述药品说明书数据于药品说明书数据库,然后配置所述自动机通过所述映射关系与所述药品说明书数据库链接。/n

【技术特征摘要】
1.一种用于药品说明书的数据索引方法,其特征在于,该数据索引方法包括:
S1)获取不同属性分类的药品描述符集合,并获取与每种属性分类对应的药品增量描述符集合,其中,所述药品增量描述符集合包括与所述药品描述符集合中药品标识符对应的别名描述符、同义词描述符和曾用名描述符;
S2)利用预设多模式匹配算法模型,按每种属性分类,结合所述药品描述符集合中药品标识符或所述药品增量描述符集合中药品标识符,构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机;
S3)获取药品说明书数据的字符串集合,提取并利用所述字符串集合中药品描述符和药品标识符,索引所述药品说明书数据于药品说明书数据库,然后配置所述自动机通过所述映射关系与所述药品说明书数据库链接。


2.根据权利要求1所述的用于药品说明书的数据索引方法,其特征在于,步骤S1)中获取不同属性分类的药品描述符集合,具体为:
确定当前药品,将所述当前药品的名属性,分类为病症属性分类、通用名属性分类、化学名属性分类、商品名属性分类和药品厂商属性分类;
获取所述当前药品的名,再根据分类的名属性,对应所述当前药品的药品标识符,分别形成病症集合、通用名集合、化学名集合、商品名集合和药品厂商集合,将形成的集合作为不同属性分类的药品描述符集合。


3.根据权利要求2所述的用于药品说明书的数据索引方法,其特征在于,步骤S1)中获取与每种属性分类对应的药品增量描述符集合,包括:
收集与分类的名属性对应的药品通用名别名词典、化学名别名词典、商品名别名词典、病症同义词词典和药品厂商曾用名及别名词典,将收集的归一化词典作为药品增量描述符集合。


4.根据权利要求3所述的用于药品说明书的数据索引方法,其特征在于,步骤S2)中构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机,具体为:
将所述病症集合与所述病症同义词词典进行关联映射,将所述通用名集合与所述通用名别名词典进行关联映射,将所述化学名集合与所述化学名别名词典进行关联映射,以及将所述商品名集合与所述商品名别名词典进行关联映射,在关联映射完成后,分别获得病症映射关系、通用名映射关系、化学名映射关系和商品名映射关系;
根据所述病症映射关系、所述通用名映射关系、所述化学名映射关系和所述商品名映射关系,分别构建病症自动机、通用名自动机、化学名自动机和商品名自动机。


5.根据权利要求3或4所述的用于药品说明书的数据索引方法,其特征在于,步骤S2)中构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机,具体为:
对所述药品厂商集合中药品厂商名的字符串进行分割,再对分割后的字符串结合预设厂商名过滤规则进行过滤,利用过滤后得到的字符串更新所述药品厂商集合中药品厂商名;
将所述药品厂商曾用名及别名词典与更新后的药品厂商集合进行关联映射,获得厂商名映射关系,根据所述厂商名映射关系,构建厂商名自动机。


6.根据权利要求1所述的用于药品...

【专利技术属性】
技术研发人员:刘大海
申请(专利权)人:北京左医健康技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1