【技术实现步骤摘要】
药品索引方法、药品检索方法及系统
本专利技术涉及信息检索
,具体地涉及一种用于药品说明书的数据索引方法、一种用于药品说明书的数据检索方法、一种用于药品信息的系统、一种装置和一种计算机可读存储介质。
技术介绍
检索药品电子说明书已经越来越成为一个大众的需求,但检索结果常常不够准确。现有的技术维护一个药品说明书数据库,通过药品信息,搜索该药的电子版药品说明书,比如:检索仁和牌布洛芬缓释胶囊。出现结果可能是其它品牌的布洛芬缓释胶囊。这是因为在医药行业里,描述一个药品一般用药品通用名,但实际药品通用名并不能完整表达一个药品,多厂商可能生产同一款药品。即使同一厂商生产的同一款药,药品规格也会有差别,造成药品说明书上的一些差别,而一般的检索工具只是检索药品通用名,并不能精确检索到一款药,所以准确地查找一款药品的电子说明书并不容易。AC自动机是一种多模式匹配算法,其原理是利用KMP算法和trie树结构,高效的完成模式匹配。完成匹配后需要再加入最长字符串选择算法,挑出匹配结果里最长的字符串。比如:要把“地氯雷他定治疗过敏性鼻炎”这句话中的地氯雷他定抽取出来。首先使用AC自动机先把收集的每一个药品成分作为一个匹配模式,全部加载进AC自动机。然后,AC自动机匹配出这句话里的成分有:“地氯雷他定”和“氯雷他定”,这时用最长字符串选择算法,选出里面最长的字符串“地氯雷他定”。
技术实现思路
本专利技术的目的是提供一种药品索引方法、药品检索方法及系统,而现有技术使用药品批准文号(药品批准文号是药品监督 ...
【技术保护点】
1.一种用于药品说明书的数据索引方法,其特征在于,该数据索引方法包括:/nS1)获取不同属性分类的药品描述符集合,并获取与每种属性分类对应的药品增量描述符集合,其中,所述药品增量描述符集合包括与所述药品描述符集合中药品标识符对应的别名描述符、同义词描述符和曾用名描述符;/nS2)利用预设多模式匹配算法模型,按每种属性分类,结合所述药品描述符集合中药品标识符或所述药品增量描述符集合中药品标识符,构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机;/nS3)获取药品说明书数据的字符串集合,提取并利用所述字符串集合中药品描述符和药品标识符,索引所述药品说明书数据于药品说明书数据库,然后配置所述自动机通过所述映射关系与所述药品说明书数据库链接。/n
【技术特征摘要】
1.一种用于药品说明书的数据索引方法,其特征在于,该数据索引方法包括:
S1)获取不同属性分类的药品描述符集合,并获取与每种属性分类对应的药品增量描述符集合,其中,所述药品增量描述符集合包括与所述药品描述符集合中药品标识符对应的别名描述符、同义词描述符和曾用名描述符;
S2)利用预设多模式匹配算法模型,按每种属性分类,结合所述药品描述符集合中药品标识符或所述药品增量描述符集合中药品标识符,构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机;
S3)获取药品说明书数据的字符串集合,提取并利用所述字符串集合中药品描述符和药品标识符,索引所述药品说明书数据于药品说明书数据库,然后配置所述自动机通过所述映射关系与所述药品说明书数据库链接。
2.根据权利要求1所述的用于药品说明书的数据索引方法,其特征在于,步骤S1)中获取不同属性分类的药品描述符集合,具体为:
确定当前药品,将所述当前药品的名属性,分类为病症属性分类、通用名属性分类、化学名属性分类、商品名属性分类和药品厂商属性分类;
获取所述当前药品的名,再根据分类的名属性,对应所述当前药品的药品标识符,分别形成病症集合、通用名集合、化学名集合、商品名集合和药品厂商集合,将形成的集合作为不同属性分类的药品描述符集合。
3.根据权利要求2所述的用于药品说明书的数据索引方法,其特征在于,步骤S1)中获取与每种属性分类对应的药品增量描述符集合,包括:
收集与分类的名属性对应的药品通用名别名词典、化学名别名词典、商品名别名词典、病症同义词词典和药品厂商曾用名及别名词典,将收集的归一化词典作为药品增量描述符集合。
4.根据权利要求3所述的用于药品说明书的数据索引方法,其特征在于,步骤S2)中构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机,具体为:
将所述病症集合与所述病症同义词词典进行关联映射,将所述通用名集合与所述通用名别名词典进行关联映射,将所述化学名集合与所述化学名别名词典进行关联映射,以及将所述商品名集合与所述商品名别名词典进行关联映射,在关联映射完成后,分别获得病症映射关系、通用名映射关系、化学名映射关系和商品名映射关系;
根据所述病症映射关系、所述通用名映射关系、所述化学名映射关系和所述商品名映射关系,分别构建病症自动机、通用名自动机、化学名自动机和商品名自动机。
5.根据权利要求3或4所述的用于药品说明书的数据索引方法,其特征在于,步骤S2)中构建与所述药品描述符集合中药品描述符和所述药品增量描述符集合中药品增量描述符对应的映射关系,再至少通过所述映射关系,获得与每个属性分类下药品描述符对应的自动机,具体为:
对所述药品厂商集合中药品厂商名的字符串进行分割,再对分割后的字符串结合预设厂商名过滤规则进行过滤,利用过滤后得到的字符串更新所述药品厂商集合中药品厂商名;
将所述药品厂商曾用名及别名词典与更新后的药品厂商集合进行关联映射,获得厂商名映射关系,根据所述厂商名映射关系,构建厂商名自动机。
6.根据权利要求1所述的用于药品...
【专利技术属性】
技术研发人员:刘大海,
申请(专利权)人:北京左医健康技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。