数据搜索方法、系统、设备及存储介质技术方案

技术编号:36607482 阅读:11 留言:0更新日期:2023-02-04 18:32
本申请提供了一种数据搜索方法、系统、设备及存储介质,通过根据药品说明书文档建立药品索引数据库;根据用户搜索内容搜索药品索引数据库,得到索引排序以及索引排序靠前的多种选定药品的药品说明书文档集;根据多种选定药品的药品说明书文档集以及用户搜索内容,计算多种选定药品的匹配权重;根据匹配权重,从多种选定药品中选定搜索的药品。本申请基于药品的说明书文档进行数据处理作为搜索索引基础,大大提高了药品搜索匹配效率和精准性。大大提高了药品搜索匹配效率和精准性。大大提高了药品搜索匹配效率和精准性。

【技术实现步骤摘要】
数据搜索方法、系统、设备及存储介质


[0001]本申请属于数据分析
,具体地,涉及一种数据搜索方法、系统、设备及存储介质。

技术介绍

[0002]随着互联网电商业务的快速发展,医药电商也日渐发展起来。目前,将医药领域和电子商务模式领域相结合是医药行业的发展趋势。在医药电商交易上线时,每个卖家都有自己设定的一套商品价格体系,因此对于相同的商品,针对不同的买家的不同注册区域,不同经营范围、不同类别以及不同分级的客户,显示的商品和价格也不同。
[0003]当线下药店需要开启药品网售时,需要将自己的商品信息上架到第三方平台,但是在上架药品之前,每个平台都要求必须先把药品信息导入到对应平台的数据库中,然后再去设定价格等信息。目前各大电商平台都有自己的标准药品库,如何准确、快速匹配到标准药品库中的药品,是目前医药电商用户亟待解决的问题。

技术实现思路

[0004]本专利技术提出的数据搜索方法、系统、设备及存储介质,基于药品的说明书文档进行数据处理作为搜索索引基础,大大提高了药品搜索匹配效率和精准性,提高了商家上架药品以及用户搜索药品的方便性以及快捷性。
[0005]根据本申请实施例的第一个方面,提供了一种数据搜索方法,包括以下步骤:
[0006]根据药品说明书文档建立药品索引数据库;
[0007]根据用户搜索内容搜索药品索引数据库,得到索引排序以及索引排序靠前的多种选定药品的药品说明书文档集;
[0008]根据多种选定药品的药品说明书文档集以及用户搜索内容,计算多种选定药品的匹配权重;
[0009]根据匹配权重,从多种选定药品中选定搜索的药品。
[0010]在本申请一些实施方式中,根据药品说明书建立药品索引数据库,具体包括:
[0011]将每一份药品说明书文档进行编号,得到带有药品文档编号的药品索引数据库,并存储;
[0012]将每一份药品说明书文档按照药品要素进行分类标记,得到带有药品要素分类编号的药品索引数据库,并存储;
[0013]通过lucene搜索引擎,汇总带有药品文档编号以及药品要素分类编号的药品索引数据库,得到药品索引数据库。
[0014]在本申请一些实施方式中,将每一份药品说明书文档按照药品要素进行分类标记,得到带有药品要素分类编号的药品索引数据库,具体包括:
[0015]归纳汇总药品要素并编号;药品要素包括药品名称、成份、性状、适应症、禁忌、有效期、批准文号和/或生产企业;
[0016]根据药品要素以及分词系统,对每一份药品说明书文档进行切词,得到每一份药品说明书文档的多个词条;
[0017]将每一份药品说明书文档的多个词条进行分类标记,得到带有药品要素分类编号的药品索引数据库。
[0018]在本申请一些实施方式中,根据用户搜索内容搜索药品索引数据库,得到索引排序以及索引排序靠前的多种选定药品的药品说明书文档集,具体包括:
[0019]根据用户搜索内容,进行切词,得到搜索词条;
[0020]根据搜索词条,搜索药品索引数据库,得到索引排序以及索引排序靠前的多种选定药品的药品说明书文档集。
[0021]在本申请一些实施方式中,根据多种选定药品的药品说明书文档集以及用户搜索内容,计算多种选定药品的匹配权重,具体包括:
[0022]根据选定药品的药品说明书文档,计算选定药品的每一个药品要素与用户搜索内容的相关性,得到选定药品的相关性矩阵;
[0023]根据选定药品的相关性矩阵以及每一个药品要素对应的权重,计算得到选定药品的相关性分数;
[0024]汇总每一种选定药品的相关性分数并排序,得到目标药品。
[0025]在本申请一些实施方式中,根据选定药品的药品说明书文档,计算选定药品的每一个药品要素与用户搜索内容的相关性,得到选定药品的相关性矩阵,具体包括:
[0026]根据用户搜索内容,进行切词,得到搜索词条;
[0027]计算选定药品的每一个药品要素与搜索词条的相关性分值,得到所有药品要素与搜索词条的相关性分值,汇总得到该选定药品的相关性矩阵。
[0028]在本申请一些实施方式中,计算选定药品的每一个药品要素与搜索词条的相关性分值,具体包括:
[0029]根据搜索词条以及每一个药品要素得到第一权重向量;
[0030]根据选定药品的目标药品说明书文档,得到第二权重向量;
[0031]计算第一权重向量以及第二权重向量的夹角的余弦值,得到目标药品说明书文档中每一个目标药品要素与搜索词条的相关性分值。
[0032]根据本申请实施例的第二个方面,提供了一种数据搜索系统,具体包括:
[0033]药品索引数据库单元:用于根据药品说明书文档建立药品索引数据库;
[0034]第一搜索单元:用于根据用户搜索内容搜索药品索引数据库,得到索引排序以及索引排序靠前的多种选定药品的药品说明书文档集;
[0035]匹配权重单元:用于根据多种选定药品的药品说明书文档集以及用户搜索内容,计算多种选定药品的匹配权重;
[0036]第二搜索单元:用于根据匹配权重,从多种选定药品中选定搜索的药品。
[0037]根据本申请实施例的第三个方面,提供了一种数据搜索设备,包括:
[0038]存储器:用于存储可执行指令;以及
[0039]处理器:用于与存储器连接以执行可执行指令从而完成数据搜索方法。
[0040]根据本申请实施例的第四个方面,提供了一种计算机可读存储介质,其上存储有计算机程序;计算机程序被处理器执行以实现数据搜索方法。
[0041]采用本申请的数据搜索方法、系统、设备及存储介质,通过根据药品说明书文档建立药品索引数据库;根据用户搜索内容搜索药品索引数据库,得到索引排序以及索引排序靠前的多种选定药品的药品说明书文档集;根据多种选定药品的药品说明书文档集以及用户搜索内容,计算多种选定药品的匹配权重;根据匹配权重,从多种选定药品中选定搜索的药品。本申请基于药品的说明书文档进行数据处理作为搜索索引基础,大大提高了药品搜索匹配效率和精准性,提高了商家上架药品以及用户搜索药品的方便性以及快捷性。
附图说明
[0042]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0043]图1中示出了根据本申请实施例的数据搜索方法的步骤示意图;
[0044]图2中示出了根据本申请实施例中建立药品索引数据库的步骤示意图;
[0045]图3中示出了根据本申请实施例中倒排索引表的示例图;
[0046]图4中示出了根据本申请实施例中计算多种选定药品的匹配权重的步骤示意图;
[0047]图5中示出了根据本申请实施例中每一个目标药品要素与搜索词条的相关性分值的示例图;
[0048]图6中示出了根据本申请实施例的数据搜索系统的结构示意图;...

【技术保护点】

【技术特征摘要】
1.一种数据搜索方法,其特征在于,包括:根据药品说明书文档建立药品索引数据库;根据用户搜索内容搜索所述药品索引数据库,得到索引排序以及索引排序靠前的多种选定药品的药品说明书文档集;根据所述多种选定药品的药品说明书文档集以及所述用户搜索内容,计算所述多种选定药品的匹配权重;根据所述匹配权重,从所述多种选定药品中选定搜索的药品。2.根据权利要求1所述的数据搜索方法,其特征在于,所述根据药品说明书建立药品索引数据库,具体包括:将每一份药品说明书文档进行编号,得到带有药品文档编号的药品索引数据库,并存储;将每一份药品说明书文档按照药品要素进行分类标记,得到带有药品要素分类编号的药品索引数据库,并存储;通过lucene搜索引擎,汇总所述带有药品文档编号以及药品要素分类编号的药品索引数据库,得到药品索引数据库。3.根据权利要求2所述的数据搜索方法,其特征在于,所述将每一份药品说明书文档按照药品要素进行分类标记,得到带有药品要素分类编号的药品索引数据库,具体包括:归纳汇总药品要素并编号;所述药品要素包括药品名称、成份、性状、适应症、禁忌、有效期、批准文号和/或生产企业;根据所述药品要素以及分词系统,对每一份药品说明书文档进行切词,得到每一份药品说明书文档的多个词条;将每一份药品说明书文档的多个词条进行分类标记,得到带有药品要素分类编号的药品索引数据库。4.根据权利要求1所述的数据搜索方法,其特征在于,所述根据用户搜索内容搜索所述药品索引数据库,得到索引排序以及索引排序靠前的多种选定药品的药品说明书文档集,具体包括:根据所述用户搜索内容,进行切词,得到搜索词条;根据所述搜索词条,搜索所述药品索引数据库,得到索引排序以及索引排序靠前的多种选定药品的药品说明书文档集。5.根据权利要求1所述的数据搜索方法,其特征在于,所述根据所述多种选定药品的药品说明书文档集以及所述用户搜索内容,计算所述多种选定药品的匹配权重,具体包括:根据选定药品的药品说明书文档,计算选定药品的每一个药品要素与所述...

【专利技术属性】
技术研发人员:高永
申请(专利权)人:康键信息技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1