目标数据确定方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:32228359 阅读:28 留言:0更新日期:2022-02-09 17:33
本说明书实施方式提供一种目标数据确定方法、装置、计算机设备、存储介质及计算机程序产品。该方法通过接收源数据和任务标识,并基于源数据生成查询关键词,实现对源数据的扩充,以召回更全面的结果集。进一步地,以所述任务标识指定的查询方式,在所述任务标识指定的机构数据集合中召回与所述查询关键词对应的执行结果集;从而在所述执行结果集中确定与所述源数据匹配的目标数据,提升数据匹配的准确性和灵活性,从而可以加速数据清洗的效率。从而可以加速数据清洗的效率。从而可以加速数据清洗的效率。

【技术实现步骤摘要】
目标数据确定方法、装置、计算机设备及存储介质


[0001]本说明书实施方式涉及医药行业数据处理
,具体涉及一种目标数据确定方法、装置、计算机设备、存储介质及计算机程序产品。

技术介绍

[0002]纵观多数工业型医药企业,采用的药品或者医疗器械的经典销售模式大概包括以下两种方式:自营、代理。在医药企业分销渠道中,准确的产品(比如药品或者医疗器械)流向数据已然成为医药企业进行决策与管控的依据。
[0003]医药企业可以收集流向数据,以供营销管理者了解每月各分销渠道中的库存数据以及市场终端的销量数据,从而制定适应于未来产品需求的销售计划。其中,医药企业所收集的流向数据具有数据量巨大、数据源多、数据质量不高等特点。

技术实现思路

[0004]有鉴于此,本说明书实施方式致力于提供一种目标数据确定方法、装置、计算机设备、存储介质及计算机程序产品,以解决传统技术中产品流向数据清洗过程中效率不高的技术问题。
[0005]本说明书实施方式提供了一种目标数据确定方法,所述方法包括:接收源数据和任务标识;其中,所述源数据用于表示本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种目标数据确定方法,其特征在于,所述方法包括:接收源数据和任务标识;其中,所述源数据用于表示药械机构实体的名称,且所述源数据用于生成查询关键词,所述任务标识用于指定机构数据集合和查询方式;以所述任务标识指定的查询方式,在所述任务标识指定的机构数据集合中召回与所述查询关键词对应的执行结果集;在所述执行结果集中确定与所述源数据匹配的目标数据。2.根据权利要求1所述的方法,其特征在于,所述执行结果集包括至少一个目标机构数据;所述在所述执行结果集中确定与所述源数据匹配的目标数据,包括:在所述执行结果集中,将与所述源数据相同的目标机构数据作为与所述源数据匹配的目标数据。3.根据权利要求1所述的方法,其特征在于,所述执行结果集包括至少一个目标机构数据;所述在所述执行结果集中确定与所述源数据匹配的目标数据,包括:获取所述源数据与任一目标机构数据之间的相似度;在所述相似度达到相似度阈值的情况下,将所述执行结果集中的所述任一目标机构数据作为与所述源数据匹配的目标数据。4.根据权利要求3所述的方法,其特征在于,所述任务标识还用于指定数据匹配规则,所述数据匹配规则中指定有数据字段,所述执行结果集是通过模糊查询方式而得到的;在所述获取所述源数据与任一目标机构数据之间的相似度之前,所述方法还包括:利用所述源数据与所述任一目标机构数据构建映射数据组;根据所述数据匹配规则中指定的数据字段,从所述映射数据组的源数据中提取相似度计算所需的第一目标字段;根据所述数据匹配规则中指定的数据字段,从所述映射数据组的任一目标机构数据中提取相似度计算所需的第二目标字段;获取所述第一目标字段与所述第二目标字段之间的编辑距离;所述获取所述源数据与任一目标机构数据之间的相似度,包括:根据所述编辑距离确定所述源数据与所述任一目标机构数据之间的相似度。5.根据权利要求4所述的方法,其特征在于,所述数据匹配规则划分为至少一个规则组;所述第一目标字段以及所述第二目标字段分别是根据任一规则组内的数据匹配规则中指定的数据字段而提取的;所述获取所述第一目标字段与所述第二目标字段之间的编辑距离,包括:根据所述第一目标字段与所述第二目标字段,计算所述任一规则组中各数据匹配规则所对应的编辑距离;根据所述任一规则组中各数据匹配规则所对应的编辑距...

【专利技术属性】
技术研发人员:杨锋易龙张玉琛
申请(专利权)人:上海软素科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1