【技术实现步骤摘要】
一种复合数据项标签的通用数据源访问方法及装置
本专利技术涉及计算机
,尤其涉及一种复合数据项标签的通用数据源访问方法及装置。
技术介绍
近年来,随着大数据风控技术的不断完善,为了提升模型准确率,商户需要从不同数据源获取更多的数据作为模型变量,为了提高效率和降低成本,一般都会选择从数据服务平台获取数据。而数据服务平台,作为一个中间平台,参见图3,会外接很多(第三方)数据源,这些数据源可以为平台提供相同或不同的数据项。目前,现有技术提供的数据源访问方法主要是考虑到当前访问数据源和历史访问数据源的评判参量发生变化时候采用不同的策略,主要是基于业务的通过率等简单指标来进行数据源访问。现有技术没有考虑到如果用户终端发送的是复合数据标签需求,这些标签可以从单一数据源获取,也可以从多个不同的数据源获取后进行组合;如何考虑从单一和数据源组合中选择优选的访问方式和访问顺序,以满足商户对于减少超时时间、降低数据源成本、提升访问成功率的要求,是非常有意义的。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种复合数据项标签的通用数据源访问方法及装置。本专利技术实施例提供一种复合数据项标签的通用数据源访问方法,包括:接收用户终端发送的数据获取请求,读取所述数据获取请求中的数据属性字段、最高成本上限MaxMoney和最长返回时间MaxTime,其中,所述数据属性字段包含至少两个数据项标签;在所有数据源中寻找含有所述数据属性字段中所有数据项标签的数据源,以及在所有数据源中寻找含有所述数据属性字段中部分数据项标签的不同数据源组合成的数据源组合,所述数据源组合包括所述数据属 ...
【技术保护点】
1.一种复合数据项标签的通用数据源访问方法,其特征在于,包括:接收用户终端发送的数据获取请求,读取所述数据获取请求中的数据属性字段、最高成本上限MaxMoney和最长返回时间MaxTime,其中,所述数据属性字段包含至少两个数据项标签;在所有数据源中寻找含有所述数据属性字段中所有数据项标签的数据源,以及在所有数据源中寻找含有所述数据属性字段中部分数据项标签的不同数据源组合成的数据源组合,所述数据源组合包括所述数据属性字段中所有数据项标签,将所有寻找的数据源和数据源组合组成第一数据源集合;基于所读取的MaxMoney和MaxTime,按照预设通用数据源访问策略,所述预设通用数据源访问策略考虑时间和成本,在第一数据源集合中挑选独立的数据源或数据源组合发送本次数据访问请求;接收所挑选的独立的数据源或数据源组合返回的本次数据访问的结果,若访问成功,则将本次数据访问的结果发送给用户终端。
【技术特征摘要】
1.一种复合数据项标签的通用数据源访问方法,其特征在于,包括:接收用户终端发送的数据获取请求,读取所述数据获取请求中的数据属性字段、最高成本上限MaxMoney和最长返回时间MaxTime,其中,所述数据属性字段包含至少两个数据项标签;在所有数据源中寻找含有所述数据属性字段中所有数据项标签的数据源,以及在所有数据源中寻找含有所述数据属性字段中部分数据项标签的不同数据源组合成的数据源组合,所述数据源组合包括所述数据属性字段中所有数据项标签,将所有寻找的数据源和数据源组合组成第一数据源集合;基于所读取的MaxMoney和MaxTime,按照预设通用数据源访问策略,所述预设通用数据源访问策略考虑时间和成本,在第一数据源集合中挑选独立的数据源或数据源组合发送本次数据访问请求;接收所挑选的独立的数据源或数据源组合返回的本次数据访问的结果,若访问成功,则将本次数据访问的结果发送给用户终端。2.根据权利要求1所述的复合数据项标签的通用数据源访问方法,其特征在于,基于所读取的MaxMoney和MaxTime,按照预设通用数据源访问策略,所述预设通用数据源访问策略考虑时间和成本,在第一数据源集合中挑选独立的数据源或数据源组合发送本次数据访问请求,包括:对于第一数据源集合中每个独立的数据源或数据源组合中的每个数据源,判断所述数据源对应的访问状态属性列表List的总数是否大于所述数据源预设的每秒最大访问频次TopTPS,若否,则确定所述数据源可以访问,将第一数据源集合中所有可以访问的独立的数据源或数据源组合加入第二数据源集合;对于第二数据源集合中每个独立的数据源或数据源组合中的每个数据源,根据所述数据源的访问状态属性列表List,获取所述数据源在过去一秒内的平均访问成功比例AvgSucc,判断所述AvgSucc是否小于预设阈值,若否,则保留所述数据源,将第二数据源集合中本次保留的独立的数据源或数据源组合加入第三数据源集合;获取所述第三数据源集合中每个独立的数据源含有所述数据属性字段中数据项标签的价格,并获取所述第三数据源集合中每个数据源组合含有所述数据属性字段中数据项标签的价格总和,将所述第三数据源集合中含有所述数据属性字段中数据项标签的价格小于所述MaxMoney的独立的数据源和所述第三数据源集合中含有所述数据属性字段中数据项标签的价格总和小于所述MaxMoney的数据源组合,组成第四数据源集合;对于第四数据源集合中每个独立的数据源或每个数据源组合,根据每个数据源的访问状态属性列表List,获取每个数据源在过去一秒内的平均访问时间AvgTime访问属性对应的价格Price,根据第四数据源集合中每个数据源的AvgTime,获取所述第四数据源集合中每个独立的数据源或每个数据源组合的总耗费时间TotalTime,根据当前数据平台的平均被商户请求TPS和数据平台的峰值容量TPS,获取本次向数据源请求的最高预估允许访问时间EstimateTime,判断所述TotalTime是否小于MaxTime的同时小于EstimateTime,若是,则将所述独立的数据源或数据源组合加入第五数据源集合;在所述第五数据源集合中,挑选Price最低的独立的数据源或数据源组合发送本次数据访问请求。3.根据权利要求1所述的复合数据项标签的通用数据源访问方法,其特征在于,在接收所挑选的独立的数据源或数据源组合返回的本次数据访问的结果之后,所述方法还包括:根据所述本次数据访问的结果,生成一个本次访问的状态属性对象,所述本次访问的状态属性对象,包括:本次访问是否成功和本次访问的耗费时间,将生成的本次访问的状态属性对象加入所挑选的独立的数据源或数据源组合所对应的访问状态属性列表List。4.根据权利要求3所述的复合数据项标签的通用数据源访问方法,其特征在于,在将生成的本次访问的状态属性对象加入所挑选的独立的数据源或数据源组合所对应的访问状态属性列表List之后,所述方法还包括:在预设数据生存时间TTL之后,所挑选的独立的数据源或数据源组合所对应的访问状态属性列表List中所加入的本次访问的状态属性对象被自动清除。5.根据权利要求2所述的复合数据项标签的通用数据源访问方法,其特征在于,在接收所挑选的独立的数据源或数据源组合返回的本次数据访问的结果之后,所述方法还包括:若访问失败,则判断本次的访问时间ProcessTime是否大于MaxTime;若本次的访问时间ProcessTime小于等于MaxTime,则将所述MaxTime减去ProcessTime,获得剩余允许时间LeftTime,在所述第五数据源集合中选择AvgTime小于LeftTime的数据源,从当前选择的数据源中挑选Price最低的数据源,针对当前挑选的Price最低的数据源,返回执行所述根据每个数据源的访问状态属性列表List,获取每个数据源在过去一秒内的平均访问时间AvgTime访问属性对应的价格Price的步骤;若本次的访问时间ProcessTime大于MaxTime,则获取数据失败,将获取数据失败的信息发送给所述用户终端。6.根据权利要求2所述的复合数据项标签的通用数据源访问方法,其特征在于,在判断所述数据源对应的访问状态属性列表List的总数是否大于所述数据源对应预设的每秒最大访问频次TopTPS之后,所述方法还包括:若所述数据源对应的访问状态属性列表List的总数大于所述数据源预设的TopTPS,则不访问所述数据源。7.根据权利要求2所述的复合数据项标签的通用数据源访问方法,其特征在于,在判断所述AvgSucc是否小于预设阈值之后,所述方法还包括:若所述AvgSucc小于预设阈值,则将所述数据源抛弃。8.根据权利要求2所述的复合数据项标签的通用数据源访问方法,其特征在于,在判断所述TotalTime是否小于MaxTime的同时小于EstimateTime之后,所述方法还包括:若所述TotalTime不满足小于MaxTime的同时小于EstimateTime,则将所述独立的数据源或数据源组合抛弃。9.一种复合数据项标签的通用数据源访问装置,其特征在于,包括:第一接收模块,用于接收用户终端发送的数据获取请求,读取所述数据获取...
【专利技术属性】
技术研发人员:张惠亮,李贲,吴锋海,刘胜,
申请(专利权)人:联动优势科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。