【技术实现步骤摘要】
含有重合数据项标签的数据源优选访问路径方法及装置
本专利技术涉及计算机
,尤其涉及一种含有重合数据项标签的数据源优选访问路径方法及装置。
技术介绍
近年来,随着大数据风控技术的不断完善,为了提升模型准确率,商户需要从不同数据源获取更多的数据作为模型变量,为了提高效率和降低成本,一般都会选择从数据服务平台获取数据。而数据服务平台,作为一个中间平台,参见图3,会外接很多(第三方)数据源,这些数据源可以为平台提供相同或不同的数据项。现有技术对于用户终端发送的数据获取请求中数据属性字段包含至少两个数据项标签的情况,提供了多数据源访问方法,能够基本满足数据源TPS(TransactionPerSecond,每秒执行的事务数量)、满足商户对于超时时间、降低数据源成本以提升平台整体收益的要求。但是,现有技术对于在数据源访问过程中所寻找的数据源组合(所述数据源组合由含有部分数据项标签的数据源组成)中有重复数据项标签的情况,并没有提供一种数据源访问的解决方案,即当已知所选择的数据源组合存在重复标签,如何选择优选数据标签的数据源优选访问路径方法,以提升访问成功率。
技术实现思路
针对现有技术存在的问题,本专利技术实施例提供一种含有重合数据项标签的数据源优选访问路径方法及装置。本专利技术实施例提供一种含有重合数据项标签的数据源优选访问路径方法,包括:接收用户终端发送的数据获取请求,读取所述数据获取请求中的数据属性字段、最高成本上限MaxMoney和最长返回时间MaxTime,其中,所述数据属性字段包含至少两个数据项标签;在所有数据源中寻找含有所述数据属性字段中所有数据项标签的 ...
【技术保护点】
1.一种含有重合数据项标签的数据源优选访问路径方法,其特征在于,包括:接收用户终端发送的数据获取请求,读取所述数据获取请求中的数据属性字段、最高成本上限MaxMoney和最长返回时间MaxTime,其中,所述数据属性字段包含至少两个数据项标签;在所有数据源中寻找含有所述数据属性字段中所有数据项标签的数据源,以及在所有数据源中寻找含有所述数据属性字段中部分数据项标签的不同数据源组合成的数据源组合,所述数据源组合包括所述数据属性字段中所有数据项标签且包括重复的数据项标签,将所有寻找的数据源和数据源组合组成第一数据源集合;基于所读取的MaxMoney和MaxTime,按照预设数据源优选访问路径策略,所述预设数据源优选访问路径策略考虑时间、成本、访问数据源的优先级并根据后续的访问方式的作为优选获取标签组合,在第一数据源集合中挑选独立的数据源或数据源组合发送本次数据访问请求;接收所挑选的独立的数据源或数据源组合返回的本次数据访问的结果,若访问成功,则将本次数据访问的结果发送给用户终端。
【技术特征摘要】
1.一种含有重合数据项标签的数据源优选访问路径方法,其特征在于,包括:接收用户终端发送的数据获取请求,读取所述数据获取请求中的数据属性字段、最高成本上限MaxMoney和最长返回时间MaxTime,其中,所述数据属性字段包含至少两个数据项标签;在所有数据源中寻找含有所述数据属性字段中所有数据项标签的数据源,以及在所有数据源中寻找含有所述数据属性字段中部分数据项标签的不同数据源组合成的数据源组合,所述数据源组合包括所述数据属性字段中所有数据项标签且包括重复的数据项标签,将所有寻找的数据源和数据源组合组成第一数据源集合;基于所读取的MaxMoney和MaxTime,按照预设数据源优选访问路径策略,所述预设数据源优选访问路径策略考虑时间、成本、访问数据源的优先级并根据后续的访问方式的作为优选获取标签组合,在第一数据源集合中挑选独立的数据源或数据源组合发送本次数据访问请求;接收所挑选的独立的数据源或数据源组合返回的本次数据访问的结果,若访问成功,则将本次数据访问的结果发送给用户终端。2.根据权利要求1所述的含有重合数据项标签的数据源优选访问路径方法,其特征在于,所述预设数据源优选访问路径策略,包括:对于第一数据源集合中每个独立的数据源或数据源组合中的每个数据源,判断是否超过每秒最大访问频次TopTPS,若否,则确定所述数据源可以访问,将第一数据源集合中所有可以访问的独立的数据源或数据源组合加入第二数据源集合;对于第二数据源集合中每个独立的数据源或数据源组合中的每个数据源,判断过去一秒内的平均访问成功比例AvgSucc是否小于预设阈值,若否,则保留所述数据源,将第二数据源集合中本次保留的独立的数据源或数据源组合加入第三数据源集合;获取所述第三数据源集合中含有所述数据属性字段中数据项标签的价格小于所述MaxMoney的独立的数据源和所述第三数据源集合中含有所述数据属性字段中数据项标签的价格总和小于所述MaxMoney的数据源组合,组成第四数据源集合;对第四数据源集合中的独立的数据源和数据源组合,按照数据源个数进行分组,同时将数据源个数相同的小组中含有最多组合的子数据源排在前面,列为优先访问数据源。3.根据权利要求2所述的含有重合数据项标签的数据源优选访问路径方法,其特征在于,所述预设数据源优选访问路径策略,还包括:在优先访问数据源包括多种数据项标签路径时,若首次从优先访问数据源获取某一数据项标签后,后续具有的不同的继续访问方式最多,则将本次获取的数据项标签作为本次获取数据项标签;当有两种获取数据项标签方式的后续有相同数量个不同的继续访问方式时,选择所述两种获取数据项标签方式中价格较低的数据项标签作为本次获取数据项标签。4.根据权利要求1所述的含有重合数据项标签的数据源优选访问路径方法,其特征在于,在接收所挑选的独立的数据源或数据源组合返回的本次数据访问的结果之后,所述方法还包括:根据所述本次数据访问的结果,生成一个本次访问的状态属性对象,所述本次访问的状态属性对象,包括:本次访问是否成功和本次访问的耗费时间,将生成的本次访问的状态属性对象加入所挑选的数据源或数据源组合所对应的访问状态属性列表List。5.根据权利要求4所述的含有重合数据项标签的数据源优选访问路径方法,其特征在于,在将生成的本次访问的状态属性对象加入所挑选的数据源或数据源组合所对应的访问状态属性列表List之后,所述方法还包括:在预设数据生存时间TTL之后,所挑选的数据源或数据源组合所对应的访问状态属性列表List中所加入的本次访问的状态属性对象被自动清除。6.根据权利要求3所述的含有重合数据项标签的数据源优选访问路径方法,其特征在于,在接收所挑选的独立的数据源或数据源组合返回的本次数据访问的结果之后,所述方法还包括:若访问失败,则判断本次的访问时间ProcessTime是否大于MaxTime;若本次的访问时间ProcessTime小于等于MaxTime,则将所述MaxTime减去ProcessTime,获得剩余允许时间LeftTime,在所述第四数据源集合中选择AvgTime小于LeftTime的数据源,从当前选择的数据源中挑选含有数据项标签最多的数据源,发送数据访问请求;若本次的访问时间ProcessTime大于MaxTime,则获取数据失败,将获取数据失败的信息发送给所述用户终端。7.根据权利要求2所述的含有重合数据项标签的数据源优选访问路径方法,其特征在于,所述预设数据源优选访问路径策略,还包括:在对于第一数据源集合中每个独立的数据源或数据源组合中的每个数据源,判断是否超过每秒最大访问频次TopTPS之后,若第一数据源集合中每个独立的数据源或数据源组合中的每个数据源超过每秒最大访问频次TopTPS,则不访问所述数据源。8.根据权利要求2所述的含有重合数据项标签的数据源优选访问路径方法,其特征在于,所述预设数据源优选访问路径策略,还包括:在判断过去一秒内的平均访问成功比例AvgSucc是否小于预设阈值之后,若所述AvgSucc小于预设阈值,则将所述数据源抛弃。9.一种含有重合数据项标签的数据源优选访问路径装置,其特征在于,包括:第一接收模块,用于接收用户终端发送的数据获取请求,读取所述数据获取请求中的数据属性字段、最高成本上...
【专利技术属性】
技术研发人员:张惠亮,李贲,吴锋海,刘胜,
申请(专利权)人:联动优势科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。