人工智能模型请求响应机制优化方法、系统、终端及介质技术方案

技术编号:32361919 阅读:36 留言:0更新日期:2022-02-20 03:30
本申请涉及一种人工智能模型请求响应机制优化方法、系统、终端以及存储介质。所述方法包括:获取当前人工智能模型请求的目标模型;采用频繁模式树筛选出能够与所述目标模型构成频繁模型组的至少一个其他人工智能模型;所述频繁模型组为同时使用次数大于设定频繁程度阈值的至少两个人工智能模型的组合;采用连带打包传输机制将所述目标模型以及所述至少一个其他人工智能模型打包传输至模型请求方。本申请在传输模型请求所需要的目标模型的同时,连带传输所有能够与该目标模型构成频繁模型组的其他模型,以避免在下一次响应模型请求时由于单个模型传输不可打包而造成的传输代价浪费,有效的降低了响应人工智能模型请求的代价成本。代价成本。代价成本。

【技术实现步骤摘要】
sequence.IEEE Transactions on Knowledge and Data Engineering 15,1487

1497.]中探索了在全连接网络环境下的离线单个请求的缓存优化方法。Wang等人在文献[Wang,Y.,He,S.,Fan,X.,Xu,C.,Culberson,J.,Horton,J.,2017.Data caching in next generation mobile cloud services,online vs.off

line,in:Parallel Processing(ICPP),2017 46th International Conference on,pp.412

421.]中提出将数据缓存问题延展至云服务器环境,并提出了对应的最优离线算法。然而上述方法都只能在离线状态下工作,且这些算法仅仅探索了包含一个模型的人工智能请求的缓存与传输问题,对于单个模型请求的缓存与传输方法具有较大的局限性。

技术实现思路

[0006]本申请提供了一种人工智能模型请求响应机本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种人工智能模型请求响应机制优化方法,其特征在于,包括:获取当前人工智能模型请求的目标模型;采用频繁模式树筛选出能够与所述目标模型构成频繁模型组的至少一个其他人工智能模型;所述频繁模型组为同时使用次数大于设定频繁程度阈值的至少两个人工智能模型的组合;采用连带打包传输机制将所述目标模型以及所述至少一个其他人工智能模型打包传输至模型请求方。2.根据权利要求1所述的人工智能模型请求响应机制优化方法,其特征在于,所述采用频繁模式树筛选出能够与所述目标模型构成频繁模型组的至少一个其他人工智能模型包括:将当前人工智能模型请求加入历史请求记录中;所述历史请求记录用于存储所有历史人工智能模型请求事件;从所述历史请求记录中筛选出所有的多模型请求事件,其中,所述多模型请求事件是指所请求的目标模型至少为两个的人工智能模型请求;构建频繁模式树,通过所述频繁模式树对筛选的多模型请求事件进行分析,并筛选出与所述目标模型同时使用次数大于频繁程度阈值的所有其他人工智能模型,将所述目标模型分别与至少一个其他人工智能模型进行组合,生成至少一个频繁模型组;返回所述目标模型的频繁模型组信息。3.根据权利要求2所述的人工智能模型请求响应机制优化方法,其特征在于,所述采用连带打包传输机制将所述目标模型以及所述至少一个其他人工智能模型打包传输至模型请求方具体为:判断所述频繁模型组信息对应的人工智能模型在云服务器本地是否存在可用的模型缓存副本,如果存在,利用所述本地的模型缓存副本响应当前人工智能模型请求;如果不存在,判断当前人工智能模型请求属于单模型请求还是多模型请求,如果是单模型请求,执行以下单模型请求处理过程:在拥有所述目标模型的任一分布式云服务器上计算所述目标模型的F集合,并复制所述目标模型以及F集合中的模型后,利用连带打包传输机制将所述目标模型以及F集合中的模型一起打包传输至模型请求方;其中,所述单模型请求是指所请求的目标模型仅包括一个,所述多模型请求是指所请求的目标模型包括至少两个;所述F集合是指在拥有目标模型的云服务器上存在的能与该目标模型构成频繁模型组且在当前云服务器本地没有缓存副本的人工智能模型的集合;如果是多模型请求,判断当前人工智能模型请求的至少两个目标模型中是否至少有一个目标模型不存在本地缓存副本,如果是,对所述不存在本地缓存副本的目标模型执行单模型请求处理过程;否则,判断当前人工智能模型请求的至少两个目标模型是否能够构成频繁模型组,如果不能,针对每一个目标模型分别执行一次单模型请求处理过程;如果可以,判断是否存在同时拥有所述至少两个目标模型的另一个云服务器,如果不存在,针对每一个目标模型分别执行一次单模型请求处理过程;如果存在,从所述同时拥有至少两个目标模型的另一个云服务器中获取至少两个目标模型以及对应的两个F集合,并获取两个F集合的并集,将所述两个目标模型以及F集合的并集中的全
部模型进行复制并连带打包传输至模型请求方。4.根据权利要求3所述的人工智能模型请求响应机制优化方法,其特征在于,所述采用连带打包传输机制将所述目标模型以及所述至少一个其他人工智能模型打包传输至模型请求方之后还包括:对于每一个新复制并传输的人工智能模型,在当前云服务器中更新...

【专利技术属性】
技术研发人员:吴嘉澍王洋须成忠叶可江
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1