当前位置: 首页 > 专利查询>四方联盟北京科技发展有限公司中网数安北京科技有限公司专利>正文

一种分布式AI服务引擎系统技术方案

技术编号：36934322 阅读：9 留言：0更新日期：2023-03-22 18:56

本发明专利技术提出了一种分布式AI服务引擎系统，包括原子服务层、引擎中控层和应用层，其中，原子服务层包括负载均衡器和多个AI服务实例，用于实现AI模型的推理能力；引擎中控层包括一个Leader节点和与Leader节点对应的多个Worker节点，用于创建表达式服务、调用表达式服务和更新缓存；其中Leader节点与Worker节点的内部包括功能决策模块、缓存模块、归并优化器、状态控制器、逻辑运算器、排序模块、存储服务模块、溢写模块；应用层，用于调用中控层提供的表达式构建和服务调用的功能。通过本发明专利技术提出的分布式AI服务引擎系统，有效的提高了服务开发效率、服务响应速度和减少了系统资源的浪费。服务响应速度和减少了系统资源的浪费。服务响应速度和减少了系统资源的浪费。

全部详细技术资料下载

【技术实现步骤摘要】
一种分布式AI服务引擎系统

[0001]本专利技术属于计算机

技术介绍

[0002]人工智能(AI)技术的出现对经济、教育、医疗等生活中的许多领域都产生了极其重要的意义。在传统的AI服务中，服务与服务之间是解耦的、独立的，因此很难细粒度的复用已有服务的AI原子能力生产新的服务。
[0003]现有的服务引擎可以实现服务的编排，即按服务的依赖关系依次调用服务。在现有技术方案中，使用可视化拖拽的方式构建了服务的依赖图，并配置图中节点和线的参数，交给代理去执行此依赖图，实现了服务的编排；或者将用户定义的编排结果中的组件转换为其预定义的QL表达式，按照组件间的依赖关系依次执行这些表达式，得到组件调用的结果。
[0004]这些技术方案可以满足对一般服务的编排，对于AI服务会存在重复调用导致的性能下降、依赖图过长导致的响应时间过长、服务编排产生的易用性等问题。
[0005]本专利技术在云环境下提出了一种分布式AI服务引擎，该引擎以表达式即服务方式实现了对已有服务AI原子能力的细粒度复用，并对表达式服务的构建、调用等方面进行了优化，有效的提高了服务开发效率以及服务响应速度和减少了系统资源的浪费。

技术实现思路

[0006]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0007]为此，本专利技术的目的在于提出一种分布式AI服务引擎系统，用于提高了服务开发效率、服务响应速度和减少了系统资源的浪费。
[0008]为达上述目的，本专利技术第一方面实施例提出了...

【技术保护点】

【技术特征摘要】
1.一种分布式AI服务引擎系统，其特征在于，包括原子服务层、引擎中控层和应用层，其中，所述原子服务层包括负载均衡器和多个AI服务实例，用于实现AI模型的推理能力；所述引擎中控层包括一个Leader节点和与所述Leader节点对应的多个Worker节点，用于创建表达式服务、调用表达式服务和更新缓存；其中所述Leader节点与所述Worker节点的内部包括功能决策模块、缓存模块、归并优化器、状态控制器、逻辑运算器、排序模块、存储服务模块、溢写模块；所述应用层，用于调用中控层提供的表达式构建和服务调用的功能。2.根据权利要求1所述的系统，其特征在于，所述引擎中控层用于创建表达式服务，包括：获取请求的Type字段；根据所述Type字段通过所述功能决策模块将所述请求转发给所述归并优化器；通过所述归并优化器进行归并优化，将优化的结果以配置文件的形式存储到所述存储服务模块中，完成表达式服务的创建过程。3.根据权利要求1所述的系统，其特征在于，所述引擎中控层用于调用表达式服务，包括：获取请求的Type字段；根据所述Type字段通过所述功能决策模块将所述请求转发给所述状态控制器；通过所述状态控制器...

【专利技术属性】
技术研发人员：鄂海红，王浩田，宋美娜，周晓阳，竹倩叶，魏文定，刘钟允，
申请(专利权)人：四方联盟北京科技发展有限公司中网数安北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人