System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 流量分配方法、装置、计算机设备及存储介质制造方法及图纸_技高网

流量分配方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40278075 阅读:11 留言:0更新日期:2024-02-02 23:05
本发明专利技术涉及人工智能技术领域,公开了一种流量分配方法、装置、计算机设备及存储介质。该方法通过接收第一服务器组件响应于流量分配请求而发送的请求标识信息,并确定第一层流量区间;获取与第一层流量区间对应的目标模型名称信息并返回到第一服务器组件,以使第一服务器组件根据目标模型名称信息生成模型调用请求并发送到第二服务器组件;接收第二服务器组件响应于模型调用请求而发送的模型标识信息,并确定第二层流量区间;获取与第二层流量区间对应的目标模型参数信息并返回到第二服务器组件,以使第二服务器组件调用目标模型,并按照与第二层流量区间关联的第二流量比例对目标模型分配流量。本发明专利技术实现了定制化的流量分配,提高了搜索效率。

【技术实现步骤摘要】

本专利技术涉及人工智能,尤其涉及一种流量分配方法、装置、计算机设备及存储介质


技术介绍

1、常见问题解答(frequently asked questions,简称faq)是互联网上提供在线帮助的主要方式,通过事先组织一些常见的问题以及对应的答案构建问答知识库,并在网页上提供咨询服务。基于faq的智能问答在本质是一个搜索场景,搜索场景包括召回过程和排序过程,召回过程用于从问答知识库中快速召回与用户输入的查询词相关的候选问答集。

2、在搜索场景下通过搜索索引引擎进行索引召回时,使用的模型不同,计算规则也会有所差异。搜索索引引擎服务通过为不同模型分配不同的流量比例来计算faq召回分值,召回分值的分数越高代表匹配的问题越相近。现有的搜索索引引擎服务直接根据入参确定模型的种类,并不能根据搜索场景下的业务不同而实现最优的流量分配。例如,对特定搜索场景进行业务实验时,需要查询实验信息以判断准入以及限制流量,而现有在流量分配时不同的业务实验也可能出现相同的配置,导致流量分配不合理,进而影响搜索效率。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种流量分配方法、装置、计算机设备及存储介质,以解决现有的流量分配不合理,搜索效率低的问题。

2、一种流量分配方法,包括:

3、接收第一服务器组件响应于流量分配请求而发送的请求标识信息,并确定与所述请求标识信息对应的第一层流量区间;

4、获取与所述第一层流量区间对应的目标模型名称信息,将所述目标模型名称信息返回到所述第一服务器组件,以使所述第一服务器组件根据所述目标模型名称信息生成模型调用请求,并将所述模型调用请求发送到第二服务器组件;

5、接收所述第二服务器组件响应于所述模型调用请求而发送的模型标识信息,并确定与所述模型标识信息对应的第二层流量区间;

6、获取与所述第二层流量区间对应的目标模型参数信息,将所述目标模型参数信息返回到所述第二服务器组件,以使所述第二服务器组件根据所述目标模型名称信息和所述目标模型参数信息调用目标模型,并按照与所述第二层流量区间关联的第二流量比例对所述目标模型分配流量。

7、一种流量分配装置,包括:

8、第一流量区间确定模块,用于接收第一服务器组件响应于流量分配请求而发送的请求标识信息,并确定与所述请求标识信息对应的第一层流量区间;

9、第一组件处理模块,用于获取与所述第一层流量区间对应的目标模型名称信息,将所述目标模型名称信息返回到所述第一服务器组件,以使所述第一服务器组件根据所述目标模型名称信息生成模型调用请求,并将所述模型调用请求发送到第二服务器组件;

10、第二流量区间确定模块,用于接收所述第二服务器组件响应于所述模型调用请求而发送的模型标识信息,并确定与所述模型标识信息对应的第二层流量区间;

11、第二组件处理模块,用于获取与所述第二层流量区间对应的目标模型参数信息,将所述目标模型参数信息返回到所述第二服务器组件,以使所述第二服务器组件根据所述目标模型名称信息和所述目标模型参数信息调用目标模型,并按照与所述第二层流量区间关联的第二流量比例对所述目标模型分配流量。

12、一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现上述流量分配方法。

13、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如上述流量分配方法。

14、上述流量分配方法、装置、计算机设备及存储介质中,该方法基于服务端中的第一服务器组件、第二服务器组件和调度平台,通过调度平台与第一服务器组件之间,以及调度平台与第二服务器组件之间的信息接收和信息发送进行数据交互,既可以控制流量分配,使流量分配更加合理,又可以实现目标模型的适配,提高了搜索效率。此外,由于不同业务层对应了不同业务下的不同场景,不同流量区间对应了不同场景的流量需求,因此本专利技术的不同流量区间可以按需进行多样化配置,在满足各种各样业务场景的前提下灵活分配流量,实现了定制化的流量分配。

本文档来自技高网...

【技术保护点】

1.一种流量分配方法,其特征在于,包括:

2.如权利要求1所述的流量分配方法,其特征在于,所述接收第一服务器组件响应于流量分配请求而发送的请求标识信息之前,包括:

3.如权利要求1所述的流量分配方法,其特征在于,所述确定与所述请求标识信息对应的第一层流量区间之前,包括:

4.如权利要求3所述的流量分配方法,其特征在于,所述在各所述业务域组中设置与各所述业务场景信息关联的业务层级之后,包括:

5.如权利要求3所述的流量分配方法,其特征在于,所述请求标识信息包括用户标识信息和业务域标识信息;

6.如权利要求5所述的流量分配方法,其特征在于,所述基于所述用户标识信息,在所述第一业务层中获取与其对应的所述第一层流量区间,包括:

7.如权利要求3所述的流量分配方法,其特征在于,所述模型标识信息包括用户标识信息、业务域标识信息和目标模型名称信息;

8.一种流量分配装置,其特征在于,包括:

9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机可读指令,其特征在于,所述处理器执行所述计算机可读指令时实现如权利要求1至7中任一项所述流量分配方法。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机可读指令,其特征在于,所述计算机可读指令被一个或多个处理器执行时,使得所述一个或多个处理器执行如权利要求1至7中任一项所述流量分配方法。

...

【技术特征摘要】

1.一种流量分配方法,其特征在于,包括:

2.如权利要求1所述的流量分配方法,其特征在于,所述接收第一服务器组件响应于流量分配请求而发送的请求标识信息之前,包括:

3.如权利要求1所述的流量分配方法,其特征在于,所述确定与所述请求标识信息对应的第一层流量区间之前,包括:

4.如权利要求3所述的流量分配方法,其特征在于,所述在各所述业务域组中设置与各所述业务场景信息关联的业务层级之后,包括:

5.如权利要求3所述的流量分配方法,其特征在于,所述请求标识信息包括用户标识信息和业务域标识信息;

6.如权利要求5所述的流量分配方法,其特征在于,所述基于所述用户标识信息,在所述第一业务层中...

【专利技术属性】
技术研发人员:余荣基
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1