推荐系统的搜索区域减小技术方案

技术编号:20596321 阅读:30 留言:0更新日期:2019-03-16 11:57
本发明专利技术涉及一种装置,包括至少一个处理单元,用于:接收用于识别数据集中的条目的请求,所述请求指定目标函数;将目标函数分解成多个子函数;确定所述多个子函数中的至少一个子函数的恒定界限;采用所述至少一个子函数的恒定界限计算所述目标函数的界限;采用所计算出的界限定义所述数据集的搜索区域;通过在所述搜索区域中的条目上处理目标函数来评估所述数据集的搜索区域中的条目。此外,公开了一种推荐系统和条目推荐方法。

Reduction of search area in Recommendation System

The invention relates to an apparatus comprising at least one processing unit for: receiving a request for identifying entries in a data set, the request specifying an objective function; decomposing the objective function into multiple sub-functions; determining the constant bounds of at least one of the multiple sub-functions; and calculating the bounds of the objective function using the constant bounds of the at least one sub-function. Limits; defines the search area of the data set by the calculated boundaries; evaluates the entries in the search area of the data set by processing the objective function on the entries in the search area. In addition, a recommendation system and an entry recommendation method are disclosed.

【技术实现步骤摘要】
【国外来华专利技术】推荐系统的搜索区域减小
本专利技术涉及一种装置、推荐系统和条目推荐方法。本专利技术还涉及存储有用于配置计算设备以执行这种方法的指令的计算机可读存储介质。
技术介绍
推荐系统是当前通信和信息处理系统的重要组成部分。用户可以检索、处理和上传的大量信息和数据需要预选或将信息或数据量减少到能够由用户处理的合适数量或大小。但是,为了生成有意义的推荐,必须分析和处理大型数据集,而这需要大量的计算资源和计算时间。已经针对各个数据集提出了搜索方法来处理特定任务。但是,很难将这些方法适用于不同的推荐设置。对于不同的数据集,这些方法可能根本不会减少计算资源的数量或者缩短计算时间,甚至可能会提供不准确的结果。
技术实现思路
本专利技术的目的在于提供一种装置、推荐系统和条目推荐方法,所述装置、推荐系统和方法克服了现有技术中的一个或多个上述问题。本专利技术的第一方面提供一种装置,包括至少一个处理单元,用于:接收用于识别数据集中的条目的请求,所述请求指定目标函数;将目标函数分解成多个子函数;确定所述多个子函数中的至少一个子函数的恒定界限;采用所述至少一个子函数的恒定界限计算所述目标函数的界限;采用所计算出的界限定义所述数据集的搜索区域;通过在所述搜索区域中的条目上处理(即,计算或应用)目标函数来评估所述数据集的搜索区域中的条目。第一方面中的装置适用于任何类型的数据集和查询。接收到的请求通过指定目标函数来定义数据集中的条目的评估。然而,由于就计算资源和计算时间两者而言,在数据集中的所有条目上评估目标函数过于昂贵,因此所述装置用于分解目标函数并采用目标函数的至少一个子函数的恒定界限来近似目标函数,从而有效地减小了搜索区域。搜索区域可以用于(在搜索区域内)识别候选条目,以在搜索区域中的条目上计算相对昂贵(原始)的目标函数。根据目标函数,例如推荐结果等查询结果可以包括已评估条目的子集。例如,根据目标函数所定义的值(或指标),结果可以包括一个或多个最佳或最差条目的任何组合。该方法非常灵活,因为目标函数可以表示适用于任何类型数据集的各种查询类型。此外,通过采用恒定界限来近似至少一些子函数,例如计算成本增加的子函数,搜索区域可以有效地减小,并且即使对于非单调目标函数仍然可以有效地提供精确的近似。此外,将目标函数分解成多个子函数是有利的,因为各个部分可以在所述装置的专用处理单元上或在例如计算云或群集中的外部处理单元上进行处理,从而能够平衡计算资源并加快查询处理速度。根据第一方面,在所述装置的第一种实现方式中,所述至少一个处理单元用于去除所述多个子函数中的针对所述搜索区域的大小变化保持不变的一个或多个子函数。去除针对搜索区域大小变化保持不变的至少一些子函数,进一步加快了基于目标函数的后续计算速度。优选地,处理单元可以用于确定是否存在这种不变的子函数,并从分解的目标函数中去除所识别出的子函数。在整个说明书中,目标函数的剩余子函数也可以被组合地称为简化目标函数。根据第一方面本身或者根据第一方面的第一种实现方式,在所述装置的第二种实现方式中,所述至少一个子函数的恒定界限是采用所述至少一个子函数的输入参数的最大值和/或最小值来确定的。优选地,所述至少一个子函数可以被识别为目标函数中需要最多计算资源或计算时间的一部分。因此,在整个说明书中,所述至少一个子函数也可以被称为目标函数或简化目标函数的计算密集部分(computationallyintensivepart,简称CIP)。CIP可能受限于可达或不可达的最大值和最小值或界限。可以通过采用输入值的最小值/最大值和/或用于构建CIP的上限和下限函数的数学方法来估计最大值和/或最小值。这些值可以被进一步改进。最大值和/或最小值(或其改进值)可以由表征估计最大值和/或最小值所需的时间与其准确度之间的折衷的至少一个参数来控制。例如,作为初始步骤,可以粗略地估计最大值和/或最小值,该最大值和/或最小值可以被进一步改进,以构建更近似至少一个子函数的界限的改进的恒定界限。根据第一方面本身或者根据第一方面的前述实现方式中的任一种实现方式,在所述装置的第三种实现方式中,所述恒定界限是通过执行一个过程来确定的。恒定界限可以采用可以在装置上自动执行的过程化方法来确定。根据第一方面本身或者根据第一方面的前述实现方式中的任一种实现方式,在所述装置的第四种实现方式中,所述至少一个处理单元还用于测量所述搜索区域的大小;并且如果所测量出的大小超过阈值,则所述至少一个处理单元还用于确定所述多个子函数中的其它的至少一个子函数的其它恒定界限。所确定的恒定界限用于计算影响搜索区域的目标函数的界限。如果搜索区域的大小超过阈值,则可以发起迭代方法。该迭代方法可以通过确定所述至少一个子函数、其它子函数或其组合或排列的其它恒定界限,使得搜索区域更精确。因此,如果减小的搜索区域太大,则可以识别多个子函数中的其它子函数或子函数的组合,并且可以确定所述其它子函数或组合相应的恒定界限。这通过识别更合适的子函数直到搜索区域具有可接受的大小,从而自动改进搜索区域。此外,至少一个处理单元可以用于并行确定目标函数的至少一组子函数的恒定界限,并评估相应的搜索区域的大小,以确定具有可接受大小的搜索区域。这使得计算资源能够得到充分利用。根据第一方面本身或者根据第一方面的前述实现方式中的任一种实现方式,在所述装置的第五种实现方式中,所述至少一个处理单元还用于采用所述其它恒定界限来计算所述目标函数的其它界限,并且采用所计算出的其它界限来定义所述搜索区域。这改进了可以由为搜索区域的合适大小预先配置的阈值来控制的搜索区域。根据第一方面本身或者根据第一方面的前述实现方式中的任一种实现方式,在所述装置的第六种实现方式中,所述其它的至少一个子函数包括所述至少一个子函数和所述多个子函数中的至少一个其它的子函数。所述其它的至少一个子函数可以表示目标函数中比最初考虑的至少一个子函数更大的片段。然而,应理解的是,在一个或多个其它实现方式中,所述其它的至少一个子函数也可以表示目标函数中可用于进一步改进搜索区域的较小片段或完全不同部分。根据第一方面本身或者根据第一方面的前述实现方式中的任一种实现方式,在所述装置的第七种实现方式中,所述至少一个处理单元用于将所述目标函数分解成多个子函数的和。这使得能够简化对总和的各个组成部分及其组合的处理,以确定对CIP和剩余部分的合适分解。根据第一方面本身或者根据第一方面的前述实现方式中的任一种实现方式,在所述装置的第八种实现方式中,所述目标函数对应于针对推荐系统的一类请求。优选地,查询是前N个或后N个搜索,基于所述目标函数,搜索结果包括具有一个或多个用户的最佳或最差评级的N个条目的集合。进一步地,请求类别可以包括值可以在(任何种类的)区间的内部(或外部)的基于区间的搜索、例如用户组或条目组等许多变量的目标函数、其它条件或请求以及相应的子任务。根据第一方面本身或者根据第一方面的前述实现方式中的任一种实现方式,在所述装置的第九种实现方式中,所述装置还包括:至少一个数据接口,耦合至至少一个数据库以检索所述数据集中的条目。所述装置可以通过数据接口经由数据库的一个或多个接口访问数据集中的条目,该接口可以用于使得能够识别、检索或存储数据库中的条目。例如,该接口可以使得能够基于搜索区本文档来自技高网...

【技术保护点】
1.一种装置,其特征在于,包括:至少一个处理单元,用于:接收用于识别数据集中的条目的请求,所述请求指定目标函数;将目标函数分解成多个子函数;确定所述多个子函数中的至少一个子函数的恒定界限;采用所述至少一个子函数的恒定界限计算所述目标函数的界限;采用所计算出的界限定义所述数据集的搜索区域;通过在所述搜索区域中的条目上处理目标函数来评估所述数据集的搜索区域中的条目。

【技术特征摘要】
【国外来华专利技术】1.一种装置,其特征在于,包括:至少一个处理单元,用于:接收用于识别数据集中的条目的请求,所述请求指定目标函数;将目标函数分解成多个子函数;确定所述多个子函数中的至少一个子函数的恒定界限;采用所述至少一个子函数的恒定界限计算所述目标函数的界限;采用所计算出的界限定义所述数据集的搜索区域;通过在所述搜索区域中的条目上处理目标函数来评估所述数据集的搜索区域中的条目。2.根据权利要求1所述的装置,其特征在于,所述至少一个处理单元用于去除所述多个子函数中的针对所述搜索区域的大小变化保持不变的一个或多个子函数。3.根据前述权利要求其中一项所述的装置,其特征在于,所述至少一个子函数的恒定界限是采用所述至少一个子函数的输入参数的最大值和/或最小值来确定的。4.根据前述权利要求其中一项所述的装置,其特征在于,所述恒定界限是通过执行一个过程来确定的。5.根据前述权利要求其中一项所述的装置,其特征在于,所述至少一个处理单元还用于测量所述搜索区域的大小;并且如果所测量出的大小超过阈值,则所述至少一个处理单元还用于确定所述多个子函数中的其它的至少一个子函数的其它恒定界限。6.根据权利要求5所述的装置,其特征在于,所述至少一个处理单元还用于采用所述其它恒定界限来计算所述目标函数的其它界限,并且采用所计算出的其它界限来定义所述搜索区域。7.根据权利要求5或6所述的装置,其特征在于,所述其它的至少一个子函数包括所述至少一个子函数和所述多个...

【专利技术属性】
技术研发人员:马克西姆谢尔盖耶维奇克利诺夫亚历山大尼古拉耶维奇菲利波夫维克多弗拉基米罗维奇斯米尔诺夫
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1