信息召回方法及装置、计算机存储介质、电子设备制造方法及图纸

技术编号:20176976 阅读:32 留言:0更新日期:2019-01-23 00:27
本发明专利技术涉及计算机技术领域,提供了一种信息召回方法及装置、计算机可读存储介质及电子设备,该信息召回方法包括:获取召回配置文件中的召回策略、索引类型和检索关键词,所述召回策略包括召回模式配置项和截断策略配置项;基于所述召回模式配置项对应的召回模式,根据所述检索关键词和所述索引类型在倒排索引链中进行检索,并根据所述截断策略配置项对应的截断策略将检索结果进行截断,以获得召回信息集。本发明专利技术一方面能够将召回层的策略与实现解耦,减少了业务开发成本,降低了出错概率,提高了代码质量;另一方面业务层只需要聚焦召回策略,无需重复实现召回、分值计算、过滤和截断,节省了人工成本,提高了工作效率。

Information recall methods and devices, computer storage media and electronic equipment

The invention relates to the field of computer technology, and provides an information recall method and device, a computer readable storage medium and an electronic device. The information recall method includes acquiring recall strategy, index type and retrieval keywords in the recall configuration file. The recall strategy includes recall mode configuration item and truncation strategy configuration item, and corresponding to the recall mode configuration item based on the recall mode configuration item. According to the retrieval keywords and the index type, the retrieval results are retrieved in the inverted index chain, and the retrieval results are truncated according to the truncation strategy corresponding to the truncation policy configuration item to obtain the recall information set. On the one hand, the invention can decouple the strategy and implementation of the recall layer, reduce the cost of business development, reduce the probability of errors and improve the quality of code; on the other hand, the business layer only needs to focus on the recall strategy, without repeating the recall, score calculation, filtering and truncation, thus saving the labor cost and improving the work efficiency.

【技术实现步骤摘要】
信息召回方法及装置、计算机存储介质、电子设备
本专利技术涉及计算机
,具体而言,涉及一种信息召回方法及装置、计算机可读介质及电子设备。
技术介绍
推荐系统作为一种海量信息筛选系统,被广泛应用在电商商品推荐、音乐推荐、新闻推荐等场景。通常,推荐系统检索召回是根据用户画像和历史行为,在倒排索引中检索相关待推荐对象,然后经过打分排序等计算获取最相关的推荐对象,并将推荐对象呈现给用户。随着推荐系统快速发展,检索召回阶段产生越来越多的检索需求,各种层出不穷的召回策略、过滤控制,给业务开发带来很大的压力。现有的召回模块由召回、分值计算、过滤和截断过程组成,依赖于业务需求,进行逐个过程实现。由于检索、分值计算、过滤和截断过程的接口均对业务人员开放,业务人员需实现整个流程的各个环节,因此对开发人员有较高的业务要求,并且召回层没有统一的约束框架,工程代码随意,不易管理,且逻辑模块无法复用,增加了人工成本;进一步的,在诊断召回问题时,诊断代码的介入影响原有模块,给开发人员带来很多麻烦。因此,本领域亟需寻求一种新的信息召回方法及装置。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术的目的在于提供一种信息召回方法及装置、计算机可读介质及电子设备,进而解决召回层无组织无管理的现状,通过将召回层架构化,实现将策略与实现解耦,减少了业务开发的成本,降低出错概率,提高代码质量;并且依据业务需求,方便扩展各个模块,在开发、调试、诊断等各个阶段提供方便的开发接口,节约人工成本,提高工作效率。本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。根据本专利技术的第一方面,提供一种信息召回方法,其特征在于,包括:获取召回配置文件中的召回策略、索引类型和检索关键词,所述召回策略包括召回模式配置项和截断策略配置项;基于所述召回模式配置项对应的召回模式,根据所述检索关键词和所述索引类型在倒排索引链中进行检索,并根据所述截断策略配置项对应的截断策略将检索结果进行截断,以获得召回信息集。根据本公开的第二方面,提供一种信息召回装置,其特征在于,包括:获取模块,用于获取召回配置文件中的召回策略、索引类型、和检索关键词,所述召回策略包括召回模式配置项和截断策略配置项;召回信息集形成模块,用于基于所述召回模式配置项对应的召回模式,根据所述检索关键词和所述索引类型在倒排索引链中进行检索,并根据所述截断策略配置项对应的截断策略将检索结果进行截断,以获得召回信息集。在本专利技术的一些实施例中,基于前述方案,所述获取模块包括:召回策略确定单元,用于根据所述召回模式配置项对应的召回模式组件和所述截断策略配置项对应的截断策略组件确定所述召回策略。在本专利技术的一些实施例中,基于前述方案,所述召回策略还包括过滤配置项和算分配置项,相应的,所述召回配置文件中配置项对应的组件还包括过滤组件和算分组件。在本专利技术的一些实施例中,基于前述方案,所述召回模式包括朴素召回、算分召回和阈值召回。在本专利技术的一些实施例中,基于前述方案,所述召回信息集形成模块包括:第一检索单元,用于当所述召回模式为朴素召回时,根据所述索引类型和所述检索关键词在所述倒排索引链中进行检索;第一截断单元,用于根据所述截断策略配置项在截断策略组件中调用相应的截断策略,并根据所述截断策略对检索结果进行截断,以获得所述召回信息集。在本专利技术的一些实施例中,基于前述方案,所述召回信息集形成模块包括:第二检索单元,用于当所述召回模式为算分召回,且所述召回策略包括算分配置项时,根据所述索引类型和所述检索关键词在所述倒排索引链中进行检索;相关度计算单元,用于根据所述算分配置项从算分组件中调用相应的算分方法,根据所述算分方法计算用户检索维度与检索结果的相关度;排序单元,用于将所述检索结果按照所述相关度从高到低排序;第二截断单元,用于根据所述截断策略配置项在截断策略组件中调用相应的截断策略,并根据所述截断策略对排序后的所述检索结果进行截断,以获得所述召回信息集。在本专利技术的一些实施例中,基于前述方案,所述召回信息集形成模块包括:第三检索单元,用于当所述召回模式为阈值召回,且所述召回策略包括算分配置项时,根据所述索引类型和所述检索关键词在所述倒排索引链中进行检索;相关度计算单元,用于根据所述算分配置项在算分组件中调用相应的算分方法,通过所述算分方法计算用户检索维度与检索结果的相关度;判断单元,用于将所述相关度与预设相关度进行比较,以判断所述检索结果对应的相关度是否大于或等于所述预设相关度;截断单元,用于在所述检索结果对应的相关度大于或等于所述预设相关度时,根据所述截断策略配置项在截断策略组件中调用相应的截断策略,并根据所述截断策略对所述检索结果进行截断,以获得所述召回信息集。在本专利技术的一些实施例中,所述召回策略还包括过滤策略,基于前述方案,所述召回信息集形成模块还包括:过滤单元,用于在对所述检索结果进行截断之前,根据所述过滤配置项在过滤组件中调用相应的过滤条件,并根据所述过滤条件对所述检索结果进行过滤。在本专利技术的一些实施例中,基于前述方案,所述信息召回装置还包括:格式转化模块,用于在获取所述召回配置文件后,将所述召回配置文件的格式进行转化以形成机器可读的召回配置文件。在本专利技术的一些实施例中,基于前述方案,所述信息召回装置还包括:倒排索引链拉取模块,用于在获取所述召回配置文件后,从索引层中拉取所述倒排索引链。在本专利技术的一些实施例中,基于前述方案,所述信息召回装置还包括:第一输出模块,用于将所述召回信息集通过接收所述召回配置文件的接口输出。在本专利技术的一些实施例中,基于前述方案,所述信息召回装置还包括:诊断信息生成模块,用于获取在形成所述召回信息集的过程中生成的所有数据,以形成诊断信息;第二输出模块,用于将所述诊断信息通过接收所述召回配置文件的接口输出。根据本专利技术的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现如上述实施例中所述的信息召回方法。根据本专利技术的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的信息召回方法。根据本示例实施例中的信息召回方法,将召回层分为两层,第一层为业务层,用于业务开发人员填写配置形成召回配置文件,该召回配置文件包括召回策略、索引类型和检索关键词,且召回策略包括召回模式配置项和截断策略配置项;第二层为召回核心层,用于接收召回配置文件,基于召回模式配置项对应的召回模式,根据检索关键词和索引类型在倒排索引链中进行检索,并根据截断策略配置项对应的截断策略将检索结果进行截断,以获得召回信息集。本专利技术中的信息召回方法一方面将召回层的策略与实现解耦,减少了业务开发成本,降低了出错概率,提高了代码质量;另一方面业务层只需要聚焦召回策略,无需重复实现召回、分值计算、过滤和截断,节省了人工成本,提高了工作效率。本专利技术应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书本文档来自技高网...

【技术保护点】
1.一种信息召回方法,其特征在于,包括:获取召回配置文件中的召回策略、索引类型和检索关键词,所述召回策略包括召回模式配置项和截断策略配置项;基于所述召回模式配置项对应的召回模式,根据所述检索关键词和所述索引类型在倒排索引链中进行检索,并根据所述截断策略配置项对应的截断策略将检索结果进行截断,以获得召回信息集。

【技术特征摘要】
1.一种信息召回方法,其特征在于,包括:获取召回配置文件中的召回策略、索引类型和检索关键词,所述召回策略包括召回模式配置项和截断策略配置项;基于所述召回模式配置项对应的召回模式,根据所述检索关键词和所述索引类型在倒排索引链中进行检索,并根据所述截断策略配置项对应的截断策略将检索结果进行截断,以获得召回信息集。2.根据权利要求1所述的信息召回方法,其特征在于,获取召回配置文件中的召回策略,包括:根据所述召回模式配置项对应的召回模式组件和所述截断策略配置项对应的截断策略组件确定所述召回策略。3.根据权利要求2所述的信息召回方法,其特征在于,所述召回策略还包括过滤配置项和算分配置项,相应的,所述召回配置文件中配置项对应的组件还包括过滤组件和算分组件。4.根据权利要求1所述的信息召回方法,其特征在于,所述召回模式包括朴素召回、算分召回和阈值召回。5.根据权利要求4所述的信息召回方法,其特征在于,基于所述召回模式配置项对应的召回模式,根据所述检索关键词和所述索引类型在倒排索引链中进行检索,并根据所述截断策略配置项对应的截断策略将检索结果进行截断,以获得召回信息集,包括:当所述召回模式为朴素召回时,根据所述索引类型和所述检索关键词在所述倒排索引链中进行检索;根据所述截断策略配置项在截断策略组件中调用相应的截断策略,并根据所述截断策略对检索结果进行截断,以获得所述召回信息集。6.根据权利要求4所述的信息召回方法,其特征在于,基于所述召回模式配置项对应的召回模式,根据所述检索关键词和所述索引类型在倒排索引链中进行检索,并根据所述截断策略配置项对应的截断策略将检索结果进行截断,以获得召回信息集,包括:当所述召回模式为算分召回,且所述召回策略包括算分配置项时,根据所述索引类型和所述检索关键词在所述倒排索引链中进行检索;根据所述算分配置项从算分组件中调用相应的算分方法,通过所述算分方法计算用户检索维度与检索结果的相关度;将所述检索结果按照所述相关度从高到低排序;根据所述截断策略配置项在截断策略组件中调用相应的截断策略,并根据所述截断策略对排序后的所述检索结果进行截断,以获得所述召回信息集。7.根据权利要求4所述的信息召回方法,其特征在于,基于所述召回模式配置项对应的召回模式,根据所述检索关键词和所述索引类型在倒排索引链中进行检索,并根据所述截断策略配置项对应的截断策略将检索结果进行截断,以获得召回信息集,包括:当所述召回模式为阈值召回,且所述召回策略包括算分配置项时,根据所述索引类型和所述检...

【专利技术属性】
技术研发人员:贾贵源何婷婷
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1