本申请实施例公开了搜索推荐方法及装置、设备、存储介质,其中,所述方法包括:确定待搜索信息与候选文本集合中的每一候选文本之间的词向量相关度;确定所述待搜索信息与每一所述候选文本之间的字符相关度;将每一所述候选文本对应的所述词向量相关度和所述字符相关度进行融合,得到对应候选文本的评价值;对满足特定条件的评价值所对应的候选文本进行推荐。
Search recommended methods and devices, equipment, storage media
【技术实现步骤摘要】
搜索推荐方法及装置、设备、存储介质
本申请实施例涉及互联网技术,涉及但不限于搜索推荐方法及装置、设备、存储介质。
技术介绍
用户经常在互联网的海量信息中搜索需要的信息,搜索引擎已成为用户的生活中和工作中必不可少的工具。所谓搜索引擎,就是根据用户需求与一定算法,运用特定策略从互联网检索出相关文本,然后反馈给用户的一门检索技术。其中,搜索引擎中的一项关键技术,即确定用户输入的待搜索信息与候选文本的相关性,然后将与待搜索信息的相关性高的候选文本推荐给用户。因此,如何使得推荐给用户的候选文本更加准确,对于更好地满足用户需求具有一定的意义。
技术实现思路
有鉴于此,本申请实施例提供搜索推荐方法及装置、设备、存储介质。本申请实施例的技术方案是这样实现的:第一方面,本申请实施例提供一种搜索推荐方法,所述方法包括:确定待搜索信息与候选文本集合中的每一候选文本之间的词向量相关度;确定所述待搜索信息与每一所述候选文本之间的字符相关度;将每一所述候选文本对应的所述词向量相关度和所述字符相关度进行融合,得到对应候选文本的评价值;对满足特定条件的评价值所对应的候选文本进行推荐。第二方面,本申请实施例提供一种搜索推荐装置,包括:第一确定模块,用于确定待搜索信息与候选文本集合中的每一候选文本之间的词向量相关度;第二确定模块,用于确定所述待搜索信息与每一所述候选文本之间的字符相关度;融合模块,用于将每一所述候选文本对应的所述词向量相关度和所述字符相关度进行融合,得到对应候选文本的评价值;推荐模块,用于对满足特定条件的评价值所对应的候选文本进行推荐。第三方面,本申请实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本申请实施例任一所述搜索推荐方法中的步骤。第四方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现本申请实施例任一所述搜索推荐方法中的步骤。本申请实施例中,提供一种搜索推荐方法,在所述方法中,确定待搜索信息与每一候选文本之间的词向量相关度和字符相关度;然后,将每一候选文本对应的词向量相关度和字符相关度进行融合,得到对应候选文本的评价值;如此,能够更加准确地确定待搜索信息与候选文本之间的相近程度,从而使得推荐给用户的候选文本更加准确,进而更好地满足用户需求。附图说明图1为本申请实施例搜索推荐方法的实现流程示意图;图2为本申请实施例确定一个候选文本answer的评价值的模型总体流程图;图3为本申请实施例只用BERT模型返回的搜索推荐结果示意图;图4为本申请实施例融合BERT模型和N-GRAM而返回的搜索推荐结果示意图;图5为本申请实施例搜索推荐装置的结构示意图;图6为本申请实施例电子设备的一种硬件实体示意图。具体实施方式为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请的具体技术方案做进一步详细描述。以下实施例用于说明本申请,但不用来限制本申请的范围。除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的,不是旨在限制本申请。在以下的描述中,涉及到“一些实施例”,其描述了所有可能实施例的子集,但是可以理解,“一些实施例”可以是所有可能实施例的相同子集或不同子集,并且可以在不冲突的情况下相互结合。需要指出,本申请实施例所涉及的术语“第一\第二\第三”仅仅是区别类似或不同的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序,以使这里描述的本申请实施例能够以除了在这里图示或描述的以外的顺序实施。本申请实施例提供的搜索推荐方法,可以应用于电子设备,所述电子设备在实施的过程中可以为各种类型的具有搜索功能的设备,例如所述电子设备可以包括智能移动终端(例如手机)、平板电脑、电子书、笔记本电脑、台式计算机、桌面电脑等。该方法所实现的功能可以通过所述电子设备中的处理器调用程序代码来实现,当然程序代码可以保存在计算机存储介质中,可见,该所述电子设备至少包括处理器和存储介质。本申请实施例提供一种搜索推荐方法,图1为本申请实施例搜索推荐方法的实现流程示意图,如图1所示,所述方法可以包括以下步骤101至步骤104:步骤101,确定待搜索信息与候选文本集合中的每一候选文本之间的词向量相关度。可以理解地,待搜索信息通常为用户通过语音或文字输入的方式,输入至搜索引擎中的关键词或者语句,也被称为查询语句(query)。候选文本集合可以是已有的语料库,也可以是其他数据库。候选文本可以是网页标题,还可以是网页标题对应的网页内容,或者还可以是网页标题和对应的网页内容。词向量相关度越大,表明待搜索信息与该候选文本之间的语义越相近。电子设备可以通过如下实施例的步骤201至步骤203确定待搜索信息与候选文本之间词向量相关度。步骤102,确定所述待搜索信息与每一所述候选文本之间的字符相关度。我们知道,词向量是文本的语义表示,而字符则是指的文本包含的字、词等。所以,字符相关度与词向量相关度是从不同的角度对两个文本之间的相近程度的度量表示。词向量相关度表征的是语义的相近程度,而字符相关程度表征的是字词的相似程度。电子设备可以通过如下实施例的步骤204至步骤206确定待搜索信息与候选文本之间的字符相关度。步骤103,将每一所述候选文本对应的所述词向量相关度和所述字符相关度进行融合,得到对应候选文本的评价值。可以理解地,候选文本的评价值实际上是对应的词向量相关度和字符相关度的综合评价结果,评价的是该候选文本与待搜索信息的相近程度,评价值越大,表征该候选文本与待搜索信息在语义和字词上越相近。电子设备可以通过如下实施例的步骤207和步骤208确定对应候选文本的评价值。步骤104,对满足特定条件的评价值所对应的候选文本进行推荐。特定条件可以是多种多样的。例如,特定条件为大于特定阈值,相应地,将大于特定阈值的评价值所对应的候选文本进行推荐。特定条件还可以是评价值最大的K个,K为大于0的整数,相应地,将K个最大的评价值所对应的候选文本进行推荐。在为用户推荐这些候选文本时,可以按照评价值由大到小的顺序,对这些候选文本进行排序,以优先显示评价值较高的候选文本,方便用户选择。在本申请实施例中,提供一种搜索推荐方法,在所述方法中,确定待搜索信息与每一候选文本之间的词向量相关度和字符相关度;然后,将每一候选文本对应的词向量相关度和字符相关度进行融合,得到对应候选文本的评价值;如此,能够更加准确地确定待搜索信息与候选文本之间的相近程度,从而使得推荐给用户的候选文本更加准确,进而更好地满足用户需求。本申请实施例再提供一种搜索推荐方法,所述方法可以包括以下步骤本文档来自技高网...
【技术保护点】
1.一种搜索推荐方法,其特征在于,所述方法包括:/n确定待搜索信息与候选文本集合中的每一候选文本之间的词向量相关度;/n确定所述待搜索信息与每一所述候选文本之间的字符相关度;/n将每一所述候选文本对应的所述词向量相关度和所述字符相关度进行融合,得到对应候选文本的评价值;/n对满足特定条件的评价值所对应的候选文本进行推荐。/n
【技术特征摘要】
1.一种搜索推荐方法,其特征在于,所述方法包括:
确定待搜索信息与候选文本集合中的每一候选文本之间的词向量相关度;
确定所述待搜索信息与每一所述候选文本之间的字符相关度;
将每一所述候选文本对应的所述词向量相关度和所述字符相关度进行融合,得到对应候选文本的评价值;
对满足特定条件的评价值所对应的候选文本进行推荐。
2.根据权利要求1所述的方法,其特征在于,所述确定所述待搜索信息与每一所述候选文本之间的字符相关度,包括:
根据M种分割语法,分别对所述待搜索信息进行字符串分割,得到M个第一字符串集合;其中,M为大于0的整数;
根据所述M种分割语法,分别对第i个所述候选文本进行字符串分割,得到M个第二字符串集合;其中,i为小于或等于所述候选集合的候选文本总数的正整数;
根据所述M个第一字符串集合和所述M个第二字符串集合,确定所述待搜索信息与所述第i个所述候选文本之间的字符相关度。
3.根据权利要求2所述的方法,其特征在于,所述根据所述M个第一字符串集合和所述M个第二字符串集合,确定所述待搜索信息与所述第i个所述候选文本之间的字符相关度,包括:
确定采用同一所述分割语法得到的第一字符串集合与第二字符串集合之间的距离;
根据每一所述距离,确定所述待搜索信息与所述第i个所述候选文本之间的字符相关度。
4.根据权利要求3所述的方法,其特征在于,所述M为大于1的整数,所述根据每一所述距离,确定所述待搜索信息与所述第i个所述候选文本之间的字符相关度,包括:
根据第j个所述距离、所述第一字符串集合包含的字符串总数和所述第i个所述候选文本的第二字符串集合包含的字符串总数,确定所述第一字符串集合与所述第i个所述候选文本的第二字符串集合之间的匹配分值;其中,j为大于0且小于或等于M的整数;
对每一所述匹配分值进行加权,得到所述待搜索信息与所述第i个所述候选文本之间的字符相关度。
5.根据权利要求1所述的方法,其特征在于,所述将每一所述候选文本对应的所述词向量相关度和所述字符相关度进行融...
【专利技术属性】
技术研发人员:沈强,谭松波,
申请(专利权)人:联想北京有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。