落地页特征生成方法、落地页搜索方法及相关装置制造方法及图纸

技术编号:34625734 阅读:27 留言:0更新日期:2022-08-20 09:33
本公开提供了一种落地页特征生成方法、落地页搜索方法及相关装置,涉及数据搜索、深度学习等人工智能技术领域。该方法包括:从用户的搜索会话中提取出会话内不同查询词之间的第一对应关系,以及查询词、相关词、落地页三者中任意两者之间的第二对应关系;构建由查询词、相关词、落地页的语义特征充当节点、第一对应关系和第二对应关系充当节点之间的边的原始节点关联图;基于随机游走算法对原始节点关联图进行节点邻域采样,并通过对采样结果进行迭代更新得到目标节点关联图;利用预设的图神经网络处理目标节点关联图,得到目标落地页特征。应用该方法可使落地页特征在语义特征的基础上具有知识推理和认知关联的能力。础上具有知识推理和认知关联的能力。础上具有知识推理和认知关联的能力。

【技术实现步骤摘要】
落地页特征生成方法、落地页搜索方法及相关装置


[0001]本公开涉及数据处理
,具体涉及数据搜索、深度学习等人工智能
,尤其涉及一种落地页特征生成方法、落地页搜索方法,以及对应的装置、电子设备、计算机可读存储介质及计算机程序产品。

技术介绍

[0002]搜索广告和推荐广告场景中,网民从广告点击到达落地页(即广告指向的目标地址,比如推广应用的官方、下载页,某个网页等),在落地页中完成转化。落地页作为承载商业价值的最后一环,具有举足轻重的影响,因而也成为广告检索过程中必不可少的特征信息。
[0003]针对落地页的表征能力直接影响了广告的召回、排序以及最终展现。如何获取合理且精准的落地页表征是广告检索系统优化的一大环节。

技术实现思路

[0004]本公开实施例提供了一种落地页特征生成方法、落地页搜索方法,以及对应的装置、电子设备、计算机可读存储介质及计算机程序产品。
[0005]第一方面,本公开实施例提供了一种落地页特征生成方法,包括:从用户的搜索会话中提取出会话内不同查询词之间的第一对应关系,以及查询词、相关词、落地页三者中任意两者之间的第二对应关系;构建由查询词、相关词、落地页的语义特征充当节点、第一对应关系和第二对应关系充当节点之间的边的原始节点关联图;基于随机游走算法对原始节点关联图进行节点邻域采样,并通过对采样结果进行迭代更新得到目标节点关联图;利用预设的图神经网络处理目标节点关联图,得到目标落地页特征。
[0006]第二方面,本公开实施例提供了一种落地页特征生成装置,包括:对应关系提取单元,被配置成从用户的搜索会话中提取出会话内不同查询词之间的第一对应关系,以及查询词、相关词、落地页三者中任意两者之间的第二对应关系;原始节点关联图构建单元,被配置成构建由查询词、相关词、落地页的语义特征充当节点、第一对应关系和第二对应关系充当节点之间的边的原始节点关联图;目标节点关联图生成单元,被配置成基于随机游走算法对原始节点关联图进行节点邻域采样,并通过对采样结果进行迭代更新得到目标节点关联图;目标落地页特征生成单元,被配置成利用预设的图神经网络处理目标节点关联图,得到目标落地页特征。
[0007]第三方面,本公开实施例提供了一种落地页搜索方法,包括:确定用于查询落地页的实际查询词的语义特征;将拥有匹配于查询词语义特征的目标落地页特征的落地页,作为搜索结果返回;其中,目标落地页特征根据第一方面描述的落地页特征生成方法得到。
[0008]第四方面,本公开实施例提供了一种落地页搜索装置,包括:语义特征提取单元,被配置成确定用于查询落地页的实际查询词的语义特征;搜索结果返回单元,被配置成将拥有匹配于查询词语义特征的目标落地页特征的落地页,作为搜索结果返回;其中,目标落
地页特征根据第二方面描述的落地页特征生成装置得到。
[0009]第五方面,本公开实施例提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器执行时能够实现如第一方面描述的落地页特征生成方法和/或如第三方面描述的落地页搜索方法。
[0010]第六方面,本公开实施例提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行时能够实现如第一方面描述的落地页特征生成方法和/或如第三方面描述的落地页搜索方法。
[0011]第七方面,本公开实施例提供了一种包括计算机程序的计算机程序产品,该计算机程序在被处理器执行时能够实现如第一方面描述的落地页特征生成方法和/或如第三方面描述的落地页搜索方法。
[0012]本公开所提供的落地页特征生成方案,从体现更全面搜索行为的搜索会话中提取出查询词、相关词、落地页之间的更全面的对应关系,同时在图论提供的图形化思想的基础上结合随机游走算法,以邻域采样的方式更准确的确定节点之间的关联关系,使得最终可通过图神经网络输出更准确的落地页特征。该方案具备较强的通用落地页表征能力,根据搜索历史数据挖掘出落地页蕴含的更深度,更广度的信息,使落地页特征在语义特征的基础上具有知识推理和认知关联的能力。
[0013]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0014]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
[0015]图1是本公开可以应用于其中的示例性系统架构;
[0016]图2为本公开实施例提供的一种落地页特征生成方法的流程图;
[0017]图3为本公开实施例提供的另一种落地页特征生成方法的流程图;
[0018]图4为本公开实施例提供的落地页特征生成方法中一种生成目标节点关联图的方法的流程图;
[0019]图5为本公开实施例提供的落地页特征生成方法中一种生成目标落地页特征的方法的流程图;
[0020]图6为本公开实施例提供的与图5对应方案的一种图神经网络处理数据的流程示意图;
[0021]图7为本公开实施例提供的一种落地页搜索方法的流程图;
[0022]图8为本公开实施例提供的一种落地页特征生成装置的结构框图;
[0023]图9为本公开实施例提供的一种落地页搜索装置的结构框图;
[0024]图10为本公开实施例提供的一种适用于执行落地页特征生成方法和/或落地页搜索方法的电子设备的结构示意图。
具体实施方式
[0025]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。
[0026]本公开的技术方案中,所涉及的用户个人信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
[0027]图1示出了可以应用本公开的落地页特征生成方法、落地页搜索方法,以及对应的装置、电子设备及计算机可读存储介质的实施例的示例性系统架构100。
[0028]如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
[0029]用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103和服务器105上可以安装有各种用于实现两者本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种落地页特征生成方法,包括:从用户的搜索会话中提取出会话内不同查询词之间的第一对应关系,以及查询词、相关词、落地页三者中任意两者之间的第二对应关系;构建由所述查询词、所述相关词、所述落地页的语义特征充当节点、所述第一对应关系和所述第二对应关系充当节点之间的边的原始节点关联图;基于随机游走算法对所述原始节点关联图进行节点邻域采样,并通过对采样结果进行迭代更新得到目标节点关联图;利用预设的图神经网络处理所述目标节点关联图,得到目标落地页特征。2.根据权利要求1所述的方法,其中,所述从用户的搜索会话中提取出会话内不同查询词之间的第一对应关系,以及查询词、相关词、落地页三者中任意两者之间的第二对应关系,包括:将用户的搜索会话中相邻输入的两个不同查询词之间的关系,确定为所述第一对应关系;将用户的搜索会话中分别提取出查询词与相关词之间的关系、查询词与落地页之间的关系、相关词与落地页之间的关系,得到所述第二对应关系。3.根据权利要求1所述的方法,其中,所述构建由所述查询词、所述相关词、所述落地页的语义特征充当节点、所述第一对应关系和所述第二对应关系充当节点之间的边的原始节点关联图,包括:以构建无向无权图的方式,构建由所述查询词、所述相关词、所述落地页的语义特征充当节点、所述第一对应关系和所述第二对应关系充当节点之间的边的原始无向无权图;对应的,所述基于随机游走算法对所述原始节点关联图进行节点邻域采样,并通过对采样结果进行迭代更新得到目标节点关联图,包括:基于随机游走算法对所述原始无向无权图进行节点邻域采样,并通过对采样结果进行迭代更新得到所述目标节点关联图。4.根据权利要求1所述的方法,其中,所述基于随机游走算法对所述原始节点关联图进行节点邻域采样,并通过对采样结果进行迭代更新得到目标节点关联图,包括:初始化所述原始节点关联图中各节点间的相关性,得到原始相关性数值;基于随机游走算法迭代更新所述原始相关性数值,得到更新后相关性数值;将与所述更新后相关性数值对应的节点关联图,确定为所述目标节点关联图。5.根据权利要求1

4任一项所述的方法,其中,所述利用预设的图神经网络处理所述目标节点关联图,得到目标落地页特征,包括:利用所述图神经网络对邻域进行信息融合,并将经信息融合后的邻域特征与所述中心节点的特征进行拼接,得到拼接后中心节点特征;利用所述图神经网络对所述拼接后中心节点特征进行非线性变换,得到更新后中心节点特征;将落地页节点作为中心节点的更新后中心节点特征,输出为所述目标落地页特征。6.一种落地页搜索方法,包括:确定用于查询落地页的实际查询词的语义特征;将拥有匹配于所述查询词语义特征的目标落地页特征的落地页,作为搜索结果返回;
其中,所述目标落地页特征根据权利要求1

5任一项所述的落地页特征生成方法得到。7.一种落地页特征生成装置,包括:对应关系提取单元,被配置成从用户的搜索会话中提取出会话内不同查询词之间的第一对应关系,以及查询词、相关词、落地页三者中任意两者之间的第二对应关系;原始节点关联图构建单元,被配置成构建由所述查询词、所述相关词、所述落地页的语义特征充当节点、...

【专利技术属性】
技术研发人员:马圣杰瞿康刘丽阳锋
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1