内链生成方法、数据处理方法、搜索方法及计算设备技术

技术编号:39162731 阅读:11 留言:0更新日期:2023-10-23 15:03
本申请实施例提供一种内链生成方法、数据处理方法、搜索方法及计算设备。其中,确定多组匹配对;所述匹配对由对象以及与所述对象存在匹配关系的关键信息构成;所述匹配对从关键信息库以及对象库中识别获得;确定列表页面及详情页面所对应的至少一种页面链接关系;按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,以获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息。本申请实施例提供的技术方案结合对象与关键信息的匹配关系来生成内链,保证了不同页面链接关系所对应页面之间的相关性,有助于提高网站权重,提高网站收录率,从而保证了所生成内链合理性。从而保证了所生成内链合理性。从而保证了所生成内链合理性。

【技术实现步骤摘要】
内链生成方法、数据处理方法、搜索方法及计算设备


[0001]本申请实施例涉及网络
,尤其涉及一种内链生成方法、数据处理方法、搜索方法及计算设备。

技术介绍

[0002]内链是指网站的内部链接,也即在同一网站域名下的内部页面之间的互相链接。内链通常以关键信息形式投放在网站内部页面中,用户可以点击页面中的关键信息从而进入关键信息所指向的网站内部其他页面,或者,搜索引擎可以抓取内链所指向的网站内部页面。
[0003]在搜索引擎优化(Search Engine Optimization,SEO)中,合理的内链结构能够使搜索引擎进行快速抓取和收录,提高网站权重,增加用户点击率。
[0004]因此,如何合理确定内链成为本领域技术人员需要解决的技术问题,特别是提供诸如商品等对象,并可以供用户与对象执行购买、浏览或其它交互行为的网站中,页面类型主要分为列表页面及对象的详情页面,所涉及的页面链接关系通常包括列表页面链接至详情页面、列表页面链接至列表页面、详情页面链接至详情页面、以及详情页面链接至对象页面等,而合理的内链结构可以向搜索引擎推荐有价值的列表页面或详情页面,提升页面排名,从而为网站引入更多流量,因此上述技术问题亟待解决。

技术实现思路

[0005]本申请实施例提供一种内链生成方法、数据处理方法、搜索方法及计算设备,用以解决现有技术中内链不合理的技术问题。
[0006]第一方面,本申请实施例中提供了一种内链生成方法,包括:确定多组匹配对;所述匹配对由对象以及与所述对象存在匹配关系的关键信息构成;所述匹配对从关键信息库以及对象库中识别获得;确定列表页面及详情页面所对应的至少一种页面链接关系;按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,以获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息。
[0007]可选地,该方法还包括:根据关键信息特征,将所述关键信息库中的多个关键信息进行聚类,获得多个信息分组;根据对象特征,将所述对象库中的对象分别与所述多个信息分组进行匹配,确定所匹配的至少一个目标信息分组;将所述对象分别与所述至少一个目标信息分组中的关键信息进行匹配,以确定与所述对象匹配的至少一个关键信息,并由所述对象与所述至少一个关键信息构成至少一个匹配对。
[0008]可选地,该方法还包括:利用匹配模型提取关键信息库中多个关键信息分别对应的关键信息特征;利用所述匹配模型提取对象库中多个对象分别对应的对象特征;其中,所述匹配模型基于多组样本匹配对采用对比学习方式训练获得;所述样本匹配对包括样本关键信息以及样本对象。
[0009]可选地,所述至少一种页面链接关系包括列表页面链接至详情页面;所述按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息包括:从所述多组匹配对中,确定与同一个对象存在匹配关系的多个关键信息;根据所述多个关键信息分别与所述对象的匹配程度,确定第一关键信息及第二关键信息;结合关键信息与列表页面对应关系,确定所述第一关键信息指向的第一列表页面、所述对象的第一详情页面,以及将所述第二关键信息作为所述第一列表页面中的内链。
[0010]可选地,所述根据所述多个关键信息分别与所述对象的匹配程度,确定第一关键信息及第二关键信息包括:根据所述多个关键信息分别与所述对象的匹配程度,确定匹配程度满足第一匹配要求的第一关键信息以及确定匹配程度满足第二匹配要求的第二关键信息。
[0011]可选地,所述至少一种页面链接关系包括详情页面链接列表页面;所述按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息包括:从所述多组匹配对中,按照关键信息与对象匹配程度,查找目标匹配对;结合关键信息与列表页面对应关系,确定所述目标匹配对中的目标关键信息指向的目标列表页面,目标对象的目标详情页面,以及将所述目标关键信息作为所述目标详情页面中的内链。
[0012]可选地,所述至少一种页面链接关系包括详情页面链接详情页面;所述按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息包括:确定满足相关性要求的第一对象和第二对象;从所述多组匹配对中,查找所述第一对象匹配的第一关键信息;确定所述第一对象的第一详情页面,所述第二对象的第二详情页面,并将所述第一关键信息作为所述第二详情页面中的内链。
[0013]可选地,所述至少一种页面链接关系包括列表页面链接列表页面;所述按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息包括:从所述多组匹配对中,查找与同一个对象存在匹配关系的第一关键信息和第二关
键信息;结合关键信息与列表页面对应关系,确定所述第一关键信息指向的第一列表页面、所述第二关键信息指向的第二列表页面,以及将所述第一关键信息作为所述第二列表页面中的内链。
[0014]可选地,所述从所述多组匹配对中,查找与同一个对象存在匹配关系的第一关键信息和第二关键信息包括:从所述多组匹配对中,查找与同一个对象存在匹配关系的多个关键信息;按照所述多个关键信息分别与所述对象的匹配程度,确定匹配程度满足第三匹配要求的第一关键信息和确定匹配程度满足第四匹配要求的第二关键信息。
[0015]可选地,该方法还包括:按照所述至少一种页面链接关系分别对应的关联转换结果进行页面配置,以更新网站的内链结构;或者,将所述至少一种页面链接关系分别对应的关联转换结果发送至目标人员;所述关联转换结果用于生成页面配置信息,所述页面配置信息用以更新所述网站的内链结构。
[0016]可选地,该方法还包括:根据网站内部和/或网站外部产生的搜索记录,确定所述搜索记录中的关键信息以及所述关键信息指向的列表页面;建立所述关键信息与所述列表页面的对应关系,并根据所述关键信息构建关键信息库。
[0017]可选地,所述匹配模型按照如下方式预先训练获得:确定当前训练批次对应的多组样本匹配对;将所述多组样本匹配对输入匹配模型;以任一个样本匹配对为正样本,任一个样本匹配对中的样本关键信息与其余的至少一个样本匹配对中的样本对象为负样本,采样对比学习方式训练所述匹配模型。
[0018]可选地,所述以任一个样本匹配对为正样本,任一个样本匹配对中的样本关键信息与其余的至少一个样本匹配对中的样本对象为负样本,采样对比学习方式训练所述匹配模型包括:利用所述匹配模型分别提取多组样本匹配对中样本关键信息对应的样本关键信息特征,以及样本对象对应的样本对象特征;以任一个样本匹配对为正样本,任一个样本匹配对中的样本关键信息与其余的至少一个样本匹配对中的样本对象为负样本;基于样本信息特征以及样本对象特征,计算正本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种内链生成方法,其特征在于,包括:确定多组匹配对;所述匹配对由对象以及与所述对象存在匹配关系的关键信息构成;所述匹配对从关键信息库以及对象库中识别获得;确定列表页面及详情页面所对应的至少一种页面链接关系;按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,以获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息。2.根据权利要求1所述的方法,其特征在于,还包括:根据关键信息特征,将所述关键信息库中的多个关键信息进行聚类,获得多个信息分组;根据对象特征,将所述对象库中的对象分别与所述多个信息分组进行匹配,确定所匹配的至少一个目标信息分组;将所述对象分别与所述至少一个目标信息分组中的关键信息进行匹配,以确定与所述对象匹配的至少一个关键信息,并由所述对象与所述至少一个关键信息构成至少一个匹配对。3.根据权利要求2所述的方法,其特征在于,还包括:利用匹配模型提取关键信息库中多个关键信息分别对应的关键信息特征;利用所述匹配模型提取对象库中多个对象分别对应的对象特征;其中,所述匹配模型基于多组样本匹配对采用对比学习方式训练获得;所述样本匹配对包括样本关键信息以及样本对象。4.根据权利要求1所述的方法,其特征在于,所述至少一种页面链接关系包括列表页面链接至详情页面;所述按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息包括:从所述多组匹配对中,确定与同一个对象存在匹配关系的多个关键信息;根据所述多个关键信息分别与所述对象的匹配程度,确定第一关键信息及第二关键信息;结合关键信息与列表页面对应关系,确定所述第一关键信息指向的第一列表页面、所述对象的第一详情页面,以及将所述第二关键信息作为所述第一列表页面中的内链。5.根据权利要求4所述的方法,其特征在于,所述根据所述多个关键信息分别与所述对象的匹配程度,确定第一关键信息及第二关键信息包括:根据所述多个关键信息分别与所述对象的匹配程度,确定匹配程度满足第一匹配要求的第一关键信息以及确定匹配程度满足第二匹配要求的第二关键信息。6.根据权利要求1所述的方法,其特征在于,所述至少一种页面链接关系包括详情页面链接列表页面;所述按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息包括:从所述多组匹配对中,按照关键信息与对象匹配程度,查找目标匹配对;
结合关键信息与列表页面对应关系,确定所述目标匹配对中的目标关键信息指向的目标列表页面,目标对象的目标详情页面,以及将所述目标关键信息作为所述目标详情页面中的内链。7.根据权利要求1所述的方法,其特征在于,所述至少一种页面链接关系包括详情页面链接详情页面;所述按照所述至少一种页面链接关系,将所述多组匹配对进行关联转换,获得所述至少一种页面链接关系分别对应的两个页面以及所述两个页面之间用以作为内链的关键信息包括:确定满足相关性要求的第一对象和第二对象;从所述多组匹配对中,查找所述第一对象匹配的第一关键信息;确定所述第一对象的第一详情页面,所述第二对象的第二详情页面,并将所述第一关键信息...

【专利技术属性】
技术研发人员:鲁志红
申请(专利权)人:杭州阿里巴巴海外网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1