【技术实现步骤摘要】
排序方法及装置
本专利技术涉及数据处理
,特别是涉及一种排序方法及装置。
技术介绍
网络爬虫是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本,其能够快速准确地从网页中获取用户需要的信息。在使用爬虫爬取网页之前,用户需要先创建一个爬取架构(Schema)。但由于创建完整的Schema则需要花费较多的时间和精力,很多用户会选择基于Schema的共享机制,使用其他用户分享的Schema。在展示其他用户分享的Schema时,会根据排名机制对Schema进行排序并显示。现有技术中的排名机制是根据点击量、下载量等参数对分享的Schema进行排序,而有些Schema虽然点击量或下载量并不高,但是引用该Schema的其他Schema的点击量或下载量却非常高,这其实说明该Schema的适用范围很广,有用程度很高。可是这些Schema在整体排序中的排名却很低,无法体现出这些Schema的有用程度。
技术实现思路
有鉴于此,本专利技术提供的排序方法及装置,主要目的在于解决现有技术的排名机制无法按照有用程度 ...
【技术保护点】
1.一种排序方法,其特征在于,所述方法包括:/n获取目标Schema;/n计算每个目标Schema的基础热度值,所述基础热度值为所述目标Schema被直接应用的次数;/n计算每个目标Schema的贡献热度值,所述贡献热度值为所述目标Schema被引用的次数;/n根据所述目标Schema的基础热度值和所述目标Schema的贡献热度值对所述目标Schema进行排序。/n
【技术特征摘要】
1.一种排序方法,其特征在于,所述方法包括:
获取目标Schema;
计算每个目标Schema的基础热度值,所述基础热度值为所述目标Schema被直接应用的次数;
计算每个目标Schema的贡献热度值,所述贡献热度值为所述目标Schema被引用的次数;
根据所述目标Schema的基础热度值和所述目标Schema的贡献热度值对所述目标Schema进行排序。
2.根据权利要求1所述的方法,其特征在于,计算每个目标Schema的贡献热度值,包括:
获取所述每个目标Schema的继承Schema,所述继承Schema为直接或间接引用目标Schema的Schema;
计算每个继承Schema的基础热度值和贡献热度值;
根据所述每个目标Schema全部的继承Schema的基础热度值和贡献热度值,计算所述每个目标Schema的贡献热度值。
3.根据权利要求2所述的方法,其特征在于,根据所述目标Schema的基础热度值和所述目标Schema的贡献热度值对所述目标Schema进行排序,包括:
将所述每个目标Schema的基础热度值和所述每个目标Schema的贡献热度值进行叠加计算;
按照计算结果对所述目标Schema进行排序。
4.根据权利要求1或2所述的方法,其特征在于,计算每个目标Schema的基础热度值,包括:
获取根据所述每个目标Schema创建的任务数量和创建任务的账号数量;
根据所述任务数量和所述账号数量计算所述每个目标Schema的基础热度值。
5.根据权利要求4所述的方法,其特征在于,根据所述任务数量和所述账号数量计算所述每个目标Schema的基础热度值,包括:
对所述任务数量进行开方计算;
将计算后的数值和所述账号数量进行相乘计算,获得所述每个目标Schema的基础热度值。
6.根据权利要求4所述的方法,其特征在于,在根据所述任务数量和所述账号数量计算所述每个目标Schema的基础热度值之前,...
【专利技术属性】
技术研发人员:何熠皓,方朝增,
申请(专利权)人:北京国双科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。