排序方法及装置制造方法及图纸

技术编号：23604273 阅读：27 留言：0更新日期：2020-03-28 05:28

本发明专利技术公开了一种排序方法及装置，涉及数据处理技术领域。本发明专利技术主要解决了现有技术的排名机制无法按照有用程度对Schema的进行排序的问题。本发明专利技术的方法包括：获取目标Schema；计算每个目标Schema的基础热度值，所述基础热度值为所述目标Schema被直接应用的次数；计算每个目标Schema的贡献热度值，所述贡献热度值为所述目标Schema被引用的次数；根据所述目标Schema的基础热度值和所述目标Schema的贡献热度值对所述目标Schema进行排序。本发明专利技术可广泛应用于对Schema进行排序的场景中。

Sequencing method and device

全部详细技术资料下载

【技术实现步骤摘要】
排序方法及装置
本专利技术涉及数据处理
，特别是涉及一种排序方法及装置。
技术介绍
网络爬虫是一种按照一定的规则，自动地抓取万维网信息的程序或者脚本，其能够快速准确地从网页中获取用户需要的信息。在使用爬虫爬取网页之前，用户需要先创建一个爬取架构(Schema)。但由于创建完整的Schema则需要花费较多的时间和精力，很多用户会选择基于Schema的共享机制，使用其他用户分享的Schema。在展示其他用户分享的Schema时，会根据排名机制对Schema进行排序并显示。现有技术中的排名机制是根据点击量、下载量等参数对分享的Schema进行排序，而有些Schema虽然点击量或下载量并不高，但是引用该Schema的其他Schema的点击量或下载量却非常高，这其实说明该Schema的适用范围很广，有用程度很高。可是这些Schema在整体排序中的排名却很低，无法体现出这些Schema的有用程度。
技术实现思路
有鉴于此，本专利技术提供的排序方法及装置，主要目的在于解决现有技术的排名机制无法按照有用程度...

【技术保护点】
1.一种排序方法，其特征在于，所述方法包括：/n获取目标Schema；/n计算每个目标Schema的基础热度值，所述基础热度值为所述目标Schema被直接应用的次数；/n计算每个目标Schema的贡献热度值，所述贡献热度值为所述目标Schema被引用的次数；/n根据所述目标Schema的基础热度值和所述目标Schema的贡献热度值对所述目标Schema进行排序。/n

【技术特征摘要】
1.一种排序方法，其特征在于，所述方法包括：
获取目标Schema；
计算每个目标Schema的基础热度值，所述基础热度值为所述目标Schema被直接应用的次数；
计算每个目标Schema的贡献热度值，所述贡献热度值为所述目标Schema被引用的次数；
根据所述目标Schema的基础热度值和所述目标Schema的贡献热度值对所述目标Schema进行排序。

2.根据权利要求1所述的方法，其特征在于，计算每个目标Schema的贡献热度值，包括：
获取所述每个目标Schema的继承Schema，所述继承Schema为直接或间接引用目标Schema的Schema；
计算每个继承Schema的基础热度值和贡献热度值；
根据所述每个目标Schema全部的继承Schema的基础热度值和贡献热度值，计算所述每个目标Schema的贡献热度值。

3.根据权利要求2所述的方法，其特征在于，根据所述目标Schema的基础热度值和所述目标Schema的贡献热度值对所述目标Schema进行排序，包括：
将所述每个目标Schema的基础热度值和所述每个目标Schema的贡献热度值进行叠加计算；
按照计算结果对所述目标Schema进行排序。

4.根据权利要求1或2所述的方法，其特征在于，计算每个目标Schema的基础热度值，包括：
获取根据所述每个目标Schema创建的任务数量和创建任务的账号数量；
根据所述任务数量和所述账号数量计算所述每个目标Schema的基础热度值。

5.根据权利要求4所述的方法，其特征在于，根据所述任务数量和所述账号数量计算所述每个目标Schema的基础热度值，包括：
对所述任务数量进行开方计算；
将计算后的数值和所述账号数量进行相乘计算，获得所述每个目标Schema的基础热度值。

6.根据权利要求4所述的方法，其特征在于，在根据所述任务数量和所述账号数量计算所述每个目标Schema的基础热度值之前，...

【专利技术属性】
技术研发人员：何熠皓，方朝增，
申请(专利权)人：北京国双科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人