【技术实现步骤摘要】
搜索结果排序方法、装置、设备及存储介质
[0001]本专利技术涉及计算机
,尤其涉及一种搜索结果排序方法、装置、设备及存储介质。
技术介绍
[0002]目前,搜索引擎中一般存储有海量的网页数据,数据量级甚至可以到达百亿级别,且其中网页数据中的内容形式一般可以包括视频、音乐、文本等多种形式,对此类网页数据进行分类是一种极大的考验,现有的搜索引擎分类计数一般只会采用模型将网页数据粗分为少数类别,但是因为分类的类别过少,粒度不足,导致在对搜索引擎反馈的搜索结果排序时的效果差。
[0003]上述内容仅用于辅助理解本专利技术的技术方案,并不代表承认上述内容是现有技术。
技术实现思路
[0004]本专利技术的主要目的在于提供一种搜索结果排序方法、装置、设备及存储介质,旨在解决现有技术网页数据分类粒度不足,导致对搜索结果排序效果差的技术问题。
[0005]为实现上述目的,本专利技术提供了一种搜索结果排序方法,所述方法包括以下步骤:
[0006]在接收到数据搜索请求时,提取所述数据搜索请求中的搜 ...
【技术保护点】
【技术特征摘要】
1.一种搜索结果排序方法,其特征在于,所述搜索结果排序方法包括以下步骤:在接收到数据搜索请求时,提取所述数据搜索请求中的搜索关键字;根据所述搜索关键字进行数据搜索,获得多个搜索结果;获取各搜索结果对应的主类别标签及子类别标签;根据所述主类别标签及所述子类别标签对所述多个搜索结果进行排序。2.如权利要求1所述的搜索结果排序方法,其特征在于,所述在接收到数据搜索请求时,提取所述数据搜索请求中的搜索关键字的步骤之前,还包括:获取预设引擎库中存储的网页数据;通过预设分类模型生成各网页数据对应的主类别标签及子类别标签;根据所述主类别标签及所述子类别标签对所述预设引擎库中存储的网页数据进行更新。3.如权利要求2所述的搜索结果排序方法,其特征在于,所述通过预设分类模型生成各网页数据对应的主类别标签及子类别标签的步骤,包括:获取预设分类模型对应的输入数据格式;遍历所述网页数据,并将遍历得到的网页数据作为当前网页数据;获取所述当前网页数据对应的网页标题及网页内容;将所述网页标题及网页内容进行拼接,并将拼接后的数据转换为所述输入数据格式,获得模型输入数据;通过所述预设分类模型对所述模型输入数据进行类别分析,获得所述当前网页数据对应的主类别标签及子类别标签;检测所述网页数据是否存在未被遍历过的网页数据;若不存在,则执行所述根据所述主类别标签及所述子类别标签对所述预设引擎库中存储的网页数据进行更新的步骤。4.如权利要求3所述的搜索结果排序方法,其特征在于,所述检测所述网页数据是否存在未被遍历过的网页数据的步骤之后,还包括:若存在,则返回所述遍历所述网页数据,并将遍历得到的网页数据作为当前网页数据的步骤。5.如权利要求2所述的搜索结果排序方法,其特征在于,所述获取预设引擎库中存储的网页数据的步骤之前,还包括:在预设类别设置表中查找对应的各网页主类别对应的网页子类别;在预设用户日志库中查找多条用户点击日志;根据所述用户点击日志构建各网页子类别对应的模型训练子集;通过所述模型训练子集对初始分类模型进行训练,获得预设分类模型。6.如权利要求5所...
【专利技术属性】
技术研发人员:付宁佳,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。