本发明专利技术实施例公开了一种社区用户的搜索排序方法,该方法包括:根据用户的历史行为数据计算预排序因子和离线排序因子;以所述预排序因子为权值对用户倒排索引进行加权排序,得到有序倒排的用户索引数据;对于登录态搜索的用户,在根据所述索引数据得到的搜索结果中,根据所述离线排序因子对所述搜索结果进行加权计算,得到最终排序结果。本发明专利技术还公开了一种社区用户的搜索排序系统,该方法和系统能够使用户得到更优化的搜索排序结果。
【技术实现步骤摘要】
本专利技术涉及互联网
,特别涉及一种社区用户的搜索排序方法及系统。
技术介绍
社区化是互联网发展的最重要的方向之一,众多如微博、天涯、Qzone、朋友、人人、校内等著名社区网站也正在为广大用户提供无时空限制的更广阔的社会活动空间,并逐渐成为了人们生活中不可或缺的一部分。随着网络社区化的发展,越来越多的人正在使用各种不同的社区,而每个社区内的用户也在迅速的增长,而在社区中找到自己感兴趣的人,即对社区用户的搜索排序功能,则成为了社区为用户提供的一个重要应用,而对于该应用来说,如何在海量用户数据中快速准确的找到用户想要搜索的社区用户并将搜索结果进行合适的排序,则是反映该功能好坏的重要的因素。而目前大部分社区中提供的搜索排序中,搜索部分采用的是单一的用户属性匹配搜索,排序部分采用简单的匹配度排序,即社区后台分字段存储用户的姓名、出生年月日、学校、公司、所在地、兴趣等用户属性字段,搜索时根据用户输入的关键字,在这些字段中进行搜索和匹配,得到搜索结果;并按照关键字的匹配度进行搜索结果的排序。对于目前社区用户的数量来说,采用现有的搜索排序方法得到的搜索结果较多,而因为使用的排序因子单一,具有相同匹配度的搜索结果也很多,而对于这类搜索结果,现有技术一般是随机排序,这就造成了用户在搜索结果首页或者前几页看到的搜索结果并不是最优化的,距离用户真正的需求相差甚多,用户往往需要多次搜索才能找到需要的人。
技术实现思路
有鉴于此,本专利技术提供了一种社区用户的搜索排序方法及系统,能够得到更优化的搜索排序结果。为达上述目的,本专利技术的技术方案具体是这样实现的一种社区用户的搜索排序方法,该方法包括根据用户的历史行为数据计算预排序因子和离线排序因子;以所述预排序因子为权值对用户倒排索引进行加权排序,得到有序倒排的用户索引数据;对于登录态搜索的用户,在根据所述索引数据得到的搜索结果中,根据所述离线排序因子对所述搜索结果进行加权计算,得到最终排序结果。较佳地,该方法进一步包括对于非登录态搜索的用户,获取所述非登录态搜索的用户的位置信息计算在线排序因子;在根据所述索引数据得到的搜索结果中,根据所述在线排序因子对所述搜索结果进行排序,将与所述非登录态搜索的用户的位置相同或相近的项目靠前排列,得到最终的排序结果。较佳地,该方法进一步包括获取所述登录态搜索的用户的位置信息计算在线排序因子;在根据所述索引数据得到的搜索结果中,进一步根据所述在线排序因子和离线排序因子对搜索结果进行加权计算,将与所述登录态搜索的用户的位置相同或相近的社区用户靠前排列,得到最终的排序结果。较佳地,该方法进一步包括根据所述登录态搜索的用户的属性信息,计算在线排序因子;在根据所述索引数据得到的搜索结果中,进一步根据所述在线排序因子和离线排序因子对所述搜索结果进行加权计算,将与所述登录态搜索的用户具有相同或相近属性的社区用户靠前排列,得到最终的排序结果。较佳地,所述预排序因子包括根据用户在社区的等级数据、最近登录和使用社区的情况数据计算的用户活跃度。较佳地,所述离线排序因子包括如下至少一种根据用户在社区发表或阅读的文章、交流和交友对象、关注对象数据分析得到的用户喜好信息或用户分类信息;根据用户在社区的好友、关注对象数据分析得到的用户潜在好友关系链信息;根据用户与好友之间的相互行为数据计算的用户亲密程度信息。—种社区用户的搜索排序系统,该系统包括离线分析模块,用于根据用户的历史行为数据计算预排序因子和离线排序因子;索引模块,用于以所述预排序因子为权值对用户倒排索引进行加权排序,得到有序倒排的用户索引数据;排序模块,对于登录态搜索的用户,用于在根据所述索引数据得到的搜索结果中,根据所述离线排序因子对所述搜索结果进行加权计算,得到最终排序结果。较佳地,该系统进一步包括在线分析模块,对于非登录态搜索的用户,用于获取所述非登录态搜索的用户的位置信息计算在线排序因子;所述排序模块,对于非登录态搜索的用户,进一步用于,在根据所述索引数据得到的搜索结果中,根据所述在线排序因子对所述搜索结果进行加权计算,将与所述用户的位置相同或相近的项目靠前排列,得到最终的排序结果。较佳地,该系统进一步包括在线分析模块,用于获取所述登录态搜索的用户的位置信息计算在线排序因子;所述排序模块,进一步用于,在根据所述索引数据得到的搜索结果中,根据所述离线排序因子和在线排序因子对搜索结果进行加权计算,将与所述登录态搜索的用户的位置相同或相近的项目靠前排列,得到最终的排序结果。较佳地,该系统进一步包括在线分析模块,根据所述登录态搜索的用户的属性信息,计算在线排序因子;所述排序模块,进一步用于,在根据所述索引数据得到的搜索结果中,根据所述在线排序因子和离线排序因子对所述搜索结果进行加权计算,将与所述登录态搜索的用户具有相同或相近属性的社区用户靠前排列,得到最终的排序结果。较佳地,所述离线分析模块包括预排序因子计算单元,用于根据用户在社区的等级数据、最近登录和使用社区的情况数据计算的用户活跃度计算预排序因子;离线排序因子计算单元,用于将根据用户在社区发表或阅读的文章、交流和交友对象、关注方向数据分析得到用户喜好信息或用户分类信息计算离线排序因子;和/或,将根据用户在社区的好友、关注对象数据分析得到的用户潜在好友关系链信息计算离线排序因子;和/或,将根据用户与好友之间的相互行为数据计算的用户亲密程度信息计算离线排序因子。由上述技术方案可见,本专利技术的这种社区用户的搜索排序方法和系统,在搜索排序技术的排序部分引入了根据用户历史行为数据计算得到的预排序因子和离线排序因子;通过将预排序因子作为权值,在建立索引数据时,预先对倒排索引进行预排序,得到有序倒排的索引数据;以及将离线排序因子作为权值,对根据有序倒排的索引数据得到的搜索结果再进行加权计算,从而能够使搜索结果的排列更加贴合用户的需求,与用户的关联性更大,即达到了搜索结果的优化目的。附图说明图I为本专利技术实施例的搜索排序方法实现原理图;图2为本专利技术实施例的搜索排序系统结构示意图;图3为本专利技术实施例的离线分析模块结构示意图。具体实施例方式为使本专利技术的目的、技术方案及优点更加清楚明白,以下参照附图并举实施例,对本专利技术进一步详细说明。本专利技术主要是在搜索排序方法的排序部分,引入了根据用户历史行为数据预先计算得到的预排序因子和离线排序因子,在建立索引数据时,以所述预排序因子为权值对用户倒排索引进行加权排序,得到有序倒排的用户索引数据;对于登录态搜索的用户,在根据所述索引数据得到的搜索结果中,根据所述离线排序因子对所述搜索结果进行加权计算,得到最终排序结果。通过预排序因子和离线排序因子,使得本专利技术的搜索排序方法更加贴合用户需求,与用户关联性更大。图I为本专利技术的搜索排序方法实现原理图,如图I所示,本专利技术对现有排序的改进包括I、索引数据建立过程在建立所述用户的索引数据时,根据预排序因子对所述用户倒排索引进行预排序,得到有序倒排的用户索引数据。索引数据是搜索引擎预先建立的基于用户属性字段的搜索索引,现有技术中,对于索引数据是不进行排序的,索引数据中各项目的排列随机,而在本专利技术中,则引入了预排序因子的概念,根据预排序因子为各项目赋予不同的权值,对索引数据中各项目进行加权计算,即预排序,从而得本文档来自技高网...
【技术保护点】
一种社区用户的搜索排序方法,其特征在于,该方法包括:根据用户的历史行为数据计算预排序因子和离线排序因子;以所述预排序因子为权值对用户倒排索引进行加权排序,得到有序倒排的用户索引数据;对于登录态搜索的用户,在根据所述索引数据得到的搜索结果中,根据所述离线排序因子对所述搜索结果进行加权计算,得到最终排序结果。
【技术特征摘要】
【专利技术属性】
技术研发人员:王卫波,潘树燊,吴懿,曹放,张晶,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。