An embodiment of the invention relates to a search method and device. The method includes: obtaining the behavior log of the historical user, in which the behavior log includes the user's use of the customary data; according to the used custom data, the historical user's characteristic attributes are obtained. According to the historical user characteristic data, the Bias classification algorithm is used for history. The user classifies, obtains the user class set, the user category concentrates the preference song of each category of users and the click rate of the preferred song. When the target user searches, the target user's usage data is matched with the user class set, and the target user's category is determined, and the target is used in the search result. The preference songs of users' categories are sorted according to the click rate of preference songs. For each type of users, the personalized search results are provided by analyzing the user's own usage habits and song preferences, so that each type of user is more satisfied with their respective search results and improves the user experience.
【技术实现步骤摘要】
一种搜索方法及装置
本专利技术涉及大数据处理领域,尤其涉及一种搜索方法及装置。
技术介绍
随着互联网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找自己所需的信息,就象大海捞针一样。现有技术中,用户主要基于搜索词和搜索资源的匹配程度来返回搜索结果,这样有两点不足:第一,搜索结果按照资源热度排序,不满足小众用户的搜索期望;第二,不同用户的使用习惯不同,不同状态下的用户对每日不变的搜索结果不满意。
技术实现思路
本专利技术实施例提供了一种搜索方法及装置,解决了小众用户对按照资源热度排序的结果不满意以及不同状态下的用户对每日不变的搜索结果不满意的问题。第一方面,本专利技术提供了一种搜索方法,所述方法包括以下步骤:获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据;根据所述使用习惯数据,获取历史用户特征属性;根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;当目标用户进行搜索时,将目标用户的使用习惯数据与所述用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目 ...
【技术保护点】
一种搜索方法,其特征在于,所述方法包括以下步骤:获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据;根据所述使用习惯数据,获取历史用户特征属性;根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;当目标用户进行搜索时,将目标用户的使用习惯数据与所述用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示。
【技术特征摘要】
1.一种搜索方法,其特征在于,所述方法包括以下步骤:获取历史用户的行为日志,其中,所述行为日志包括用户使用习惯数据;根据所述使用习惯数据,获取历史用户特征属性;根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率;当目标用户进行搜索时,将目标用户的使用习惯数据与所述用户类别集进行匹配,确定目标用户的类别,并在搜索结果中对该目标用户的类别对应的偏好歌曲按照偏好歌曲的点击率进行排序显示。2.根据权利要求1所述的方法,其特征在于,所述用户使用习惯具体包括:用户id,用户登录状态,歌曲id,歌曲是否听完,歌曲收听时长,下载状态,付费状态。3.根据权利要求1所述的方法,其特征在于,所述特征属性具体包括:用户活跃频次,用户活跃时段,用户日均听歌数,用户日均听歌时长,用户所听歌曲平均发行年代,用户付费记录。4.根据权利要求1所述的方法,其特征在于,所述根据所述历史用户特征属性,利用贝叶斯分类算法对历史用户进行分类,获取用户类别集、所述用户类别集中每一类别用户的偏好歌曲以及所述偏好歌曲的点击率具体包括:将用户分类为:时段敏感型用户,热点偏好用户,正版歌曲偏好用户,冷门小众偏好用户,付费偏好用户等,记为有类别集合X={x1,x2,…xm},其中,m为用户分类的个数;将历史用户特征属性记为有类别集合Y={y1,y2,…yn},其中,n为历史用户特征属性个数;计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的条件概率;根据以该公式最大值作为用户分类结果,获取的用户分类结果即为用户类别集。5.根据权利要求4所述的方法,其特征在于,所述计算P(y1|x),P(y2|x),P(yn|x),获取在每一个用户类别下,每一个历史用户特征属性的条件概率具体包括:确定已知用户类别的特征属性以及该特征属性下的特征数据,即训练样本集;统计在各用户类别下各个特征属性的条件概率估计,即P(a1|y1),P(a2|y1),…,P(am|y1);P(a1|y2),P(a2|y2),…,...
【专利技术属性】
技术研发人员:赵子天,
申请(专利权)人:北京酷我科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。