个性化数据搜索方法及装置制造方法及图纸

技术编号:11946139 阅读:74 留言:0更新日期:2015-08-26 16:30
本申请涉及一种个性化数据搜索方法及装置,包括:根据当前用户的搜索请求中的查询词搜索数据对象;依据历史行为日志,分别确定历史用户在利用查询词的搜索访问过程中的第一行为特征,并生成查询词的意图向量;根据用户属性,统计每一个用户群体对数据对象的第二行为特征,并生成用户群体的偏好向量;计算查询词的意图向量与每一用户群体的偏好向量的相似度;将相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体;利用参照群体的历史行为特征调整当前用户使用所述查询词搜索到的数据对象的排序。从而改进和提升了搜索平台的性能,提高输出给用户的搜索结果的准确性,为用户输出最合理最符合其搜索意图的结果。

【技术实现步骤摘要】

本申请涉及数据搜索领域,更具体地涉及一种个性化数据搜索方法及装置
技术介绍
随着互联网业务迅速发展,网络中的数据量日益增加。数据搜索引擎已经成为帮助用户在海量数据对象中找到自己满意的数据对象的重要工具。尽管数据搜索引擎可以在海量数据对象中筛选出用户所需要的搜索结果(数据对象),但是,无论如何使用数据搜索引擎来搜索数据对象,其关键技术都包含对搜索出的搜索结果中所有的数据对象进行排序的输出处理。也即是说,用户输入一个查询词后,通过搜索找到对应的数据对象作为搜索结果,并以一定的排序方式展示输出这些搜索结果。通常,数据搜索技术与用户本身的差异或者用户的特点无关,仅与查询词有关。也就是说对不同用户使用同一个查询词,搜索到的全部数据对象一致即搜索结果完全一致,并且,对搜索结果的输出展示的排序方式相同。因而不同用户采用同一查询词搜索,最后看到的以一定顺序展示的搜索结果相同。由此,个性化搜索技术逐渐兴起。所谓个性化搜索,是指不同用户能获得不同的输出展示排序的搜索结果,并本文档来自技高网...

【技术保护点】
一种个性化数据搜索方法,其特征在于,包括:根据当前用户的搜索请求中的查询词搜索数据对象;依据历史行为日志,分别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据所述第一行为特征生成所述查询词的意图向量;根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行为特征,根据所述第二行为特征生成所述用户群体的偏好向量;计算所述查询词的意图向量与每一用户群体的偏好向量的相似度;将所述相似度大于设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体;利用所述参照群体的历史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序。

【技术特征摘要】
1.一种个性化数据搜索方法,其特征在于,包括:
根据当前用户的搜索请求中的查询词搜索数据对象;
依据历史行为日志,分别确定历史用户在利用所述查询词的搜索访问过
程中的第一行为特征,根据所述第一行为特征生成所述查询词的意图向量;
根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体对
所述数据对象的第二行为特征,根据所述第二行为特征生成所述用户群体的
偏好向量;
计算所述查询词的意图向量与每一用户群体的偏好向量的相似度;
将所述相似度大于设定阈值时对应的用户群体作为确定当前用户的意
图偏好的参照群体;
利用所述参照群体的历史行为特征调整所述当前用户使用所述查询词搜
索到的数据对象的排序。
2.根据权利要求1所述的方法,其特征在于,依据历史行为日志,分
别确定历史用户在利用所述查询词的搜索访问过程中的第一行为特征,根据
所述第一行为特征生成所述查询词的意图向量的步骤,进一步包括:
根据数据对象在某一设定维度上的特征,将搜索到的数据对象划分为一
个或多个类别;
依据历史行为日志,分别确定历史用户基于所述查询词搜索到所述数据
对象并对每一个类别下的所述数据对象上发生了指定行为的次数,以所述指
定行为的次数作为所述第一行为特征;
根据所述第一行为特征生成所述查询词的意图向量。
3.根据权利要求1或2所述的方法,其特征在于,根据用户属性,将

\t历史用户分为多个用户群体,统计每一个用户群体对所述数据对象的第二行
为特征,根据所述第二行为特征生成所述用户群体的偏好向量的步骤,包括:
根据用户属性,将历史用户分为多个用户群体,统计每一个用户群体在
每一个所述类别的数据对象上发生的指定行为的次数;
依据每个数据对象在设定维度下所属于类别,统计在该设定维度下的每
个类别中的所有数据对象上由某一用户群体的用户进行指定行为的次数;以
该用户群体的用户对每一个类别的数据对象进行了指定行为的次数为所述第
二行为特征;
根据所述第二行为特征生成所述用户群体的偏好向量。
4.根据权利要求1-3之一所述的方法,其特征在于,将所述相似度大于
设定阈值时对应的用户群体作为确定当前用户的意图偏好的参照群体的步骤,
包括:
将计算得到的所述相似度,进行相关性计算以获得相关性的值;
将相关性的值与预先设置的阈值进行比较,当所述相关性的值大于等于
所述阈值时,确定当前搜索请求中的查询词所属的用户群体对应进行相似度
计算的用户群体。
5.根据权利要求1-4之一所述的方法,其特征在于,利用所述参照群体
的历史行为特征调整所述当前用户使用所述查询词搜索到的数据对象的排序
的步骤,包括:
根据确定当前用户的意图偏好的参照群体,从该参照群体中获取用户的
特征、以及用户的一种或多种用户行为所对应的数据对象的特征中,选择一
项或多项特征形成的特征组合,训练个性化模型,确定数据对象的特征针对
用户特征的个性化权重;
根据所述个性化权重,对当前搜索请求中的查询词所搜索到的一个或多
个数据对象进行排序。
6.根据权利要求5所述的方法,其特征在于,根据所述个性化权重,对
当前搜索请求中的查询词所搜索到的一个或多个数据对象进行排序,包括:
根据预先存储的用户特征和数据对象的特征,从每个用户行为数据中提
取所述当前用户的意图偏好的参照群体的用户的用户特征、以及相应的数据
对象的特征;
利用所述当前用户的意图偏好的参照群体的用户的用户特征和相应的、
与所述查询词匹配的每个数据对象的特征,与所述确定的数据对象的特征针
对用户特征的个性化权重进行匹配,得到相匹配的数据对象的特征针对用户
特征的个性化权重;
根据相匹配的所述个性化权重,预测搜索到的一个或多个数据对象的个
性化分数,以根据所述个性化分数,对一个或多个数据对象进行排序。
7.根据权利要求6所述的方法,其特征在于,根据预先存储的用户特征
和数据对象的特征,从每个用户行为数据中提取所述当前用户的意图偏好的
参照群体的用户的用户特征、以及相应的数据对象的特征,包括:
如果当前搜索请求中的用户所属的历史用户群体与所述当前用户的意图
偏好的参照群体存在矛盾,由当前用户的意图偏好的参照群体修正所述当前
搜索请求中的用户所属的历史用户群体,并将修正后的用户的意图偏好的参
照群体作为当前用户群体;
从...

【专利技术属性】
技术研发人员:陈曦
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1