【技术实现步骤摘要】
一种数据处理方法及装置
本申请涉及数据处理
,特别涉及一种数据处理方法及装置。
技术介绍
近几年,基于互联网平台提供的服务越来越多,其中,数据查询服务已经在各个行业中广泛应用。数据查询服务可以根据用户输入的搜索词从平台上获取相关数据,并将相关数据展示给用户,具体的相关数据例如可以包括文档、产品信息等数据。在一些特定行业内,如互联网行业,随着企业不断的发展,企业内信息系统沉淀积累的数据信息较多。由于企业内部数据信息的保密性和不可公开性,诸多信息一般不允许对外部搜索引擎开放,仅允许在组织架构的局域网内访问。企业内部积累的数据信息对于企业用户来说,是具有价值的数据资料,对推动企业内部知识转移和学习具有重要意义。但是,目前很多行业内组织架构复杂,组织架构内用户在根据搜索词搜索企业内数据时,企业内组织架构往往仅根据搜索词匹配到与所述搜索词相似的内部数据,并将该数据展示给用户。利用上述方式获取的用户数据往往只能获取一些字面上与搜索词相关的数据信息,但是却无法满足用户的实际搜索诉求。因此,现有技术中亟需一种与用户实际的搜索需求相匹配的数据处理方式。
技术实现思路
本申请实施例 ...
【技术保护点】
一种数据处理方法,所述方法包括:获取用户的身份信息、搜索词以及与所述搜索词相匹配的搜索结果项集合;获取所述用户对所述搜索结果项集合的历史访问数据,以及与所述用户的所述身份信息相匹配的多个其他用户对所述搜索结果项集合的历史访问数据;根据所述用户的历史访问数据以及所述多个其他用户的历史访问数据,从所述搜索结果项集合中提取出推荐给所述用户的至少一个搜索结果项。
【技术特征摘要】
1.一种数据处理方法,所述方法包括:获取用户的身份信息、搜索词以及与所述搜索词相匹配的搜索结果项集合;获取所述用户对所述搜索结果项集合的历史访问数据,以及与所述用户的所述身份信息相匹配的多个其他用户对所述搜索结果项集合的历史访问数据;根据所述用户的历史访问数据以及所述多个其他用户的历史访问数据,从所述搜索结果项集合中提取出推荐给所述用户的至少一个搜索结果项。2.根据权利要求1所述的方法,所述根据所述用户的历史访问数据以及所述多个其他用户的历史访问数据,从所述搜索结果项集合中提取出推荐给所述用户的至少一个搜索结果项包括:根据所述用户以及所述多个其他用户的历史访问数据,分别统计所述用户以及所述多个其他用户分别对所述搜索结果项的访问频率;根据所述访问频率从所述搜索结果项集合中提取所述身份信息所对应的频繁项集合;根据所述用户的历史访问数据以及所述频繁项集合,从所述搜索结果项集合中提取出推荐给所述用户的至少一个搜索结果项。3.根据权利要求2所述的方法,所述根据所述访问频率从所述搜索结果项集合中提取所述身份信息所对应的频繁项集合包括:根据所述访问频率分别统计所述搜索结果项集合中搜索结果项的总访问频率;根据所述搜索结果项的总访问频率计算所述搜索结果项的支持度值;根据所述搜索结果项的支持度值计算所述搜索结果项集合的总支持度值;将所述搜索结果项集合中支持度值不小于所述总支持度值的搜索结果项的集合作为所述身份信息对应的频繁项集合。4.根据权利要求2所述的方法,当所述身份信息包括多个身份等级时,所述根据所述访问频率从所述搜索结果项集合中提取所述身份信息所对应的频繁项集合包括:根据所述访问频率分别从所述搜索结果项集合中分别提取所述多个身份等级对应的频繁项集合;将所述多个身份等级对应的频繁项集合的交集作为所述身份信息所对应的频繁项集合。5.根据权利要求1所述的方法,所述从所述搜索结果项集合中提取出推荐给所述用户的至少一个搜索结果项包括:从所述搜索词中提取至少一个搜索分词;分别计算所述至少一个搜索分词在所述搜索结果项中多个搜索区域的邻近度值;根据所述邻近度值以及所述多个搜索区域的权重值,分别计算所述搜索词对应于所述搜索结果项的邻近度值;根据所述用户的历史访问数据、所述多个其他用户的历史访问数据以及所述搜索词对应于所述搜索结果项的邻近度值,从所述搜索结果项集合中提取出推荐给所述用户的至少一个搜索结果项。6.根据权利要求5所述的方法,所述根据所述用户的历史访问数据、所述多个其他用户的历史访问数据以及所述搜索词对应于所述搜索结果项的邻近度值,从所述搜索结果项集合中提取出推荐给所述用户的至少一个搜索结果项包括:根据所述用户的历史访问数据、所述多个其他用户的历史访问数据,分别计算所述用户对应于所述搜索结果项的个性化权重值;根据所述搜索词对应于所述搜索结果项的邻近度值以及所述用户对应于所述搜索结果项的个性化权重值,计算所述搜索结果项的评分值;将所述搜索结果项集合中评分值大于预设阈值的搜索结果项推荐给所述用户。7.一种数据处理装置,所述装置包括:结果项获取单元,用于获取用户的身份信息、搜索词以及与所述搜索词相匹配的搜索结果项集合;历史数据获取单元,用于获取所述用户对所述搜索结果项集合的历史访问数据,以及与所述用户的所述身份信息相匹配...
【专利技术属性】
技术研发人员:王彦锋,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。