一种业务对象的分类、搜索、推送方法和系统技术方案

技术编号:11478910 阅读:76 留言:0更新日期:2015-05-20 09:46
本申请提供了一种业务对象的分类、搜索、推送方法和系统,所述业务对象的分类方法包括:获取所有待分类的第一目标业务对象;所述第一目标业务对象携带有业务对象属性;分别获取所述第一目标业务对象的用户行为偏好度;分别采用所述业务对象属性计算所述第一目标业务对象与预置的特征种子业务对象的内容相似性;分别采用所述用户行为偏好度计算所述第一目标业务对象与所述特征种子业务对象的行为相关性;分别采用所述内容相似性和行为相关性计算所述第一目标业务对象与所述特征种子业务对象的相似度,获得相似度高于预设阈值的K个特征种子业务对象;将所述K个特征种子业务对象的分类信息添加到所述第一目标业务对象标记中。本申请分类准确率高。

【技术实现步骤摘要】
一种业务对象的分类、搜索、推送方法和系统
本申请实施例涉及数据搜索的
,特别是涉及一种业务对象的分类方法、一种业务对象的分类系统、一种业务对象的搜索方法、一种业务对象的搜索系统、一种业务对象的推送方法和一种业务对象的推送系统。
技术介绍
近年来,随着互联网的高速发展,网上的信息量急剧增加,各大网站越来越面向更精细化的服务。其中,垂直化运营是一个重要的发展方向。垂直化运营的主要表现为专场,比如礼品专场、旅游用品专场等等。垂直化运营通常需要大量的人工成本和运营成本,一部分原因是提取垂直化的数据,对数据分类需要大量的运营成本。比如在礼品专场中,从大量的业务对象(例如商品信息)中提取适合送礼的业务对象进行分类,都需要人工进行。对业务对象的分类,尤其是情感、风格类的标注和分类,运营成本很高。主要原因是这些业务对象的分类是语义层次上的,所以业务对象的分类准确要求对业务对象有语义上的理解。例如,“适合送爸爸的礼品”这样的类别,很难通过语法匹配或规则匹配等传统方法准确划分,往往需要靠人工来甄别、分类。特别的,由于在互联网发布的业务对象的类型和数量都在高速增长中,人工对业务对象分类的方式在时间和本文档来自技高网...
一种业务对象的分类、搜索、推送方法和系统

【技术保护点】
一种业务对象的分类方法,其特征在于,包括:获取所有待分类的第一目标业务对象;所述第一目标业务对象携带有业务对象属性;分别获取所述第一目标业务对象的用户行为偏好度;分别采用所述业务对象属性计算所述第一目标业务对象与预置的特征种子业务对象的内容相似性;所述特征种子业务对象具有一个或多个分类信息;分别采用所述用户行为偏好度计算所述第一目标业务对象与所述特征种子业务对象的行为相关性;分别采用所述内容相似性和行为相关性计算所述第一目标业务对象与所述特征种子业务对象的相似度,获得相似度高于预设阈值的K个特征种子业务对象;将所述K个特征种子业务对象的分类信息添加到所述第一目标业务对象标记中。

【技术特征摘要】
1.一种业务对象的分类方法,其特征在于,包括:获取所有待分类的第一目标业务对象;所述第一目标业务对象携带有业务对象属性;分别获取所述第一目标业务对象的用户行为偏好度;分别采用所述业务对象属性计算所述第一目标业务对象与预置的特征种子业务对象的内容相似性;所述特征种子业务对象具有一个或多个分类信息;分别采用所述用户行为偏好度计算所述第一目标业务对象与所述特征种子业务对象的行为相关性;分别采用所述内容相似性和行为相关性计算所述第一目标业务对象与所述特征种子业务对象的相似度,获得相似度高于预设阈值的K个特征种子业务对象;将所述K个特征种子业务对象的分类信息添加到所述第一目标业务对象标记中。2.根据权利要求1所述的方法,其特征在于,所述特征种子业务对象通过以下方式获得:获取所有待分类的第二目标业务对象;所述第二目标业务对象携带有业务对象属性;分别获取所述第二目标业务对象的用户行为偏好度;分别采用所述业务对象属性计算所述第二目标业务对象与预置的原始种子业务对象的内容相似性;所述原始种子业务对象具有一个或多个分类信息;分别提取与所述第二目标业务对象内容相似性最高的前M个原始种子业务对象;将所述前M个原始种子业务对象的分类信息添加到所述第二目标业务对象中;分别采用所述用户行为偏好度计算当前第二目标业务对象与其他第二目标业务对象的行为相关性;分别提取与当前第二目标业务对象行为相关性最高的前N个其他第二目标业务对象;分别将所述前N个其他第二目标业务对象的分类信息添加到当前第二目标业务对象中;将分别添加完分类信息的第二目标业务对象设置为特征种子业务对象。3.根据权利要求2所述的方法,其特征在于,所述原始种子业务对象通过以下方式获得:从网络上抓取候选业务对象,所述候选业务对象包括一个或多个分类信息;对所述候选业务对象添加预设分类信息生成原始种子业务对象。4.根据权利要求1或2或3所述的方法,其特征在于,所述分别采用所述内容相似性和行为相关性计算所述第一目标业务对象与所述特征种子业务对象的相似度,获得相似度高于预设阈值的K个特征种子业务对象的步骤包括:提取与所述第一目标业务对象内容相似性最高的前A个特征种子业务对象形成第一候选种子集合;提取与所述第一目标业务对象行为相关性最高的前B个特征种子业务对象形成第二候选种子集合;采用所述内容相似性和行为相关性计算所述第一目标业务对象与所述第一候选种子集合和第二候选种子集合中的特征种子业务对象的相似度,获得相似度高于第一阈值的K个特征种子业务对象。5.根据权利要求4所述的方法,其特征在于,所述采用所述内容相似性和行为相关性计算所述第一目标业务对象与所述第一候选种子集合和第二候选种子集合中的特征种子业务对象的相似度,获得相似度高于第一阈值的K个种子商品的步骤包括:对所述第一候选种子集合和第二候选种子集合中的特征种子业务对象的内容相似性和行为相关性分别配置对应的权重;分别针对所述第一目标业务对象采用所述权重计算所述内容相似性和行为相关性的加权之和;提取高于预设阈值的和所对应的K个特征种子业务对象。6.根据权利要求1所述的方法,其特征在于,在对所述第一目标业务对象标记所述K个特征种子业务对象的分类信息的步骤之后,还包括:分别计算当前第一目标业务对象和其他第一目标业务对象的行为相关性;分别提取与当前第一目标业务对象行为相关性最高的前L个其他第一目标业务对象;分别将所述前L个其他第一目标业务对象的分类信息添加当前第一目标业务对象中。7.根据权利要求1或6所述的方法,其特征在于,在对所述第一目标业务对象标记所述K个特征种子业务对象的分类信息的步骤之后,还包括:对所述第一目标业务对象进行过滤处理。8.根据权利要求7所述的方法,其特征在于,还包括:对所述第一目标业务对象进行倒排索引处理。9.根据权利要求1所述的方法,其特征在于,所述业务对象属性包括第一目标业务对象的标题和/或类目,所述特征种子业务对象携带有标题和/或类目;所述分别采用所述业务对象属性计算所述第一目标业务对象与预置的特征种子业务对象的内容相似性的步骤包括:分别对所述第一目标业务对象的标题,以及,特征种子业务对象的标题进行分词;对所述分词采用LDA主题模型进行匹配;采用匹配后的分词,所述第一目标业务对象的类目,和/或,所述特征种子业务对象的类目,计算所述第一目标业务对象与预置的特征种子业务对象的内容相似性。10.根据权利要求9所述的方法,其特征在于,所述采用匹配后的分词,所述第一目标业务对象的类目,和/或,所述特征种子业务对象的类目,计算所述第一目标业务对象与预置的特征种子业务对象的内容相似性的计算公式为:其中,x1k为第一目标业务对象的标题的分词和/或类目,x2k为特征种子业务对象的标题的分词和/或类目,wk为所述分词和/或类目的权重。11.根据权利要求1所述的方法,其特征在于,所述特征种子业务对象携带有用户行为偏好度;所述第一目标业务对象与特征种子业务对象的行为相关性通过以下公式计算:其中,y1k为特征种子业务对象的用户行为偏好度,y2k为第一目标业务对象的用户行为偏好度,uk为所述用户行为偏好度的权重。12.根据权利要求2所述的方法,其特征在于,所述业务对象属性包括第二目标业务对象的标题和/或类目,所述原始种子业务对象携带有标题和/或类目;所述第二目标业务对象与预置的原始种子业务对象的内容相似性通过以下方式获得:分别对所述第二目标业务对象的标题,以及,原始种子业务对象的标题进行分词;对所述分词采用LDA主题模型进行匹配;采用匹配后的分词,所述第二目标业务对象的类目,和/或,所述原始种子业务对象的类目,计算所述第二目标业务对象与预置的原始种子业务对象的内容相似性。13.根据权利要求12所述的方法,其特征在于,所述采用匹配后的分词,所述第二目标业务对象的类目,和/或,所述原始种子业务对象的类目,计算所述第二目标业务对象与预置的原始种子业务对象的内容相似性的计算公式为:其中,a1k为第二目标业务对象的标题的分词和/或类目,a2k为原始种子业务对象的标题的分词和/或类目,vk为所述分词和/或类目的权重,n为所述分类和/或类目的数量。14.根据权利要求2所述的方法,其特征在于,所述当前第二目标业务对象与其他第二目标业务对象的行为相关性通过以下公式计算:其中,b1k为当前第二目标业务对象的用户行为偏好度,b2k为其他第二目标业务对象的用户行为偏好度,rk为所述用户行为偏好度的权重,n为所述用户行为偏好度的数量。15.根据权利要求6所述的方法,其特征在于,所述当前第一目标业务对象与其他第一目标业务对象的行为相关性通过以下公式计算:其中,z1k为当前第一目标业务对象的用户行为偏好度,z2k为其他第一目标业务对象的用户行为偏好度,tk为所述用户行为偏好度的权重。16.一种业务对象的搜索方法,其特征在于,包括:接收用户的搜索请求;依据所述请求,获取搜索结果;将所述搜索结果中具有相同分类信息的业务对象合并显示;其中,所述分类信息通过以下方式获得:获取所有待分类的第一目标业务对象;所述第一目标业务对象携带有业务对象属性;分别获取所述第一目标业务对象的用户行为偏好度;分别采用所述业务对象属性计算所述第一目标业务对象与预置的特征种子业务对象的内容相似性;所述特征种子业务对象具有一个或多个分类信息;分别采用所述用户行为偏好度计算所述第一目标业务对象与所述特征种子业务对象的行为相关性;分别采用所述内容相似性和行为相关性计算所述第一目标业务对象与所述特征种子业务对象的相似度,获得相似度高于预设阈值的K个特征种子业务对象;将所述K个特征种子业务对象的分类信息添加到所述第一目标业务对象标记中。17.一种业务对象的推送方法,其特征在于,包括:获取当前用户触发的业务对象;提取所述业务对象的分类信息;将具有相同分类信息的业务对象推送给当前用户;其中,所述分类信息通过以下方式获得:获取所有待分类的第一目标业务对象;所述第一目标业务对象携带有业务对象属性;分别获取所述第一目标业务对象的用户行为偏好度;分别采用所述业务对象属性计算所述第一目标业务对象与预置的特征种子业务对象的内容相似性;所述特征种子业务对象具有一个或多个分类信息;分别采用所述用户行为偏好度计算所述第一目标业务对象与所述特征种子业务对象的行为相关性;分别采用所述内容相似性和行为相关性计算所述第一目标业务对象与所述特征种子业务对象的相似度,获得相似度高于预设阈值的K个特征种子业务对象;将所述K个特征种子业务对象的分类信息添加到所述第一目标业务对象标记中。18.一种业务对象的分类系统,其特征在于,包括:第一目标业务对象获取模块,用于获取所...

【专利技术属性】
技术研发人员:张旭杨志雄王聪智梁丽
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1