【技术实现步骤摘要】
一种标题重建方法及装置
本申请涉及数据处理
,特别涉及一种标题重建方法及装置。
技术介绍
在电子商务平台中,为了提高产品的搜索召回指数和曝光机会,往往会在展示的产品标题中堆砌很多描述词,如修饰词、营销词、产品词等。而过量的描述词会导致产品标题过长且包含不同程度的冗余信息。由于用户客户端设备(手机、平板电脑)的屏幕尺寸有限,在产品搜索结果展示页中往往展示固定长度的产品标题,因此,需要对原始的过长的产品标题进行压缩。现有技术中产品标题重建方法可以包括截断处理,即直接从原始标题中截取部分描述词作为展示的标题。比如原始的产品标题为“XX牌煎锅少油烟不粘锅煎盘牛排锅平底锅燃气专用”,受限于客户端设备屏幕的显示长度,利用现有技术中截断处理的方式,可以从原始标题中截取出展示标题“XX牌煎锅少油烟不粘锅煎盘”。可以发现,上述展示标题中缺少原始标题中的重要信息“燃气专用”,而展示标题中的“煎锅”、“不粘锅”和“煎盘”都是语义相近的词,造成产品标题的信息冗余。综上所述,现有技术中的产品标题重建方法往往造成产品部分关键信息缺失的问题,用户只有点击进入产品详情页才能获取产品全部信息,增加了用户获取信息的难度。另外,现有的标题重建方法往往包括大量语义相同词的堆砌,浪费有限的展示空间。因此,现有技术中亟需一种基于用户个性化需求的产品标题重建方法。
技术实现思路
本申请实施例的目的在于提供一种标题重建方法及装置,可以为不同的用户定制个性化的重建标题,提升用户搜索到偏好产品的效率。本申请实施例提供的标题重建方法及装置具体是这样实现的:一种标题重建方法,所述方法包括:获取产品标题,并从所 ...
【技术保护点】
1.一种标题重建方法,其特征在于,所述方法包括:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择重建描述词;利用所述重建描述词生成所述产品标题的重建标题。
【技术特征摘要】
1.一种标题重建方法,其特征在于,所述方法包括:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择重建描述词;利用所述重建描述词生成所述产品标题的重建标题。2.根据权利要求1所述的方法,其特征在于,所述根据所述权重值从所述至少一个描述词中选择重建描述词包括:提取所述至少一个描述词中的核心词;从所述至少一个描述词中除所述核心词以外的描述词中选取权重值大于预设权重阈值的描述词,将选取的所述描述词以及所述核心词作为重建描述词。3.根据权利要求1所述的方法,其特征在于,在所述根据所述权重值从所述至少一个描述词中选择重建描述词之前,所述方法还包括:从所述至少一个描述词中去除语义重复的描述词。4.根据权利要求3所述的方法,其特征在于,所述从所述至少一个描述词中去除语义重复的描述词包括:当所述描述词包括两个及两个以上时,分别计算所述描述词的词向量;根据所述词向量计算两个描述词之间的相似度;若所述相似度大于预设阈值,则从所述两个描述词中去除权重值较小的描述词。5.根据权利要求1所述的方法,其特征在于,所述权重值被设置为按照下述方式获取:获取多个用户的历史行为数据;从所述历史行为数据中统计出所述多个用户分别对多个预设描述词的访问频率;根据所述多个用户分别对所述多个预设描述词的访问频率,计算得到所述多个用户分别对所述多个描述词的权重值。6.根据权利要求5所述的方法,其特征在于,所述根据所述多个用户分别对所述多个预设描述词的访问频率,计算得到所述用户分别对所述多个描述词的权重值包括:建立所述多个用户与其对所述多个预设描述词的访问频率之间的关系矩阵;利用矩阵分解算法(SVD)对所述关系矩阵进行处理,生成所述多个用户及其与所述多个预设描述词的权重值之间的关系矩阵。7.根据权利要求1所述的方法,其特征在于,所述分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到包括:判断所述用户的历史行为数据中是否包含所述描述词;若判断结果为否,则从所述历史行为数据中获取所述描述词的相似描述词,所述相似描述词与所述描述词的相似度大于预设相似度阈值;根据所述相似描述词的权重值计算得到所述描述词的权重值。8.根据权利要求1所述的方法,其特征在于,在所述利用所述重建描述词生成所述产品标题的重建标题之后,所述方法还包括:展示所述产品标题的重建标题。9.根据权利要求8所述的方法,其特征在于,若所述产品标题包括根据搜索词搜索得到的产品标题,则在所述展示所述产品标题的重建标题之后,所述方法还包括:获取对所述搜索词进行调整操作之后生成的更新产品标题的描述词,所述调整操作包括增加搜索词和/或减少搜索词;若所述更新产品标题的描述词中包括增加的搜索词,则增加所述描述词的权重值;若描述词中包括减少的搜索词,则降低所述描述词的权重值;根据调整权重值后的描述词,对所述更新产品标题进行标题重建。10.根据权利要求1所述的方法,其特征在于,所述利用所述重建描述词生成所述产品标题的重建标题包括:利用预设语言模型对所述重建描述词进行词序调整,生成所述产品标题的重建标题。11.一种标题重建装置,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计...
【专利技术属性】
技术研发人员:王金刚,裘龙,郎君,司罗,
申请(专利权)人:阿里巴巴集团控股有限公司,
类型:发明
国别省市:开曼群岛,KY
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。