一种标题重建方法及装置制造方法及图纸

技术编号:21914111 阅读:33 留言:0更新日期:2019-08-21 12:28
本申请实施例公开了一种标题重建方法及装置。所述方法包括:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择重建描述词;利用所述重建描述词生成所述产品标题的重建标题。利用本申请实施例,可以为不同的用户定制个性化的重建标题,提升用户搜索到偏好产品的效率。

A Title Reconstruction Method and Device

【技术实现步骤摘要】
一种标题重建方法及装置
本申请涉及数据处理
,特别涉及一种标题重建方法及装置。
技术介绍
在电子商务平台中,为了提高产品的搜索召回指数和曝光机会,往往会在展示的产品标题中堆砌很多描述词,如修饰词、营销词、产品词等。而过量的描述词会导致产品标题过长且包含不同程度的冗余信息。由于用户客户端设备(手机、平板电脑)的屏幕尺寸有限,在产品搜索结果展示页中往往展示固定长度的产品标题,因此,需要对原始的过长的产品标题进行压缩。现有技术中产品标题重建方法可以包括截断处理,即直接从原始标题中截取部分描述词作为展示的标题。比如原始的产品标题为“XX牌煎锅少油烟不粘锅煎盘牛排锅平底锅燃气专用”,受限于客户端设备屏幕的显示长度,利用现有技术中截断处理的方式,可以从原始标题中截取出展示标题“XX牌煎锅少油烟不粘锅煎盘”。可以发现,上述展示标题中缺少原始标题中的重要信息“燃气专用”,而展示标题中的“煎锅”、“不粘锅”和“煎盘”都是语义相近的词,造成产品标题的信息冗余。综上所述,现有技术中的产品标题重建方法往往造成产品部分关键信息缺失的问题,用户只有点击进入产品详情页才能获取产品全部信息,增加了用户获取信息的难度。另外,现有的标题重建方法往往包括大量语义相同词的堆砌,浪费有限的展示空间。因此,现有技术中亟需一种基于用户个性化需求的产品标题重建方法。
技术实现思路
本申请实施例的目的在于提供一种标题重建方法及装置,可以为不同的用户定制个性化的重建标题,提升用户搜索到偏好产品的效率。本申请实施例提供的标题重建方法及装置具体是这样实现的:一种标题重建方法,所述方法包括:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择重建描述词;利用所述重建描述词生成所述产品标题的重建标题。一种标题重建装置,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择重建描述词;利用所述重建描述词生成所述产品标题的重建标题。一种产品标题生成方法,所述方法包括:从产品的描述信息中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择标题描述词;利用所述标题描述词生成所述产品的标题。本申请提供的标题重建方法及装置,可以根据用户对产品标题中的描述词的权重值对较长的产品标题进行压缩处理,其中所述权重值根据用户的历史行为数据计算得到,并且可以用于表征用户对所述描述词的兴趣偏好与实际需求。利用本申请提供的实施例方法,可以在所述重建标题中保留符合用户偏好与需求的描述词,这样可以为不同的用户定制个性化的重建标题,提升用户搜索到偏好产品的效率。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是利用现有技术方法对产品标题进行重建后的界面图;图2是利用本申请技术方案对产品标题进行重建后的界面图;图3是本申请提供的标题重建方法的一种实施例的方法流程图;图4是本申请提供的计算描述词权重值方法的一种实施例的方法流程图。具体实施方式为了使本
的人员更好地理解本申请中的技术方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。为了方便本领域技术人员理解本申请实施例提供的技术方案,下面先对技术方案实现的技术环境进行说明。由上述可知,现有技术中利用简单的截断处理的方式对产品标题进行重建,不仅会造成部分关键产品信息的丢失,还会使得重建后的产品标题中包含堆砌的具有相同语义的描述词,造成重建后产品标题的信息冗余。可以发现,在实际的产品标题中,包含的信息比较多,其中一些信息与用户的偏好与需求等相关。例如用户小明通过搜索词“夏凉被”搜索到大量的夏凉被产品信息,当然,夏凉被的相关元素有很多,诸如“冰丝”、“卡通”、“套装”、“蚕丝”、“透气”等多种信息元素。假设小明比较喜欢卡通元素,并且在小明的历史搜索行为中也有所体现,那么在对夏凉被产品标题进行重建的过程中,如果能在产品标题中保留“卡通”或者类似的描述词时,不仅可以提高小明访问该产品的概率,还可以帮助用户小明快速地做出决策,确定最终所偏好的产品。但是在现有技术的标题重建过程中,往往忽略了用户的历史行为数据的作用,导致生成的重建标题一般不能体现用户的偏好和需求,使得重建标题不具有对用户的引导作用。基于类似于上文描述的技术需求,本申请提供的标题重建方法可以在进行标题重建的过程中,基于用户的历史行为数据,保留产品标题中符合用户偏好与需求的描述词,这样,可以为不同的用户定制个性化的重建标题,提升用户搜索到偏好产品的效率。下面通过一个具体的应用场景说明本实施例方法的具体实施方式。用户小M在某购物平台上挑选商品,在输入搜索词“连衣裙”之后,该购物平台上根据搜索词“连衣裙”推荐多个连衣裙的产品信息。图1所示的界面100中展示的是其中一件连衣裙的产品信息,如图1所示,由于客户端设备的尺寸限制,在图1所述的标题展示位101上只能展示14个字符。已知该连衣裙的原始完整标题为“Y牌2017新款春装女装韩版修身显瘦真丝连衣裙A字裙有大码”,共27个字符。图1中界面100的标题展示位101中展示的重建标题根据现有技术中简单的截取方式生成,如直接从原始标题中截取前14个字符。可以发现,利用现有技术的截取方式得到的重建标题中缺少一些必要信息(如“连衣裙”)以及一些重要信息(如材质描述词“真丝”),而多了一些价值较低的营销描述词(如“新款”)。由此可见,现有技术中标题重建的方式往往造成产品部分关键信息缺失以及提供冗余信息的问题,浪费有限的展示空间,增加了用户获取有用信息的难度。图2展示了利用本申请技术方案对原始标题进行重建得到的标题,如界面200的标题展示位101所示的“Y牌韩版修身真丝连衣裙女装”。下面具体介绍利用本申请技术方案对原始标题“Y牌2017新款春装女装韩版修身显瘦真丝连衣裙A字裙有大码”进行重建的过程。首先,对原始标题进行分词处理,得到“Y牌”、“2017”、“新款”、“春装”、“女装”、“韩版”、“修身”、“显瘦”、“真丝”、“连衣裙”、“A字裙”、“有大码”等12个描述词。然后,如表2所示,获取各个描述词的用户权重值。本场景中,可以根据用户小M的历史行为数据计算得到各个描述词的权重值,描述词的权重值越大,表示用户小M与该描述词的关联度越大,具体可以表现为用户小M的点击记录、收藏记录、交易记录、搜索本文档来自技高网
...

【技术保护点】
1.一种标题重建方法,其特征在于,所述方法包括:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择重建描述词;利用所述重建描述词生成所述产品标题的重建标题。

【技术特征摘要】
1.一种标题重建方法,其特征在于,所述方法包括:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到;根据所述权重值从所述至少一个描述词中选择重建描述词;利用所述重建描述词生成所述产品标题的重建标题。2.根据权利要求1所述的方法,其特征在于,所述根据所述权重值从所述至少一个描述词中选择重建描述词包括:提取所述至少一个描述词中的核心词;从所述至少一个描述词中除所述核心词以外的描述词中选取权重值大于预设权重阈值的描述词,将选取的所述描述词以及所述核心词作为重建描述词。3.根据权利要求1所述的方法,其特征在于,在所述根据所述权重值从所述至少一个描述词中选择重建描述词之前,所述方法还包括:从所述至少一个描述词中去除语义重复的描述词。4.根据权利要求3所述的方法,其特征在于,所述从所述至少一个描述词中去除语义重复的描述词包括:当所述描述词包括两个及两个以上时,分别计算所述描述词的词向量;根据所述词向量计算两个描述词之间的相似度;若所述相似度大于预设阈值,则从所述两个描述词中去除权重值较小的描述词。5.根据权利要求1所述的方法,其特征在于,所述权重值被设置为按照下述方式获取:获取多个用户的历史行为数据;从所述历史行为数据中统计出所述多个用户分别对多个预设描述词的访问频率;根据所述多个用户分别对所述多个预设描述词的访问频率,计算得到所述多个用户分别对所述多个描述词的权重值。6.根据权利要求5所述的方法,其特征在于,所述根据所述多个用户分别对所述多个预设描述词的访问频率,计算得到所述用户分别对所述多个描述词的权重值包括:建立所述多个用户与其对所述多个预设描述词的访问频率之间的关系矩阵;利用矩阵分解算法(SVD)对所述关系矩阵进行处理,生成所述多个用户及其与所述多个预设描述词的权重值之间的关系矩阵。7.根据权利要求1所述的方法,其特征在于,所述分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计算得到包括:判断所述用户的历史行为数据中是否包含所述描述词;若判断结果为否,则从所述历史行为数据中获取所述描述词的相似描述词,所述相似描述词与所述描述词的相似度大于预设相似度阈值;根据所述相似描述词的权重值计算得到所述描述词的权重值。8.根据权利要求1所述的方法,其特征在于,在所述利用所述重建描述词生成所述产品标题的重建标题之后,所述方法还包括:展示所述产品标题的重建标题。9.根据权利要求8所述的方法,其特征在于,若所述产品标题包括根据搜索词搜索得到的产品标题,则在所述展示所述产品标题的重建标题之后,所述方法还包括:获取对所述搜索词进行调整操作之后生成的更新产品标题的描述词,所述调整操作包括增加搜索词和/或减少搜索词;若所述更新产品标题的描述词中包括增加的搜索词,则增加所述描述词的权重值;若描述词中包括减少的搜索词,则降低所述描述词的权重值;根据调整权重值后的描述词,对所述更新产品标题进行标题重建。10.根据权利要求1所述的方法,其特征在于,所述利用所述重建描述词生成所述产品标题的重建标题包括:利用预设语言模型对所述重建描述词进行词序调整,生成所述产品标题的重建标题。11.一种标题重建装置,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现:获取产品标题,并从所述产品标题中提取至少一个描述词;分别获取所述至少一个描述词的用户权重值,所述权重值根据所述用户的历史行为数据计...

【专利技术属性】
技术研发人员:王金刚裘龙郎君司罗
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛,KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1