【技术实现步骤摘要】
商品标签生成方法及装置
本专利技术涉及互联网
,尤其涉及一种商品标签生成方法及装置。
技术介绍
随着互联网技术的不断发展,越来越多的用户通过互联网进行相关活动,如浏览新闻、购物等。为了帮助用户对商品进行更细致的分类和整理,也为了方便用户更快地定位感兴趣的商品,很多互联网应用中为商品分配标签,细化对商品的描述和分类,同时服务器也可以根据标签向用户推荐相应的商品。其中,标签是指用来描述商品相关属性的短语。目前,提取标签的方法,一般采用如下两种方式:人工分配商品标签,或服务器通过分析商品的相关描述信息,提取合适的标签;其中,商品相关描述信息例如包括商品的文字描述、用户对于商品的评论等文本信息。上述第一种方式,由于互联网上的新商品层出不穷,仅依赖少量人力人工分配商品标签存在效率低的问题;第二种方式,仅根据商品的相关描述信息,存在准确度低、不全面的问题。
技术实现思路
本专利技术提供一种商品标签生成方法及装置,以实现准确自动生成商品标签的目的。第一方面,本专利技术实例提供一种商品标签生成方法,包括:服务器根据商品集合内每个商品对应的文本描述信息,获取每个商品的文本特征;所述商品集合包括至少两个商品;所述服务器根据用户的行为序列,获取每个商品的邻近对象;所述邻近对象包括:在所述用户的行为序列中,且与所述商品出现的时间间隔小于预设的时间间隔阈值的商品;所述服务器确定所述商品集合内部分商品的初始标签集;每个初始标签集包括至少一个标签;所述服务器根据所述文本特征、所述邻近对象及所述初始标签集,采用异源标签主题模型,为所述商品集合内的商品生成标签。第二方面,本专利技术实例提 ...
【技术保护点】
一种商品标签生成方法,其特征在于,包括:服务器根据商品集合内每个商品对应的文本描述信息,获取每个商品的文本特征;所述商品集合包括至少两个商品;所述服务器根据用户的行为序列,获取每个商品的邻近对象;所述邻近对象包括:在所述用户的行为序列中,且与所述商品出现的时间间隔小于预设的时间间隔阈值的商品;所述服务器确定所述商品集合内部分商品的初始标签集;每个初始标签集包括至少一个标签;所述服务器根据所述文本特征、所述邻近对象及所述初始标签集,采用异源标签主题模型,为所述商品集合内的商品生成标签。
【技术特征摘要】
1.一种商品标签生成方法,其特征在于,包括:服务器根据商品集合内每个商品对应的文本描述信息,获取每个商品的文本特征;所述商品集合包括至少两个商品;所述服务器根据用户的行为序列,获取每个商品的邻近对象;所述邻近对象包括:在所述用户的行为序列中,且与所述商品出现的时间间隔小于预设的时间间隔阈值的商品;所述服务器确定所述商品集合内部分商品的初始标签集;每个初始标签集包括至少一个标签;所述服务器根据所述文本特征、所述邻近对象及所述初始标签集,采用异源标签主题模型,为所述商品集合内的商品生成标签。2.根据权利要求1所述的方法,其特征在于,采用异源标签主题模型,为所述商品集合内的商品生成标签之前,还包括:所述服务器根据所述文本特征、所述邻近对象和所述标签的生成过程,建立所述异源标签主题模型。3.根据权利要求1或2所述的方法,其特征在于,所述服务器根据所述文本特征、所述邻近对象及所述初始标签集,采用异源标签主题模型,为所述商品集合内的商品生成标签,具体包括:所述服务器根据所述文本特征、所述邻近对象、所述初始标签集,以及所述异源标签主题模型,采用0阶展开的变分法获取所述商品的隐含主题分布和所述隐含主题分布对应的标签分布;所述服务器将所述隐含主题分布和所述标签分布的内积的向量中,大于预设阈值的元素对应的标签作为所述商品的标签。4.根据权利要求1-3任一项所述的方法,其特征在于,所述异源标签主题模型,包括:所述服务器针对商品i,根据所述商品i的隐含主题分布θi,从所述隐含主题分布θi的多项分布中随机选取隐含主题和分别作为所述商品i的第j个文本特征对应的隐含主题以及所述商品i的第r个邻近对象对应的隐含主题;i的取值范围为从1到所述商品集合的商品总个数;j的取值范围为从1到所述商品i的文本特征个数;r的取值范围为从1到所述商品i的邻近对象个数;所述服务器针对隐含主题k,根据所述隐含主题对应的文本特征分布φk,以及隐含主题对应的邻近对象分布ψk,从所述文本特征分布φk和邻近对象分布ψk的多项分布随机选取一个文本特征和邻近对象k的取值范围为从1到K;所述K为隐含主题总个数,且为大于1的整数;所述服务器针对所述商品i的标签lt,获取所述标签lt的指示变量,根据所述指示变量所对应的隐含主题以及所述隐含主题对应的标签分布从所述标签分布的多项分布中随机选取一个标签,作为所述商品i的标签;lt∈T={l1,l2,…,l|T|};|T|表示集合T的元素个数;所述T为所述初始标签集的并集;其中,对于所述隐含主题k,所述文本特征分布φk满足变量为β的狄利克雷分布;所述β为预设参数;所述邻近对象分布ψk满足变量为γ的狄利克雷分布;所述γ为预设参数;所述标签分布满足变量为η的狄利克雷分布;所述η为预设参数;对于所述商品i,所述隐含主题分布θi满足变量为α的狄利克雷分布;所述α为预设参数。5.根据权利要求4所述的方法,其特征在于,获取所述标签lt的指示变量,具体包括:从均匀分布中随机获取所述标签lt的指示变量yit;若则所述标签t对应的隐含主题为若则所述标签t对应的隐含主题为其中,所述和分布为所述商品i的文本特征个数和邻近对象个数。6.根据权利要求5所述的方法,其特征在于,采用0阶展开的变分法获取所述商品的隐含主题分布和所述隐含主题分布对应的标签分布,具体包括:根据如下公式确定所述商品i的隐含主题分布θi和所述标签分布其中,θi为θik组成的向量;为组成的向量;mk·=∑...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。