当前位置: 首页 > 专利查询>浙江大学专利>正文

基于电子商务商品标题的商品搭配方法组成比例

技术编号:15238600 阅读:48 留言:0更新日期:2017-04-29 03:27
基于电子商务商品标题的商品搭配方法,为电子商务平台上每个商品收集标题描述后,针对商品标题进行如下操作:首先把每个商品的标题进行分词;为每个词计算在该标题中的TF‑IDF分数;把每个词映射为固定长度的实数向量;将该标题中的词所对应向量以TF‑IDF分数为权重进行加权平均,并用得到的新向量表示该商品;以两个商品向量间的余弦相似度表示两个商品的搭配分数。本方法的优点在于:可以自动计算电子商务网站上所有商品之间的搭配分数,为用户推荐商品套装,提高用户网购体验。

【技术实现步骤摘要】

本专利技术涉及电子商务商品推荐方法的
,特别是基于电子商务商品标题的商品搭配方法。
技术介绍
世界上约有网民30亿人左右,中国约有7亿网民,占世界总数的22%,随着互联网的高度普及和互联网在日常生活中重要性的不断上升,电子商务在人们日常购物中占有越来越重要的地位。它为我们的生活带来了巨大的便利,为经济注入巨大潜力。而且现在电子商务网站的商品越来越丰富,商品类别结构复杂,尤其是一些大型电子商务网站,如淘宝、亚马逊等电子商务平台,所包含的商品达到了几百万个。面对商品数量如此庞大的购物平台,为人们提供有效的商品推荐方法显得尤为重要。为了方便用户在线购物,现在很多电子商务平台提供商品推荐及导航功能,用户在这些推荐及导航的帮助下快速找到自己需要购买的商品。计算商品间的搭配分数在商品推荐中起到很重要的作用,不但可以根据用户已经购买的商品推荐配套商品,还能直接向用户推荐商品套装。更好地计算商品间的搭配分数,可以为用户提供更好的推荐,实现更好的用户体验。目前,在机器学习、深度学习等领域,对词汇特征的生成与在此基础上的文本表征算法的研究已经日渐成熟。在商品搭配方面,可以利用商品标题信息表示商品,如Word2Vec等技术已经广泛地被用来表示词汇,并可以在此基础上进一步将句子表示为向量。在商品被表示为一个向量后,可以利用如余弦相似度等向量间相似度度量方法来计算商品间的搭配分数。
技术实现思路
为了克服现有技术的上述缺点,本专利技术提出了一种基于电子商务商品标题的商品搭配方法,以实现自动计算电子商务网站上所有商品之间的搭配分数。该方法包括以下步骤:1、为电子商务平台上每个商品收集标题描述后,针对商品标题进行如下操作:1)把每个商品的标题tj进行分词,分词后表示为向量2)为每个词计算在标题tj中的TF-IDF分数,表示为向量3)把每个词映射为固定长度的实数向量,即词si映射为向量4)将标题tj中的词所对应向量以TF-IDF分数为权重进行加权平均,并用得到的新向量表示该商品;5)以两个商品向量间的余弦相似度表示两个商品的搭配分数。优选地,步骤2)中所述的TF-IDF分数的求取方法是:21)对于在标题tj中的词si,其重要性可表示为其中nij是词si在标题tj中出现的次数;22)对于词si,其普遍重要性可表示为其中|D|为商品标题总个数;23)对于在标题tj中的词si,其TF-IDF分数为wij=tfij×idfi。优选地,步骤4)中所述的商品向量生成方法是:用标题tj对应的向量表示商品j,用于表示标题的向量计算方法为优选地,步骤5)中所述的商品间搭配分数计算方法是:用向量表示商品m,用向量表示商品n,以向量与向量间的余弦相似度表示商品m与商品n间的搭配分数:本专利技术的优点在于:自动计算电子商务网站上所有商品之间的搭配分数,为用户推荐商品套装,提高用户体验。附图说明图1是本专利技术的方法流程图。具体实施方式参照附图,进一步说明本专利技术:一种基于电子商务商品标题的商品搭配方法,该方法包括以下步骤:1、为电子商务平台上每个商品收集标题描述后,针对商品标题进行如下操作:1)把每个商品的标题tj进行分词,分词后表示为向量2)为每个词计算在标题tj中的TF-IDF分数,表示为向量3)把每个词映射为固定长度的实数向量,即词si映射为向量4)将标题tj中的词所对应向量以TF-IDF分数为权重进行加权平均,并用得到的新向量表示该商品;5)以两个商品向量间的余弦相似度表示两个商品的搭配分数。步骤2)中所述的TF-IDF分数:21)对于在标题tj中的词si,其重要性可表示为其中nij是词si在标题tj中出现的次数;22)对于词si,其普遍重要性可表示为其中|D|为商品标题总个数;23)对于在标题tj中的词si,其TF-IDF分数为wij=tfij×idfi。步骤3)中所述的把每个词映射为固定长度的实数向量,其具体流程如下:31)收集商品组合并人工标注是否搭配,将标注好的组合集合构成训练集;32)用随机实数初始化词所对应的向量33)以当前的词向量为基础计算训练集上搭配分数误差;34)根据训练集上的误差对词向量向误差减小的方向进行调整;35)重复33)与34)直到训练集上的误差小于某阈值后停止。步骤4)中所述的商品向量生成方法是:用标题tj对应的向量表示商品j,用于表示标题的向量计算方法为步骤5)中所述的商品间搭配分数计算方法是:用向量表示商品m,用向量表示商品n,以向量与向量间的余弦相似度表示商品m与商品n间的搭配分数:本说明书实施例所述的内容仅仅是对专利技术构思的实现形式的列举,本专利技术的保护范围的不应当被视为仅限于实施例所陈述的具体形式,本专利技术的保护范围也及于本领域技术人员根据本专利技术构思所能够想到的等同技术手段。本文档来自技高网...

【技术保护点】
于电子商务商品标题的商品搭配方法,为电子商务平台上每个商品收集标题描述后,针对商品标题进行如下操作:1)把每个商品的标题tj进行分词,分词后表示为向量2)为每个词计算在标题tj中的TF‑IDF分数,表示为向量3)把每个词映射为固定长度的实数向量,即词si映射为向量4)将标题tj中的词所对应向量以TF‑IDF分数为权重进行加权平均,并用得到的新向量表示该商品;5)以两个商品向量间的余弦相似度表示两个商品的搭配分数。

【技术特征摘要】
1.基于电子商务商品标题的商品搭配方法,为电子商务平台上每个商品收集标题描述后,针对商品标题进行如下操作:1)把每个商品的标题tj进行分词,分词后表示为向量2)为每个词计算在标题tj中的TF-IDF分数,表示为向量3)把每个词映射为固定长度的实数向量,即词si映射为向量4)将标题tj中的词所对应向量以TF-IDF分数为权重进行加权平均,并用得到的新向量表示该商品;5)以两个商品向量间的余弦相似度表示两个商品的搭配分数。2.如权利要求1所述的基于电子商务商品标题的商品搭配方法,其特征在于:所述的步骤2)中所述的TF-IDF分数的求取方法是:21)对于在标题tj中的词si,其重要...

【专利技术属性】
技术研发人员:王灿钊魁卜佳俊陈纯
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1