当前位置: 首页 > 专利查询>华侨大学专利>正文

一种在线展会的展品推荐方法与系统技术方案

技术编号:28626165 阅读:26 留言:0更新日期:2021-05-28 16:22
本发明专利技术公开了一种在线展会的展品推荐方法与系统,包括:通过对用户历史行为数据的收集与分析,建立用户画像;将用户的词云与展品数据库中的展品信息进行相似度计算,找到包括预设个最符合用户词云的展品进行推荐;将用户的展品类别偏爱程度向量与用户画像数据库中的其它用户的展品类别偏爱程度向量进行相似度计算,找到预设个最为相似的用户,将他们最近浏览的预设个展品进行推荐;基于用户的展品类别浏览趋势转移矩阵,产生一个只包括展品类别的序列作为预测;对于序列中的每一个元素,找到当前类别中最热门的展品进行推荐;对推荐结果进行混合,得到最终的结果。本发明专利技术从多个角度获得推荐结果并加以混合,可以提升对用户进行针对性服务的质量。

【技术实现步骤摘要】
一种在线展会的展品推荐方法与系统
本专利技术涉及大数据分析与处理领域,特别涉及一种在线展会的展品推荐方法与系统。
技术介绍
随着电子商务规模的不断扩大,“推荐系统”这一概念也应运而生。面对琳琅满目的商品,顾客在寻找自己所需要购买的商品需要耗费大量的时间,这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。推荐系统是一种在海量数据挖掘基础上的一种高级商务智能平台,其最基本的功能在于帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。在线展会是一种在经济全球化背景下发展的产物,其具有成本低,数据对接方便等优点,可做到时时办展、处处参展,特别为季节性商品提供了更好的销售渠道。影响力更大,全行业全企业参与,企业仅付出较低成本,就能够得到与展会相关的商业信息。安全环保,线下展会产生巨量的会展垃圾,造成资源浪费。便于展后宣传与积累。线上展会可网上以各种方式向国内外无限传播、永不落幕。在线展会不是简单将传统会展搬到互联网上,目前其在数据挖掘与分析的技术很不完善,需要在在逐步索中前进。线上展会除了要运用现代通讯技术、计算机软件技术完整实现传统线下展会的所有功能外,更需要充分利用大数据、人工智能等先进的技术,用创新的思维实现展会的的价值延伸,去解决将来遇到的更多的难题、更丰富的应用。
技术实现思路
本专利技术的目的在于克服现有技术的不足,提出一种在线展会的展品推荐方法与系统,从多个角度获得推荐结果并加以混合,得到用户未来最可能感兴趣的展品,能够提升对用户进行针对性服务的质量。本专利技术采用如下技术方案:一方面,一种在线展会的展品推荐方法,包括:基于用户的历史搜索记录、历史浏览记录和收藏记录,获取包括展品名称的用户行为数据;对所述用户行为数据中的展品名称进行分词分析,获得每一个展品对应的分词结果;基于所述分词结果,获得用户的词云、展品类别偏爱程度向量及展品类别浏览趋势转移矩阵,并将所述用户的词云、展品类别偏爱程度向量及展品类别浏览趋势转移矩阵共同作为用户画像;将用户的词云与展品数据库中的展品信息进行相似度计算,找到包括预设个最符合用户词云的展品进行推荐;所述展品信息包括展品名称、展品类别及展品介绍信息;将用户的展品类别偏爱程度向量与用户画像数据库中的其它用户的展品类别偏爱程度向量进行相似度计算,找到预设个最为相似的用户,将他们最近浏览的预设个展品进行推荐;基于用户的展品类别浏览趋势转移矩阵,产生一个只包括展品类别的序列作为预测;对于序列中的每一个元素,找到当前类别中最热门的展品进行推荐;对上述步骤的推荐结果进行混合,得到最终推荐的结果。优选的,将用户的词云与展品数据库中的展品信息进行相似度计算,找到包括预设个最符合用户词云的展品进行推荐,具体包括:将用户词云与展品数据库中的展品信息进行基于公共子字符串的算法进行关键词相似度匹配,获得所有用户词云的候选推荐展品集,将候选推荐展品集进行整合,去掉重复的结果,再对剩余的集合根据展品的热度进行降序排序,取前预设条结果作为推荐结果;所述展品的热度为展品在预设天数内被浏览的总次数。优选的,所述将用户的展品类别偏爱程度向量与用户画像数据库中的其它用户的展品类别偏爱程度向量进行相似度计算,具体包括:将用户的展品类别偏爱程度向量与用户画像数据库中的其它用户的展品类别偏爱程度向量进行欧式距离计算作为相似度量,如下:其中,d(V1,V2)表示欧式距离;V1=(x1,x2,...,xK)表示用户的展品类别偏爱程度向量;V2=(y1,y2,...,yK)表示用户画像数据库中的一其它用户的展品类别偏爱程度向量;K表示展品类别。优选的,基于用户的展品类别浏览趋势转移矩阵,产生一个只包括展品类别的序列作为预测,具体包括:假设展品的类别数量为K,即用户的展品类别浏览趋势转移矩阵M的阶数为K,要产生的序列长度为l,则序列的第一个元素为用户的展品类别偏爱程度向量的最大分量所对应的展品类别,且对于序列的第i个元素Ci,第i+1个元素的值由以下两个值决定:一,Ci转移至其余类别的概率向量,即矩阵M的第i行对应的行向量,记为V=(P1,P2,...,PK);二,一个范围为[0,1]的随机浮点数,记为R;则序列生成的具体流程如下:S1041,初始化序列第一个元素C1为用户的展品类别偏爱程度向量的最大分量所对应的展品类别;S1042,对于其余的元素,记当前要产生序列元素下标为j(1≤j≤K),找到下标j满足以下公式:通过上述公式产生随机数,结合用户的展品类别浏览趋势转移矩阵来产生浏览趋势序列的下一个元素。优选的,基于用户的历史搜索记录、用户的历史浏览记录和用户的收藏记录,获取包括展品名称的用户行为数据,具体包括:采用等权重的方法,对用户的历史搜索记录、用户的历史浏览记录和用户的收藏记录进行混合,获取包括展品名称的用户行为数据。优选的,对所述用户行为数据中的展品名称进行分词分析,获得每一个展品对应的分词结果,具体包括:针对展品名称的字符串S中出现的所有的长度为1,2,3...,L的子字串S’,判断其是否为符合中文语法的短语,如果是,则将其存入集合V中;基于集合V,找到满足能够构成原字符串S的组合s1,s2,s3,...,sn,记为A;对于A中的每一个si(i∈[1,n]),求解下式:P(S)=P(s1,s2,...,sn)=P(s1)P(s2|s1)P(s3|s1,s2)…P(sn|s1s2…sn-1),其中P(si|s1s2...sn-1)代表第i个单词si在前i-1单词出现的情况下的条件概率,此处P(si|s1s2...sn-1)的值从包含了所有展品的详细信息文本的语料库中得到,计算得到的P(S)值用于衡量分词方案的合理性;获取具有最大P(S)所对应的组合A,作为最佳分词方案。优选的,基于所述分词结果,获得用户的展品类别偏爱程度向量,具体包括:基于所述用户行为数据中的展品名称进行分类统计,获取各类别的次数,分别为C1,C2,...,Ck,K属于自然数,则用户的展品类别偏爱程度向量由如下公式表示:上述公式表示用户搜索、浏览和收藏的展品记录中的每一个类别的概率所构成的向量,代表用户对不同类别展品的喜爱程度。优选的,基于所述分词结果,获得用户的展品类别浏览趋势转移矩阵,具体包括:令用户搜索、浏览和收藏的展品记录中的类别序列为B1,B2,...,BK,则矩阵的计算公式如下:其中,pi,j代表从类别序号为Bi的展品转移到类别序号为Bj的次数除以从类别序号为Bi的展品转移到其它K个展品类别的次数之和。另一方面,一种在线展会的展品推荐系统,包括:用户画像获取模块,基于用户的历史搜索记录、历史浏览记录和收藏记录,获取包括展品名称的用户行为数据;对所述用户行为数据中的展品名称进行分词分析,获得每一个展品对应的分词结果;基于所述分词结果,获得用户的本文档来自技高网...

【技术保护点】
1.一种在线展会的展品推荐方法,其特征在于,包括:/n基于用户的历史搜索记录、历史浏览记录和收藏记录,获取包括展品名称的用户行为数据;对所述用户行为数据中的展品名称进行分词分析,获得每一个展品对应的分词结果;基于所述分词结果,获得用户的词云、展品类别偏爱程度向量及展品类别浏览趋势转移矩阵,并将所述用户的词云、展品类别偏爱程度向量及展品类别浏览趋势转移矩阵共同作为用户画像;/n将用户的词云与展品数据库中的展品信息进行相似度计算,找到包括预设个最符合用户词云的展品进行推荐;所述展品信息包括展品名称、展品类别及展品介绍信息;/n将用户的展品类别偏爱程度向量与用户画像数据库中的其它用户的展品类别偏爱程度向量进行相似度计算,找到预设个最为相似的用户,将他们最近浏览的预设个展品进行推荐;/n基于用户的展品类别浏览趋势转移矩阵,产生一个只包括展品类别的序列作为预测;对于序列中的每一个元素,找到当前类别中最热门的展品进行推荐;/n对上述步骤的推荐结果进行混合,得到最终推荐的结果。/n

【技术特征摘要】
1.一种在线展会的展品推荐方法,其特征在于,包括:
基于用户的历史搜索记录、历史浏览记录和收藏记录,获取包括展品名称的用户行为数据;对所述用户行为数据中的展品名称进行分词分析,获得每一个展品对应的分词结果;基于所述分词结果,获得用户的词云、展品类别偏爱程度向量及展品类别浏览趋势转移矩阵,并将所述用户的词云、展品类别偏爱程度向量及展品类别浏览趋势转移矩阵共同作为用户画像;
将用户的词云与展品数据库中的展品信息进行相似度计算,找到包括预设个最符合用户词云的展品进行推荐;所述展品信息包括展品名称、展品类别及展品介绍信息;
将用户的展品类别偏爱程度向量与用户画像数据库中的其它用户的展品类别偏爱程度向量进行相似度计算,找到预设个最为相似的用户,将他们最近浏览的预设个展品进行推荐;
基于用户的展品类别浏览趋势转移矩阵,产生一个只包括展品类别的序列作为预测;对于序列中的每一个元素,找到当前类别中最热门的展品进行推荐;
对上述步骤的推荐结果进行混合,得到最终推荐的结果。


2.根据权利要求1所述的在线展会的展品推荐方法,其特征在于,将用户的词云与展品数据库中的展品信息进行相似度计算,找到包括预设个最符合用户词云的展品进行推荐,具体包括:
将用户词云与展品数据库中的展品信息进行基于公共子字符串的算法进行关键词相似度匹配,获得所有用户词云的候选推荐展品集,将候选推荐展品集进行整合,去掉重复的结果,再对剩余的集合根据展品的热度进行降序排序,取前预设条结果作为推荐结果;所述展品的热度为展品在预设天数内被浏览的总次数。


3.根据权利要求1所述的在线展会的展品推荐方法,其特征在于,所述将用户的展品类别偏爱程度向量与用户画像数据库中的其它用户的展品类别偏爱程度向量进行相似度计算,具体包括:
将用户的展品类别偏爱程度向量与用户画像数据库中的其它用户的展品类别偏爱程度向量进行欧式距离计算作为相似度量,如下:



其中,d(V1,V2)表示欧式距离;V1=(x1,x2,...,xK)表示用户的展品类别偏爱程度向量;V2=(y1,y2,...,yK)表示用户画像数据库中的一其它用户的展品类别偏爱程度向量;K表示展品类别。


4.根据权利要求1所述的在线展会的展品推荐方法,其特征在于,基于用户的展品类别浏览趋势转移矩阵,产生一个只包括展品类别的序列作为预测,具体包括:
假设展品的类别数量为K,即用户的展品类别浏览趋势转移矩阵M的阶数为K,要产生的序列长度为l,则序列的第一个元素为用户的展品类别偏爱程度向量的最大分量所对应的展品类别,且对于序列的第i个元素Ci,第i+1个元素的值由以下两个值决定:一,Ci转移至其余类别的概率向量,即矩阵M的第i行对应的行向量,记为V=(P1,P2,...,PK);二,一个范围为[0,1]的随机浮点数,记为R;则序列生成的具体流程如下:
S1041,初始化序列第一个元素C1为用户的展品类别偏爱程度向量的最大分量所对应的展品类别;
S1042,对于其余的元素,记当前要产生序列元素下标为j(1≤j≤K),找到下标j满足以下公式:



通过上述公式产生随机数,结合用户的展品类别浏览趋势转移矩阵来产生浏览趋势序列的下一个元素。


5.根据权利要求1所述的在线展会的展品推荐方法,其特征在于,基于用户的历史搜索记录、用户的历史浏览记录和用户的收藏记录...

【专利技术属性】
技术研发人员:陈永红
申请(专利权)人:华侨大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1