【技术实现步骤摘要】
一种基于用户商品画像和潜在因子特征提取的混合推荐方法
本专利技术涉及了对用户以及商品画像中的文本信息进行特征表示和清洗,以及利用对评分矩阵分解的特征提取方法,尤其涉及了一种基于用户商品画像和潜在因子特征提取的混合推荐方法,属于人工智能领域。
技术介绍
推荐系统是一种可以预测用户对商品和信息的喜好或评分的模型,是用户从互联网上浩如烟海的信息中发现适合自己信息和商品的重要渠道。利用用户对商品的历史行为(如:购买、浏览、点击、评价等)来挖掘出每个用户的喜好,进而对用户进行个性化推荐。用户对商品的历史行为通常分为两类:一是显式反馈,即用户对商品的评分信息,如豆瓣电影的评分,用户会对电影给出1分~10分不等的评分信息;二是潜在反馈,即用户购买、浏览等信息,潜在反馈虽然不能明确刻画出用户对物品的喜好程度,但能从一定程度上获取用户对商品的喜好程度,用户对物品的行为信息通常可以用(用户,商品,评分)这样的三元组进行表示,构建推荐系统时一般采用这种三元组数据进行数据分析,得到每个用户的兴趣爱好,给用户推荐新的可能感兴趣的商品。随着网络 ...
【技术保护点】
1.一种基于用户商品画像和潜在因子特征提取的混合推荐方法,其特征在于,所述混合推荐方法包括以下步骤:/nS100通过用户画像和商品本身的信息提取用户和商品的显式特征和显式特征表示;/nS200通过把用户和商品映射到潜在空间,得到用户和商品的隐式特征表示;/nS300利用栈式降噪自编码器对显式特征、显示特征表示和隐式特征进行特征提取,得到鲁棒性更强的低维特征表示。/n
【技术特征摘要】
1.一种基于用户商品画像和潜在因子特征提取的混合推荐方法,其特征在于,所述混合推荐方法包括以下步骤:
S100通过用户画像和商品本身的信息提取用户和商品的显式特征和显式特征表示;
S200通过把用户和商品映射到潜在空间,得到用户和商品的隐式特征表示;
S300利用栈式降噪自编码器对显式特征、显示特征表示和隐式特征进行特征提取,得到鲁棒性更强的低维特征表示。
2.根据权利要求1所述的一种基于用户商品画像和潜在因子特征提取的混合推荐方法,其特征在于,S100包括以下步骤:
S110对于连续型特征,取数值作为特征值;
S120对于单值离散变量,采用One-Hot编码方式得到特征表示;
S130对于多值离散变量或文本型特征,采用如下方法得到向量空间表示:
对数据中的每个离散特征值做如下运算:
其中,ni,j为每个离散特征在特征语料库中的出现次数,而分母则是在特征语料库库中所有字词的出现次数之和,
对数据中的每个离散特征值做如下运算:
其中,D为特征语料库中的数据总数,|{j:ti∈dj}|为包含词语ti的数据条数,
计算用户与商品的显式特征表示tf-idf:
tfidf=tfi,j×idfi
得到用户与商品的显式特征表示tf-idf。
3.根据权利要求1所述的一种基于用户商品画像和潜在因子特征提取的混合推荐方法,其特征在于,S200包括以下步骤:
S210根据用户评分数据构建用户评分矩阵Ru×i,设置潜在空间维...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。