The invention discloses a commodity frequency matrix and personalized recommendation method based on text similarity, which comprises the following steps: preprocessing is used for data collection, data cleaning, user identification, session identification access and transaction identification, get a unified data format. Using the proposed method of personalized goods recommendation based on frequency matrix and text similarity, the product candidate set is computed and the score is scored on the candidate set, and the final result is presented to the user. The use of access frequency and text similarity matrix to construct the recommendation module to calculate, as far as possible to reduce the complexity of the recommender system, which meets the real-time requirements and maintain the recommended coverage and higher matching rate.
【技术实现步骤摘要】
本专利技术涉及电子商务技术,特别是一种基于频率矩阵和文本相似度的个性化商品推荐方法。
技术介绍
现代化信息服务环境下,用户的信息需求日趋多元化和个性化,不同的用户之间存在着明显的个性差异。随着网络资源的不断丰富和网络信息量的不断膨胀,人们对网络的依赖性越来越强。然而,要从网络中获取所需的信息并非易事,尽管各种搜索引擎发挥着极其重要的作用,但是不能满足用户个性化的需求。可见,信息及其传播的多样化为个性化信息服务创造了需求,也带来更大的复杂性和难题。个性化服务的思想在国外网站设计与发展中已经盛行,早期的个性化信息推荐服务主要由新闻剪裁、股票报价和目录推荐等内容组成。目前,主要的推荐技术包括:基于内容推荐、协同过滤推荐、基于关联规则推荐、基于效用推荐、基于知识推荐和基于用户统计信息推荐。但是这些方法都存在许多缺点:基于内容的推荐算法缺乏个性化,只能发现用户感兴趣的项目,但是不能发现用户以后会感兴趣的新产品;基于内容的推荐只能对属性规定的内容进行分析, ...
【技术保护点】
1.一种基于频率矩阵和文本相似度的个性化商品推荐方法,其特征在于:包括以下步骤:A、模型的输入和输出A1、数据输入只有与目标用户相关的数据才会输入到推荐模型中,并为目标用户推荐可能喜欢的商品;如果此时没有相关的数据可以作为推荐模型的输入数据,就使用非个性化的方法为目标用户提供推荐服务,比如:最新上市的商品或特价促销的商品;应该尽可能的为推荐模型输入多种相关的数据,让其输出数量更多,实用性更广泛的推荐结果,比如:用户当前浏览的商品,用户浏览历史所体现出来的长期个人喜好,或者两者都使用;可以通过简单的方法获得目标用户的多种相关数据,对这些相关数据进行适当的处理以后就可以作为推荐 ...
【技术特征摘要】
1.一种基于频率矩阵和文本相似度的个性化商品推荐方法,其特征在于:
包括以下步骤:
A、模型的输入和输出
A1、数据输入
只有与目标用户相关的数据才会输入到推荐模型中,并为目标用户推荐可
能喜欢的商品;如果此时没有相关的数据可以作为推荐模型的输入数据,就使
用非个性化的方法为目标用户提供推荐服务,比如:最新上市的商品或特价促
销的商品;应该尽可能的为推荐模型输入多种相关的数据,让其输出数量更多,
实用性更广泛的推荐结果,比如:用户当前浏览的商品,用户浏览历史所体现
出来的长期个人喜好,或者两者都使用;可以通过简单的方法获得目标用户的
多种相关数据,对这些相关数据进行适当的处理以后就可以作为推荐模型的输
入数据了;虽然有一些推荐模型的应用是考虑全局特征的,但是越来越多的推
荐模型正在追踪并记录用户的浏览模式,根据用户浏览的上下文为用户提供更
加细化的商品推荐;作为推荐模型输入数据的用户行为模式可以解释成两种类
型:用户在不知道商品推荐系统存在时的浏览行为模式和用户了解商品推荐系
统后的浏览行为模式;
A2、数据输出
推荐模型的输出为用户提供商品的详细介绍,包括商品的类型、质量和外
观等多种信息;最常见的输出可以看作是一个建议,通常采取的表现形式为“商
家推荐”或“试试这个商品”,更简单的形式就是把输出的推荐商品放到页面上
由用户自己去发现并使用,最简单的推荐形式就是只使用一种商品;有些推荐
算法会把商品和商品的预测排名一起展示给用户,供用户去参考;这些经过估
算得出的排名不仅可以作为某个商品的推荐度,还可以帮助用户进一步去了解
推荐系统的有效性,更加充分的利用推荐系统;预测排名可以作为推荐商品的
内容或者推荐商品的某一项信息为用户展示出来;网站MovieFinder就是把“用
户排名/系统排名”作为商品的某一项信息展示给用户,为用户在选择商品时做
参考;
B、数据预处理模块
数据预处理是商品关联规则分析过程中关键的一步,因为推荐模型的输入
数据是现实世界的数据,它们一般是脏的、不完整的和不一致的,这样的数据
在不经过任何处理的情况下无法被推荐模块直接使用;数据预处理可以改进数
据的质量,从而提高商品关联规则分析过程的精度和性能;数据预处理的一般
过程如下:首先对数据进行收集,得到访问日志、引用日志中的数据,并通过
数据净化去掉了数据中的噪声数据以及不完整的数据然后经过用户识别、会话
识别等一系列处理后得到用户会话文件,最后再进行事务识别得到用户事务数
据,为规则发现阶段做好充分的数据准备;
B1、数据采集;推荐模型研究过程中一个很重要的步骤就是要为模型找到
合适的输入数据,数据的来源一般是日志文件;日志文件包括服务...
【专利技术属性】
技术研发人员:牟向伟,
申请(专利权)人:大连灵动科技发展有限公司,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。