一种用户偏好分析方法及其装置制造方法及图纸

技术编号:19140388 阅读:38 留言:0更新日期:2018-10-13 08:42
本公开是针对现有技术中缺少根据用户的偏好分析出该用户的个性化需求信息推送的问题,提供一种用户偏好分析方法及其装置,提取产品与案例信息的特征词,通过日志文件和数据库采集用户历史数据,过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据并计算出整体产品与案例的偏好度,根据偏好度匹配产品与案例的特征词获取偏好信息,从用户历史访问记录中挖掘到用户的偏好信息,并根据偏好信息向用户推荐相关产品信息,节省用户获取有用产品信息的时间,个性化产品推荐服务应运而生,个性化产品推荐服务首先会根据用户行为数据进行相应的用户行为偏好分析。

A user preference analysis method and its device

The disclosure aims at the problem of lacking in the prior art to analyze the user's personalized demand information push according to the user's preference, provides a user preference analysis method and its device, extracts the feature words of product and case information, collects the user's history data through log files and database, and filters the user's history data. The filtered user history data are obtained from the non-real user data and the preference degree of the whole product and the case is calculated. The preference information is obtained by matching the product and the case feature words according to the preference degree. The preference information of the user is extracted from the user history access records, and the relevant product information is recommended to the user according to the preference information. Personalized product recommendation services emerge as the times require to save users time to obtain useful product information. Personalized product recommendation services first analyze user behavior preferences according to user behavior data.

【技术实现步骤摘要】
一种用户偏好分析方法及其装置
本公开涉及计算机网络数据
,特别涉及一种用户偏好分析方法及其装置。
技术介绍
为了高效高速的给用户提供推荐产品信息,从用户历史访问记录中挖掘到用户的偏好信息,并根据偏好信息向用户推荐相关产品信息,节省用户获取有用产品信息的时间,个性化产品推荐服务应运而生,个性化产品推荐服务首先会根据用户行为数据进行相应的用户行为偏好分析,常用的方法是通过用户行为分析建立一个用户偏好模型,将用户的行为转换为用户的偏好。本公开对用户行为偏好建模大多是在信息搜索引擎、电商平台等,针对用户信息搜索关键字、访问记录、访问频度、搜索信息,访问日志、评价信息等方面进行偏好分析,并不能根据用户的偏好分析出该用户的个性化需求信息推送。
技术实现思路
本公开的目的是针对现有技术中缺少根据用户的偏好分析出该用户的个性化需求信息推送的问题,提供一种用户偏好分析方法及其装置,所述一种用户偏好分析方法具体包括以下步骤:步骤1,提取产品与案例信息的特征词;步骤2,通过日志文件和数据库采集用户历史数据;步骤3,过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;步骤4,使用过滤后的用户历史数据计算出整体产品与案例的偏好度;步骤5,根据偏好度匹配产品与案例的特征词获取偏好信息;步骤6,向用户推送用户的偏好信息;其中,用户历史数据至少包括用户对产品与案例信息的访问次数,产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。进一步地,在步骤1中,所述提取产品与案例信息的特征词的方法包括以下子步骤:步骤1.1,将所述产品与案例的文本分词,获得分类词;步骤1.2,遍历所有分类词并统计每个分类词次数;步骤1.3,选取分类词次数大于或等于次数阈值的分类词作为特征词;其中,次数阈值为5次。进一步地,在步骤2中,所述采集用户历史数据的方法包括以下子步骤:步骤2.1,采集日志文件中的用户访问关键词;步骤2.2,读取SQL数据库内的用户访问类型记录;步骤2.3,合并用户访问关键词和用户访问记录得到用户历史数据。其中,用户访问类型记录包括产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。进一步地,在步骤3中,所述非真正用户数据包括非注册用户访问数据、临时用户数据和已注销用户数据。进一步地,在步骤4中,所述计算出整体产品与案例的偏好度的方法为:其中权重为日志文件和数据库的所占的比重,日志文件采集的用户历史数据为5,数据库采集的用户历史数据为10,访问类型为产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。进一步地,在步骤5中,所述根据偏好度匹配产品与案例的特征词获取偏好信息方法为:步骤5.1,根据特征词与用户对产品与案例信息的访问次数设置类别阈值;步骤5.2,当偏好度大于等于类别阈值时读取特征值所对应的产品与案例偏好信息;其中,类别阈值为用户对产品与案例信息的访问次数/权重值,其中权重为日志文件和数据库的所占的比重,日志文件采集的用户历史数据为5,数据库采集的用户历史数据为10。本专利技术还提供了一种用户偏好分析装置,所述装置包括:特征词提取单元,用于提取产品与案例信息的特征词;历史数据采集单元,用于通过日志文件和数据库采集用户历史数据;历史数据过滤单元,用于过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;偏好度计算单元,用于使用过滤后的用户历史数据计算出整体产品与案例的偏好度;偏好信息获取单元,用于根据偏好度匹配产品与案例的特征词获取偏好信息;偏好信息推送单元,用于向用户推送用户的偏好信息。本公开的有益效果为:本公开针对单个用户通过用户搜索、浏览、收藏产品和案例的数据和整体产品与案例的偏好值数据来计算每个用户对产品与案例的偏好值,然后结合用户个人基本信息判断推送,能够精准的推送用户偏好的相关产品给用户,能够高效高速的给用户提供推荐产品信息。附图说明通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的元素,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:图1所示为本公开的一种用户偏好分析方法工作流程图;图2所示为本公开的一种用户偏好分析装置模块架构图。具体实施方式以下将结合实施例和附图对本公开的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本公开的目的、方案和效果。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。如图1所示为根据本公开的一种用户偏好分析方法及其装置工作流程图,下面结合图1来阐述根据本公开的用户偏好分析方法。本公开提出一种用户偏好分析方法,具体包括以下步骤:步骤1,提取产品与案例信息的特征词;步骤2,通过日志文件和数据库采集用户历史数据;步骤3,过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;步骤4,使用过滤后的用户历史数据计算出整体产品与案例的偏好度;步骤5,根据偏好度匹配产品与案例的特征词获取偏好信息;步骤6,向用户推送用户的偏好信息;其中,用户历史数据至少包括用户对产品与案例信息的访问次数,产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。进一步地,在步骤1中,所述提取产品与案例信息的特征词的方法包括以下子步骤:步骤1.1,将所述产品与案例的文本分词,获得分类词;步骤1.2,遍历所有分类词并统计每个分类词次数;步骤1.3,选取分类词次数大于或等于次数阈值的分类词作为特征词;其中,次数阈值为5次。其中,文本分词方法为假定分词词典中的最长词有i个汉字字符,则用被处理文档的当前字串中的前i个字作为匹配字段,查找字典。若字典中存在这样的一个i字词,则匹配成功,匹配字段被作为一个词切分出来。如果词典中找不到这样的一个i字词,则匹配失败,将匹配字段中的最后一个字去掉,对剩下的字串重新进行匹配处理……如此进行下去,直到匹配成功,即切分出一个词或剩余字串的长度为零为止。这样就完成了一轮匹配,然后取下一个i字字串进行匹配处理,直到文档被扫描完为止。文本分词算法描述如下:S1:从左向右取待切分汉语句的m个字符作为匹配字段,m为大机器词典中最长词条个数。S2:查找大机器词典并进行匹配。若匹配成功,则将这个匹配字段作为一个词切分出来。若匹配不成功,则将这个匹配字段的最后一个字去掉,剩下的字符串作为新的匹配字段,进行再次匹配,重复以上过程,直到切分出所有词为止。进一步地,在步骤2中,所述采集用户历史数据的方法包括以下子步骤:步骤2.1,采集日志文件中的用户访问关键词;步骤2.2,读取SQL数据库内的用户访问类型记录;步骤2.3,合并用户访问关键词和用户访问记录得到用户历史数据;其中,用户访问类型记录包括产品类型、主砖色系、装修风格、门店接待历史、垂直/移动服务平台访问历史、用户服务体系行为记录、楼盘、户型偏好。其中,采集日志文件的用户访问关键词,数据采集请本文档来自技高网...

【技术保护点】
1.一种用户偏好分析方法,其特征在于,所述方法包括:步骤1,提取产品与案例信息的特征词;步骤2,通过日志文件和数据库采集用户历史数据;步骤3,过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;步骤4,使用过滤后的用户历史数据计算出整体产品与案例的偏好度;步骤5,根据偏好度匹配产品与案例的特征词获取偏好信息;步骤6,向用户推送用户的偏好信息;其中,用户历史数据至少包括用户对产品与案例信息的访问次数,产品类型。

【技术特征摘要】
1.一种用户偏好分析方法,其特征在于,所述方法包括:步骤1,提取产品与案例信息的特征词;步骤2,通过日志文件和数据库采集用户历史数据;步骤3,过滤用户历史数据中的非真正用户数据得到过滤后的用户历史数据;步骤4,使用过滤后的用户历史数据计算出整体产品与案例的偏好度;步骤5,根据偏好度匹配产品与案例的特征词获取偏好信息;步骤6,向用户推送用户的偏好信息;其中,用户历史数据至少包括用户对产品与案例信息的访问次数,产品类型。2.根据权利要求1所述的一种用户偏好分析方法,其特征在于,在步骤1中,所述提取产品与案例信息的特征词的方法包括以下子步骤:步骤1.1,将所述产品与案例的文本分词,获得分类词;步骤1.2,遍历所有分类词并统计每个分类词次数;步骤1.3,选取分类词次数大于或等于次数阈值的分类词作为特征词;其中,次数阈值为5次。3.根据权利要求1所述的一种用户偏好分析方法,其特征在于,在步骤2中,所述采集用户历史数据的方法包括以下子步骤:步骤2.1,采集日志文件中的用户访问关键词;步骤2.2,读取SQL数据库内的用户访问类型记录;步骤2.3,合并用户访问关键词和用户访问记录得到用户历史数据。4.根据权利要求1所述的一种用户偏好分析方法,其特征在于,在步骤3中,非真正用户数据包括非注册用户访问数据、临...

【专利技术属性】
技术研发人员:马云峰郭秀黄文官梁绍钧
申请(专利权)人:佛山欧神诺云商科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1