System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及数据处理,尤其涉及一种基于大数据的平台用户推荐方法及系统。
技术介绍
1、随着信息技术的迅猛发展,各种在线平台如电商、社交媒体等不断涌现,用户面临信息过载的问题。为提高用户体验,本专利技术旨在提供一种基于大数据的平台用户推荐方法及系统,通过分析用户行为和大规模数据,精准推荐个性化内容,提升用户满意度。
2、中国专利公开号:cn108921673b公开了一种基于大数据的商品推荐方法,包括以下步骤:s1:根据商品类型将所有商品划分为多个商品类;s2:提取同一个商品类中商品的特征进行svm机器学习并生成该商品类的二元分类器;所述二元分类器的数量与商品类的数量相同,且二元分类器与商品类一一对应;s3:从大数据中提取所有用户在平台上的浏览和交易记录作为用户的特征值;s4:以用户的特征值对所有的用户进行聚类分析,生成多个用户类;由此可见,所述基于大数据的商品推荐方法存在以下问题:由于缺少对平台占比反映出的推荐有效性的判定和产品名称的编辑距离反映出的分类精准性的判定导致推荐的准确性和全面性的降低。
技术实现思路
1、为此,本专利技术提供一种基于大数据的平台用户推荐方法及系统,用以克服现有技术中由于缺少对平台占比反映出的推荐有效性的判定和产品名称的编辑距离反映出的分类精准性的判定导致推荐的准确性和全面性的降低的问题。
2、为实现上述目的,本专利技术提供一种基于大数据的平台用户推荐方法,包括以下步骤:获取若干用户对平台的使用特征数据,并根据所述若干用户对平台的使
3、进一步地,确定所述用户特征的存储类型的数量的步骤包括:
4、根据所述平台的若干用户的浏览页面的产品点击数量和若干浏览页面的产品推荐数量对浏览页面的平均产品点击数量占比进行计算;
5、将所述浏览页面的平均产品点击数量占比分别与预设第一占比和预设第二占比进行比对;
6、若所述浏览页面的平均产品点击数量占比小于所述预设第一占比,则对所述用户特征的存储类型的数量进行确定。
7、进一步地,所述用户特征的存储类型的数量通过所述预设第一占比与所述浏览页面的平均产品点击数量占比的差值确定。
8、进一步地,所述确定关联性推荐阈值的步骤包括:
9、若所述浏览页面的平均产品点击数量占比大于等于所述预设第一占比且小于所述预设第二占比,初步判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取;
10、基于所述浏览页面的产品名称和所述用户搜索的产品名称对产品名称的编辑距离进行计算;
11、将所述产品名称的编辑距离分别与预设第一距离和预设第二距离进行比对;
12、若所述产品名称的编辑距离大于所述预设第一距离且小于等于所述预设第二距离,则二次判定数据产品分类的精准性低于允许范围,并对所述关联性推荐阈值进行确定。
13、进一步地,基于所述产品名称的编辑距离与所述预设第一距离的差值确定所述关联性推荐阈值。
14、进一步地,确定所述产品筛选粒度的步骤包括:
15、若所述产品名称的编辑距离大于所述预设第二距离,对相同类型产品的浏览数量进行获取;
16、将所述相同类型产品的浏览数量与预设数量进行对比,并在相同类型产品的浏览数量大于预设数量时,对产品筛选粒度进行确定。
17、进一步地,所述产品筛选粒度由相同类型产品的浏览数量与预设数量的差值确定。
18、进一步地,所述确定用户画像的更新频率的步骤包括:
19、将所述单位监测周期内浏览页面的刷新次数与预设刷新次数进行比对;
20、若所述单位监测周期内浏览页面的刷新次数大于所述预设刷新次数,判定平台推荐全面性不足,对用户画像的更新频率进行确定。
21、进一步地,基于所述单位监测周期内浏览页面的刷新次数与所述预设刷新次数的差值确定用户画像的更新频率。
22、本专利技术还提供一种基于大数据的平台用户推荐系统,包括:
23、数据获取模块,用以对若干用户的平台的使用特征数据进行获取,并根据所述若干用户对平台的使用特征数据生成对应的若干用户画像;
24、数据存储模块,其与所述数据获取模块相连,用以对所述若干用户的平台的使用特征数据和所述若干用户画像进行存储;
25、产品推荐模块,其与所述数据获取模块相连,应以根据所述若干用户画像对对应用户的平台浏览页面进行产品推荐;
26、控制模块,其与所述数据获取模块、所述数据存储模块以及所述产品推荐模块分别相连,用以根据若干用户的浏览页面的平均产品点击数量占比对用户特征的存储类型的数量进行确定,或,初次判定产品分类的精准性低于允许范围并对浏览页面的产品名称与用户搜索的产品名称分别进行获取,
27、以及,根据浏览页面的产品名称与用户搜索的产品名称的编辑距离对关联性推荐阈值进行确定,或,根据所述产品名称的编辑距离和相同类型产品的浏览数量,确定产品筛选粒度,
28、以及,根据确定所述关联性推荐阈值后的单位监测周期内浏览页面的刷新次数确定用户画像的更新频率。
29、与现有技术相比,本专利技术的有益效果在于,基于平台用户数据和大数据对平台用户进行物品推荐时,由于平台获取用户数据较为单一,使得生成的用户画像局限性较大,表现为对浏览页面的占比降低,通过增大用户特征的存储类型的数量,提高大数据筛查用户数据在用户画像形成过程中的贡献数据量,为用户提供多元化的物品选择,提高了推荐商品的全面性,进一步提高了推荐方法的准确性。
30、本专利技术所述方法在基于平台用户数据和大数据对平台用户进行物品推荐时,形成用户画像,并基于用户画像计算物品与用户的关联性系数,并在关联性系数大于关联性推荐阈值时,对物品进行推荐,产品名称的编辑距离的增大表明推荐的个性化降低,推荐精准性低于允许范围,通过提高关联性推荐阈值,提高分类的精确性,进一步提高了推荐方法的准确性。
31、本专利技术所述方法在基于平台用户数据和大数据对平台用户进行物品推荐时,通过物品标签的比对达到物品分类的作用,通过增大产品筛选粒度即增大对物品标签的对比次数,本文档来自技高网...
【技术保护点】
1.一种基于大数据的平台用户推荐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大数据的平台用户推荐方法,其特征在于,确定所述用户特征的存储类型的数量的步骤包括:
3.根据权利要求2所述的基于大数据的平台用户推荐方法,其特征在于,所述用户特征的存储类型的数量通过所述预设第一占比与所述浏览页面的平均产品点击数量占比的差值确定。
4.根据权利要求3所述的基于大数据的平台用户推荐方法,其特征在于,所述确定关联性推荐阈值的步骤包括:
5.根据权利要求4所述的基于大数据的平台用户推荐方法,其特征在于,基于所述产品名称的编辑距离与所述预设第一距离的差值确定所述关联性推荐阈值。
6.根据权利要求5所述的基于大数据的平台用户推荐方法,其特征在于,确定所述产品筛选粒度的步骤包括:
7.根据权利要求6所述的基于大数据的平台用户推荐方法,其特征在于,所述产品筛选粒度由相同类型产品的浏览数量与预设数量的差值确定。
8.根据权利要求7所述的基于大数据的平台用户推荐方法,其特征在于,所述确定用户画像的更新频率的
9.根据权利要求8所述的基于大数据的平台用户推荐方法,其特征在于,基于所述单位监测周期内浏览页面的刷新次数与所述预设刷新次数的差值确定用户画像的更新频率。
10.一种使用权利要求1-9任一项权利要求所述的基于大数据的平台用户推荐方法的推荐系统,其特征在于,包括:
...【技术特征摘要】
1.一种基于大数据的平台用户推荐方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于大数据的平台用户推荐方法,其特征在于,确定所述用户特征的存储类型的数量的步骤包括:
3.根据权利要求2所述的基于大数据的平台用户推荐方法,其特征在于,所述用户特征的存储类型的数量通过所述预设第一占比与所述浏览页面的平均产品点击数量占比的差值确定。
4.根据权利要求3所述的基于大数据的平台用户推荐方法,其特征在于,所述确定关联性推荐阈值的步骤包括:
5.根据权利要求4所述的基于大数据的平台用户推荐方法,其特征在于,基于所述产品名称的编辑距离与所述预设第一距离的差值确定所述关联性推荐阈值。
...
【专利技术属性】
技术研发人员:吴鹏,陈兰,邱继成,潘俊聪,
申请(专利权)人:广州宇中网络科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。