System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于大数据的用户画像标签快速匹配方法组成比例_技高网

基于大数据的用户画像标签快速匹配方法组成比例

技术编号:41328248 阅读:6 留言:0更新日期:2024-05-13 15:06
本发明专利技术涉及信息推荐技术领域,本发明专利技术公开了基于大数据的用户画像标签快速匹配方法;包括基于历史推荐内容构建用户画像,计算兴趣评分,生成待推荐内容,并计算待推荐评分,基于兴趣评分和待推荐评分,生成评分差值,同时标记出目标评分,从待推荐内容中匹配到目标推荐内容;相对于现有技术,能够基于综合标签,构建出准确的用户画像,计算出用户画像的兴趣评分,同时将数据库中的待推荐内容的待推荐评分与兴趣评分比较,快速且准确的匹配到满足用户画像兴趣度的目标推荐内容,并且在排列优先级的限制下,对目标推荐内容进行有序排列,从而确保目标推荐内容能够有序、整齐且准确的推荐给用户,实现用户画像标签快速、准确的匹配效果。

【技术实现步骤摘要】

本专利技术涉及信息推荐,更具体地说,本专利技术涉及基于大数据的用户画像标签快速匹配方法


技术介绍

1、用户画像是对特定用户群体的描述和概括,通常基于一系列属性和特征来描绘用户的行为、兴趣、偏好和其他相关信息,通过对用户画像标签匹配,可以更精准地定位和识别用户群体,优化产品设计、营销活动和服务提供,从而对用户感兴趣的内容进行准确推荐。

2、申请公开号为cn117539881a的中国专利申请公开了基于区块链和大数据的人工智能电商推送系统,其用户画像构建模块用于采集用户属性,对用户进行标签画像构建,生成用户画像;店铺标签构建模块用于采集店铺属性,对店铺进行标签画像构建,生成店铺画像;分布储存模块用于将用户画像和店铺画像通过区块链技术去中心化储存;意向收集模块用于采集用户购买意向;线下推送模块用于采集用户实时定位信息以及店铺定位信息,根据用户购买意向和用户画像匹配店铺,生成商品推荐信息,然后根据匹配的店铺定位与用户实时定位的距离判断商品推荐信息的推送时机;线上推送模块用于采集用户状态信息,判断用户空闲情况,并根据用户购买意向和用户画像匹配商品推荐信息,然后根据用户空闲情况判断商品推荐信息的推送时机;能够减少推送信息的重复率,防止用户出现消息疲劳;

3、现有技术存在以下不足:

4、现有的用户画像标签匹配通过比较推荐内容与用户画像的相似度,即可向用户推荐感兴趣的内容,并将感兴趣的内容推荐给用户,当用户画像标签匹配后获得的感兴趣内容数量较多时,大量的感兴趣内容在向用户集中推荐时容易出现推荐顺序错乱的现象,导致推荐过程出现无序的问题,从而不能够根据用户对于内容的兴趣度高低进行有序推荐,降低了感兴趣内容的推荐准确度。

5、鉴于此,本专利技术提出基于大数据的用户画像标签快速匹配方法以解决上述问题。


技术实现思路

1、为了克服现有技术的上述缺陷,为实现上述目的,本专利技术提供如下技术方案:基于大数据的用户画像标签快速匹配方法,应用于数据服务器,包括:

2、s1:从数据库中筛选出用户的历史推荐内容,基于历史推荐内容,获取综合标签;

3、s2:基于构建准则,以综合标签为基础,构建用户画像,并计算用户画像的兴趣评分;

4、s3:标记数据库中的待推荐标签,基于待推荐标签生成待推荐内容,并计算待推荐内容的待推荐评分;

5、s4:基于兴趣评分和待推荐评分,生成评分差值,将评分差值与预设的评分差阈值比较,基于比较结果,标记出目标评分;

6、s5:基于目标评分,从待推荐内容中匹配到目标推荐内容,并基于排列优先级对目标推荐内容进行排列。

7、进一步的,综合标签包括类型标签、内容标签和行为标签。

8、进一步的,构建准则为:一个子区域内至多包含一个第一语义或一个第二语义;

9、用户画像的构建方法包括:

10、建立个空白的画像单元,将画像单元划分为三个独立的子区域,分别记为第一子区域、第二子区域和第三子区域;

11、通过自然语言处理技术识别类型标签和内容标签的语义,分别获得个第一语义和个第二语义;

12、基于构建准则,将一个第一语义和一个第二语义分别填充到第一子区域和第二子区域中;

13、将与第一语义和第二语义对应的行为标签填充到第三子区域中,获得个填充后的画像单元;

14、将个填充后的画像单元排列,并在个画像单元外围建立环形且封闭的轮廓,获得用户画像。

15、进一步的,兴趣评分的计算方法包括:

16、通过自然语义识别技术识别个画像单元中第三子区域内的行为标签,获得观看时长、评论字数、转发次数和点击次数;

17、分别统计观看时长、评论字数、转发次数和点击次数的数量,获得个观看时长值、个评论字数值、个转发次数值和个点击次数值;

18、将个观看时长值、个评论字数值、个转发次数值和个点击次数值赋予不同的权重因子后,生成个单元评分;

19、单元评分的表达式为:

20、;

21、式中,为第个单元评分,为第个观看时长值,为第个评论字数值,为第个转发次数值,为第个点击次数值,、、、为权重因子;

22、将个单元评分由大到小降序排列,将位于第一名的单元评分标记为兴趣评分。

23、进一步的,待推荐标签包括待推荐类型标签、待推荐内容标签和待推荐行为标签;

24、待推荐内容的生成方法包括:

25、查询数据库中个内容文件的格式属性和内容属性,分别获得个待推荐类型标签和个待推荐内容标签;

26、分别标记与个待推荐类型标签和个待推荐内容标签对应的观看时长、评论字数、转发次数和点击次数,获得个待推荐行为标签;

27、将个待推荐类型标签、个待推荐内容标签和个待推荐行为标签逐一对应组合,获得个待推荐内容。

28、进一步的,待推荐评分的计算方法包括:

29、分别统计个待推荐内容中的观看时长、评论字数、转发次数和点击次数的数量,获得个待观看时长值、个待评论字数值、个待转发次数值和个待点击次数值;

30、将个待观看时长值、个待评论字数值、个待转发次数值和个待点击次数值赋予不同的权重因子后,生成个待推荐评分;

31、待推荐评分的表达式为:

32、;

33、式中,为第个待推荐评分,为第个待观看时长值,为第个待评论字数值,为第个待转发次数值,为第个待点击次数值。

34、进一步的,评分差值的生成方法包括:

35、将个待推荐评分逐一与兴趣评分作差比较,获得个评分差值;

36、评分差值的表达式为:

37、;

38、式中,为第个评分差值,为兴趣评分;

39、目标评分的标记方法包括:

40、将个评分差值分别与预设的评分差阈值比较;

41、当大于等于时,第个评分差值被标记为目标评分;

42、当小于时,第个评分差值不被标记为目标评分。

43、进一步的,目标推荐内容的匹配方法包括:

44、当目标评分唯一时,将目标评分对应的待推荐内容标记为目标推荐内容;

45、当目标评分不唯一时,将将个目标评分对应的个待推荐内容标记为个目标推荐内容。

46、进一步的,排列优先级为:观看时长值的优先级第一,评论字数值的优先级第二,点击次数值的优先级第三,转发次数值的优先级第四。

47、进一步的,对目标推荐内容进行排列的方法包括:

48、依次标记个目标推荐内容中的观看时长值、评论字数值、点击次数值和转发次数值;

49、当个观看时长值的大小不一致时,将个观看时长值由大到小降序排列;

50、将降序排列后的个观看时长值依次升序编号,并按照编号对个目标推荐内容依次排列;

51、当个观看时长值的大小一致时,将个评论字数值由大到本文档来自技高网...

【技术保护点】

1.基于大数据的用户画像标签快速匹配方法,应用于数据服务器,其特征在于,包括:

2.根据权利要求1所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述综合标签包括类型标签、内容标签和行为标签。

3.根据权利要求2所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述构建准则为:一个子区域内至多包含一个第一语义或一个第二语义;

4.根据权利要求3所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述兴趣评分的计算方法包括:

5.根据权利要求4所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述待推荐标签包括待推荐类型标签、待推荐内容标签和待推荐行为标签;

6.根据权利要求5所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述待推荐评分的计算方法包括:

7.根据权利要求6所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述评分差值的生成方法包括:

8.根据权利要求7所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述目标推荐内容的匹配方法包括:>

9.根据权利要求8所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述排列优先级为:观看时长值的优先级第一,评论字数值的优先级第二,点击次数值的优先级第三,转发次数值的优先级第四。

10.根据权利要求9所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述对目标推荐内容进行排列的方法包括:

...

【技术特征摘要】

1.基于大数据的用户画像标签快速匹配方法,应用于数据服务器,其特征在于,包括:

2.根据权利要求1所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述综合标签包括类型标签、内容标签和行为标签。

3.根据权利要求2所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述构建准则为:一个子区域内至多包含一个第一语义或一个第二语义;

4.根据权利要求3所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述兴趣评分的计算方法包括:

5.根据权利要求4所述的基于大数据的用户画像标签快速匹配方法,其特征在于,所述待推荐标签包括待推荐类型标签、待推荐内容标签和待推荐行为标签;

6.根据权利...

【专利技术属性】
技术研发人员:王志鸿曲琳琳郑卫华柯静贾敬奇孙晓薇提晓林王满军周艳
申请(专利权)人:青岛益生康健科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1