用户偏好挖掘方法、装置、存储介质及计算机设备制造方法及图纸

技术编号:37073919 阅读:11 留言:0更新日期:2023-03-29 19:50
本申请提供的一种用户偏好挖掘方法,包括:获取节目数据,并对节目数据中的每个节目匹配对应的内容标签,并根据每个内容标签构建节目标签矩阵;获取用户的收视数据,并根据收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;基于节目标签矩阵和用户收视节目矩阵得到目标矩阵,并确定目标用户;基于目标矩阵,确定各个内容标签的IDF值,以及目标用户在各个内容标签上的TF值、时间衰减系数和时长影响因子;基于各个IDF值、TF值、时间衰减系数和时长影响因子确定目标用户对各个内容标签的偏好值,并确定目标用户对应的偏好标签。通过改良的TF

【技术实现步骤摘要】
用户偏好挖掘方法、装置、存储介质及计算机设备


[0001]本申请涉及信息
,尤其涉及一种用户偏好挖掘方法、装置、存储介质及计算机设备。

技术介绍

[0002]在信息技术不断发展的时代下,为了给用户提供更好的节目观看体验,IPTV应运而生。IPTV即交互式网络电视,是一种集互联网、多媒体和通讯技术于一体、利用宽带网作为介质向家庭用户提供包括数字电视在内的多种交互式服务的技术。IPTV运营则能够进一步满足用户欣赏视频节目的个性化需求。
[0003]现有的IPTV运营只对IPTV用户进行简单分组或使用其他行业的用户偏好挖掘方法,无法对IPTV用户的偏好进行精准挖掘,从而无法做到针对每个IPTV用户的精细化运营。

技术实现思路

[0004]本申请的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中无法做到针对每个IPTV用户的精细化运营的技术缺陷。
[0005]第一方面,本申请提供了一种用户偏好挖掘方法,所述方法包括:
[0006]获取节目数据,并对所述节目数据中的每个节目匹配对应的内容标签,并根据每个所述内容标签构建节目标签矩阵;
[0007]获取用户的收视数据,并根据所述收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;
[0008]基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵,并根据所述目标矩阵确定目标用户;
[0009]基于所述目标矩阵,确定各个所述内容标签的逆文本频率指数IDF值,以及确定所述目标用户在各个所述内容标签上的词频指数TF值、时间衰减系数和时长影响因子;
[0010]基于各个所述IDF值、所述TF值、所述时间衰减系数以及所述时长影响因子确定所述目标用户对各个所述内容标签的偏好值;
[0011]根据各个所述偏好值,确定所述目标用户对应的偏好标签。
[0012]在其中一个实施例中,所述用户收视节目矩阵中的所述收视节目信息包括用户收视的节目、所述节目的收视时长、所述节目的总时长以及所述节目每次的收视时间,所述基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵的步骤,包括:
[0013]根据所述节目标签矩阵,为所述用户收视节目矩阵中所述用户收视的节目匹配对应的内容标签,得到所述目标矩阵。
[0014]在其中一个实施例中,所述基于所述目标矩阵,确定各个所述内容标签的IDF值的步骤,包括:
[0015]基于所述目标矩阵,确定每个所述内容标签对应的用户数量,以及所述目标矩阵中的总用户数;
[0016]根据每个所述内容标签对应的用户数量和所述总用户数确定各个所述内容标签的IDF值。
[0017]在其中一个实施例中,所述基于所述目标矩阵,确定所述目标用户在各个所述内容标签上的TF值的步骤,包括:
[0018]基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目的第一收视总次数和第一收视总时长,以及该内容标签对应节目的第一节目总时长;
[0019]对每个所述内容标签,根据所述第一收视总次数、所述第一收视总时长以及所述第一节目总时长确定第一数值;
[0020]基于所述目标矩阵,确定所述目标用户对各个所述节目的第二收视总次数和第二收视总时长,以及所述目标用户对应节目的第二节目总时长;
[0021]根据所述第二收视总次数、所述第二收视总时长以及所述第二节目总时长确定第二数值;
[0022]对每个所述内容标签,根据所述第一数值和所述第二数值确定所述TF值。
[0023]在其中一个实施例中,所述基于所述目标矩阵,确定所述目标用户在各个所述内容标签上的时间衰减系数的步骤,包括:
[0024]基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目在第一收视时间和第二收视时间的时间差;
[0025]对每个所述内容标签,根据预设常量和所述时间差确定所述时间衰减系数。
[0026]在其中一个实施例中,所述基于所述目标矩阵,确定所述目标用户在各个所述内容标签上的时长影响因子的步骤,包括:
[0027]基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目的目标收视总时长;
[0028]对每个所述内容标签,根据预设数值和所述目标收视总时长确定所述时长影响因子。
[0029]在其中一个实施例中,所述根据各个所述偏好值,确定所述目标用户对应的偏好标签的步骤,包括:
[0030]按照各个所述偏好值的数值大小,对各个所述偏好值对应的内容标签进行排序,得到排序结果;
[0031]根据预设选取个数对所述排序结果中的内容标签进行筛选;
[0032]将筛选后的内容标签作为所述目标用户的偏好标签。
[0033]第二方面,本申请提供了一种用户偏好的挖掘装置,包括:
[0034]节目标签矩阵构建模块,用于获取节目数据,并对所述节目数据中的每个节目匹配对应的内容标签,并根据每个所述内容标签构建节目标签矩阵;
[0035]用户收视节目矩阵构建模块,用于获取用户的收视数据,并根据所述收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;
[0036]目标矩阵获取模块,用于基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵,并根据所述目标矩阵确定目标用户;
[0037]数值确定模块,用于基于所述目标矩阵,确定各个所述内容标签的逆文本频率指数IDF值,以及确定所述目标用户在各个所述内容标签上的词频指数TF值、时间衰减系数和
时长影响因子;
[0038]偏好值确定模块,用于基于各个所述IDF值、所述TF值、所述时间衰减系数以及所述时长影响因子确定所述目标用户对各个所述内容标签的偏好值;
[0039]偏好标签确定模块,用于根据各个所述偏好值,确定所述目标用户对应的偏好标签。
[0040]第三方面,本申请提供了一种存储介质,其特征在于:所述存储介质中存储有计算机可读指令,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述任一实施例中所述用户偏好挖掘方法的步骤。
[0041]第四方面,本申请提供了一种计算机设备,其特征在于,包括:一个或多个处理器,以及存储器;
[0042]所述存储器中存储有计算机可读指令,所述计算机可读指令被所述一个或多个处理器执行时,执行上述任一实施例中所述用户偏好挖掘方法的步骤。
[0043]从以上技术方案可以看出,本申请实施例具有以下优点:
[0044]本申请提供的一种用户偏好挖掘方法,包括:获取节目数据,并对节目数据中的每个节目匹配对应的内容标签,并根据每个内容标签构建节目标签矩阵;获取用户的收视数据,并根据收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;基于节目标签矩阵和用户收视节目矩阵得到目标矩阵,并确定目标用户;基于目标矩阵,确定各个内容标签的IDF值,以及目标用户在各个内容标签上的TF值、时间衰减系数和时长本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户偏好挖掘方法,其特征在于,所述方法包括:获取节目数据,并对所述节目数据中的每个节目匹配对应的内容标签,并根据每个所述内容标签构建节目标签矩阵;获取用户的收视数据,并根据所述收视数据中的用户信息和收视节目信息,构建用户收视节目矩阵;基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵,并根据所述目标矩阵确定目标用户;基于所述目标矩阵,确定各个所述内容标签的逆文本频率指数IDF值,以及确定所述目标用户在各个所述内容标签上的词频指数TF值、时间衰减系数和时长影响因子;基于各个所述IDF值、所述TF值、所述时间衰减系数以及所述时长影响因子确定所述目标用户对各个所述内容标签的偏好值;根据各个所述偏好值,确定所述目标用户对应的偏好标签。2.根据权利要求1所述的用户偏好挖掘方法,其特征在于,所述用户收视节目矩阵中的所述收视节目信息包括用户收视的节目、所述节目的收视时长、所述节目的总时长以及所述节目每次的收视时间,所述基于所述节目标签矩阵和所述用户收视节目矩阵得到目标矩阵的步骤,包括:根据所述节目标签矩阵,为所述用户收视节目矩阵中所述用户收视的节目匹配对应的内容标签,得到所述目标矩阵。3.根据权利要求2所述的用户偏好挖掘方法,其特征在于,所述基于所述目标矩阵,确定各个所述内容标签的IDF值的步骤,包括:基于所述目标矩阵,确定每个所述内容标签对应的用户数量,以及所述目标矩阵中的总用户数;根据每个所述内容标签对应的用户数量和所述总用户数确定各个所述内容标签的IDF值。4.根据权利要求2所述的用户偏好挖掘方法,其特征在于,所述基于所述目标矩阵,确定所述目标用户在各个所述内容标签上的TF值的步骤,包括:基于所述目标矩阵,对每个所述内容标签,确定所述目标用户对该内容标签对应节目的第一收视总次数和第一收视总时长,以及该内容标签对应节目的第一节目总时长;对每个所述内容标签,根据所述第一收视总次数、所述第一收视总时长以及所述第一节目总时长确定第一数值;基于所述目标矩阵,确定所述目标用户对各个所述节目的第二收视总次数和第二收视总时长,以及所述目标用户对应节目的第二节目总时长;根据所述第二收视总次数、所述第二收视总时长以及所述第二节目总时长确定第二数值;对每个所述内容标签,根据所述第一数值和所述第二数值确定所述TF值。5.根据权利要求2所述的用户偏好挖掘方法,其特征在于,所述基于所述目标矩阵,确定所述目标用户在各个...

【专利技术属性】
技术研发人员:徐忠胜董唱朱从亮王哲奥
申请(专利权)人:天翼数字生活科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1