视频推荐数据的建模方法及装置、电子设备及介质制造方法及图纸

技术编号:39142256 阅读:10 留言:0更新日期:2023-10-23 14:55
本发明专利技术提供一种视频推荐数据的建模方法及装置、电子设备及介质,该装置,包括:第一构建模块,用于构建视频推荐数据的统一标识,第一标识用于表征视频推荐数据中的中央媒资库中媒资数据自身属性的标识,第二标识用于表征与媒资数据关联的用户行为的标识;中央媒资库中包括与多个行政区域关联的媒资数据;统计模块,用于基于第一标识统计与媒资数据的属性关联的特征,基于第二标识统计与媒资数据关联的用户行为特征;第一处理模块,用于基于特征和基础模型进行建模得到联合模型。本申请是基于各省媒资汇聚构建全网通用标准的中央媒资库和使用全网用户行为数据进行多省联合建模,降本增效,通过建模省份之间的共性和差异性,提升推荐结果精准性。升推荐结果精准性。升推荐结果精准性。

【技术实现步骤摘要】
视频推荐数据的建模方法及装置、电子设备及介质


[0001]本专利技术涉及计算机领域,尤其涉及一种视频推荐数据的建模方法及装置、电子设备及介质。

技术介绍

[0002]目前,大屏媒体资源的推荐存在多源数据对于同一媒资表达多样、单省媒资特征信息不完善等问题。对此,现有技术中采用的是基于多个省份媒资数据单独建模,利用已有数据特征获取媒资信息表达,但该方式难以获得准确的媒资信息表达,并且会出现不同省份间同一媒资实体不同编码的情况,不仅浪费资源与人力,且无法做到推荐候选集合的规范统一。

技术实现思路

[0003]本专利技术实施例提供一种视频推荐数据的建模方法及装置、电子设备及介质、电子设备及介质,以解决现有技术中基于多个省份媒资数据单独建模,会导致难以获得准确的媒资信息表达,以及会出现不同省份间同一媒资实体不同编码的问题。
[0004]为解决上述技术问题,本专利技术是这样实现的:
[0005]第一方面,本专利技术实施例提供一种视频推荐数据的建模装置,所述装置包括:第一构建模块,用于构建视频推荐数据的统一标识,其中,所述统一标识包括第一标识和第二标识,所述第一标识用于表征视频推荐数据中的中央媒资库中媒资数据自身属性的标识,所述第二标识用于表征与所述媒资数据关联的用户行为的标识;所述中央媒资库中包括与多个行政区域关联的媒资数据;统计模块,用于基于所述第一标识统计与所述媒资数据的属性关联的特征,基于所述第二标识统计与所述媒资数据关联的用户行为特征;第一处理模块,用于基于所述特征和基础模型进行建模得到联合模型,其中,所述基础模型中包括用于表征所述多个行政区域中的部分或全部共有特征的共有参数,以及用于表征所述多个行政区域中每一个行政区域私有特征的私有参数。
[0006]第二方面,本专利技术实施例提供一种视频推荐数据的建模方法,应用于终端,所述方法包括:构建视频推荐数据的统一标识,其中,所述统一标识包括第一标识和第二标识,所述第一标识用于表征视频推荐数据中的中央媒资库中媒资数据自身属性的标识,所述第二标识用于表征与所述媒资数据关联的用户行为的标识;所述中央媒资库中包括与多个行政区域关联的媒资数据;基于所述第一标识统计与所述媒资数据的属性关联的特征,基于所述第二标识统计与所述媒资数据关联的用户行为特征;基于所述特征和基础模型进行建模得到联合模型,其中,所述基础模型中包括用于表征所述多个行政区域中的部分或全部共有特征的共有参数,以及用于表征所述多个行政区域中每一个行政区域私有特征的私有参数。
[0007]第三方面,本专利技术实施例提供一种电子设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上述第二
方面所述的视频推荐数据的建模方法的步骤。
[0008]第四方面,本专利技术实施例提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述第二方面所述的视频推荐数据的建模方法的步骤。
[0009]本专利技术实施例中,基于多个行政区域的媒资数据进行汇聚,构建统一基准的中央媒资库,实现媒资的特征的统一。进而结合中央媒资库高效、精准的媒资表示,构建更加完善精准的媒资数据属性特征和用户特征进行多个行政区域的联合建模同时的学习场景内特定行为和场景间的共性行为,即通过私有参数和场景共有参数同时建模场景差异性和共性得到不同场景的联合模型,该不同场景可以是指对多个行政区域中不同组合的行政区域中媒资数据通过模型进行预测,因此,基于中央媒资库构建的多个行政区域联合建模具有一定的规范性,避免了各个行政区域因分别建模导致代码不一致以及方案不一致的问题,从而解决了现有技术中基于多个省份媒资数据单独建模,会导致难以获得准确的媒资信息表达,以及会出现不同省份间同一媒资实体不同编码的问题,实现了媒资数据统一版本输出。可见,在本申请实施例中的多省联合建模的目标是基于各省媒资汇聚构建全网通用标准的中央媒资库和使用全网用户行为数据进行多省联合建模,以提高人员和资源的利用率,充分发挥全网数据的优势,即建模差异性和共性,实现降本增效。
附图说明
[0010]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0011]图1是本专利技术实施例提供的一种视频推荐数据的建模装置的示意图;
[0012]图2是本专利技术实施例提供的一种构建中央媒资库的统一特征的示意图;
[0013]图3是本专利技术实施例提供的辅助网络和STAR模型结合的示意图;
[0014]图4是本专利技术实施例提供的另一种视频推荐数据的建模装置方法的流程图。
具体实施方式
[0015]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0016]参见图1,图1是本专利技术实施例提供的一种视频推荐数据的建模装置的示意图,如图1所示,装置包括:
[0017]第一构建模块11,用于构建视频推荐数据的统一标识,其中,统一标识包括第一标识和第二标识,第一标识用于表征视频推荐数据中的中央媒资库中媒资数据自身属性的标识,第二标识用于表征与媒资数据关联的用户行为的标识;中央媒资库中包括与多个行政区域关联的媒资数据;
[0018]在本申请中媒资数据包括视频数据,如电影、电视剧、综艺等等。该多个行政区域
可以是省为单位,即在具体示例中该中央媒资库中媒资数据是指多个省的媒资数据。现有技术中并未对多个省的媒资数据进行整合,而是各个省单独建模,由于不同省份媒资数据有交集,因此各省份存在共性,而且不同的省份又有自己特有的用户群体和媒资数据,即用户行为不同,这些差异会带来不同省份数据分布的差异,从而导致各省份推荐位真实CTR
[0019](Click

Through

Rate,点击通过率)的差异。如果直接使用所有省份数据单独建模,很难捕捉到不同省份的差异性并同时对所有省份都精准预估;如果每个省份单独建模,就不能充分使用省份的数据信息,没有学习到场景之间的共性。
[0020]统计模块12,用于基于第一标识统计与媒资数据的属性关联的特征,基于第二标识统计与媒资数据关联的用户行为特征;
[0021]第一处理模块13,用于基于特征和基础模型进行建模得到联合模型,其中,基础模型中包括用于表征多个行政区域中的部分或全部共有特征的共有参数,以及用于表征多个行政区域中每一个行政区域私有特征的私有参数。
[0022]可见,在本申请中基于多个行政区域的媒资数据进行汇聚,构建统一基准的中央媒资库,实现媒资的特征的统一。进而结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频推荐数据的建模装置,其特征在于,所述装置包括:第一构建模块,用于构建视频推荐数据的统一标识,其中,所述统一标识包括第一标识和第二标识,所述第一标识用于表征所述视频推荐数据中的中央媒资库中媒资数据自身属性的标识,所述第二标识用于表征与所述媒资数据关联的用户行为的标识;所述中央媒资库中包括与多个行政区域关联的媒资数据;统计模块,用于基于所述第一标识统计与所述媒资数据的属性关联的特征,基于所述第二标识统计与所述媒资数据关联的用户行为特征;第一处理模块,用于基于所述特征和基础模型进行建模得到联合模型,其中,所述基础模型中包括用于表征所述多个行政区域中的部分或全部共有特征的共有参数,以及用于表征所述多个行政区域中每一个行政区域私有特征的私有参数。2.根据权利要求1所述的装置,其特征在于,所述装置还包括:获取模块,用于在构建中央媒资库中媒资数据的统一标识之前,分别获取与所述多个行政区域中每一个行政区域关联的媒资数据;第二处理模块,用于基于预设关键词对与所述每一个行政区域关联的媒资数据中的媒资名进行清洗处理;第三处理模块,用于对与所述每一个行政区域关联的媒资数据的标签数据进行验证,并对验证后的标签数据进行分层;实体对齐模块,用于基于与所述每一个行政区域关联的媒资数据的基础属性特征对所述媒资数据的媒资实体进行对齐;第二构建模块,用于基于所述每一个行政区域关联的媒资数据,构建多层媒资数据的IP体系;第三构建模块,用于基于进行清洗处理后的媒资名、所述进行分层后的标签数据、进行对齐后的媒资数据和所述IP体系构建所述中央媒资库。3.根据权利要求2所述的装置,其特征在于,所述装置还包括:抽取模块,用于在基于与所述每一个行政区域关联的媒资数据的基础属性特征对所述媒资数据的媒资实体进行对齐之后,对所述媒资数据中的媒资实体进行抽取;确定模块,用于在抽取的媒资实体与对齐后的媒资实体的相似度大于预设阈值的情况下,确定所述媒资实体的对齐成功;执行模块,用于在抽取的媒资实体与对齐后的媒资实体的相似度大于预设阈值的情况下,重新执行对齐操作。4.根据权利要求1所述的装置,其特征在于,所述装置还包括:第四构建模块,用于构建所述基础模型,其中,所述基础模型的每一个全连接层中包括共有参数和所述私有参数,且所述共...

【专利技术属性】
技术研发人员:张聪孔维莲刘海艳左霖冯俊兰邓超
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1