媒体资源生命周期的预测方法、相关装置及存储介质制造方法及图纸

技术编号:32833756 阅读:14 留言:0更新日期:2022-03-26 20:50
本申请提供一种媒体资源生命周期的预测方法、相关装置及存储介质,该方法包括:首先,针对每一个媒体资源,在数据库中获取得到媒体资源的基本属性以及在日志数据中提取媒体资源在预设时间段内的线上指标;然后,针对媒体资源的每一个关键性事件,根据关键性事件所属类型对应的生存曲线确定关键性事件的生命周期期望值;其中,生存曲线由生存率和生存时间绘制;再将所有关键性事件的生命周期期望值、线上指标以及基本属性输入至生命周期预测模型中,输出得到媒体资源的预测生命周期;其中,生命周期预测模型由训练样本集对回归模型进行训练得到。从而实现对媒体资源生命周期进行精准的预测,进而可以根据预测结果进行后续处理。理。理。

【技术实现步骤摘要】
媒体资源生命周期的预测方法、相关装置及存储介质


[0001]本申请涉及计算机
,特别涉及一种媒体资源生命周期的预测方法、相关装置及存储介质。

技术介绍

[0002]在传统的内容分发网络(Content Delivery Network,CDN)中,在源站点上的媒体资源一般是人工下架的方式进行清理,对于缓存节点的内容淘汰方式一般为:最近最少使用(Least Recently Used,LRU)或者最不经常使用(Least frequently used,FRU),也就是被动的淘汰,当资源长期不被使用时或者存储空间不够用时对比较长时间没有访问到的媒体资源进行清理。
[0003]对于最近被访问的资源进行缓存。这种方式主要的问题是:对于源站点媒体资源人工清理既缺乏效率也缺乏依据,往往导致长期不做清理,虚耗空间同时增加了媒资管理的困难。并且,缓存节点使用被动清理方式,即使非常媒体冷门资源或者时效性非常强都花费大量的带宽回源花费空间进程存储非常不经济,而对有可能翻红的媒体资源却可能因为长期无人访问而清理掉。

技术实现思路

[0004]有鉴于此,本申请提供一种媒体资源生命周期的预测方法、相关装置及存储介质,可以对媒体资源生命周期进行精准的预测,从而可以根据预测结果进行后续处理。
[0005]本申请第一方面提供了一种媒体资源生命周期的预测方法,包括:
[0006]针对每一个媒体资源,在数据库中获取得到所述媒体资源的基本属性以及在日志数据中提取所述媒体资源在预设时间段内的线上指标;
>[0007]针对所述媒体资源的每一个关键性事件,根据所述关键性事件所属类型对应的生存曲线确定所述关键性事件的生命周期期望值;其中,所述生存曲线由生存率和生存时间绘制;
[0008]将所有所述关键性事件的生命周期期望值、所述线上指标以及所述基本属性输入至生命周期预测模型中,输出得到所述媒体资源的预测生命周期;其中,所述生命周期预测模型由训练样本集对回归模型进行训练得到;所述训练样本集包括:至少一个训练样本媒体资源的相关信息;所述训练样本媒体资源的相关信息包括:所述训练样本媒体资源的基本信息、所述训练样本媒体资源的线上指标、所述训练样本媒体资源的所有所述关键性事件的生命周期期望值以及所述训练样本媒体资源的真实生命周期。
[0009]可选的,所述生存曲线的绘制方法,包括:
[0010]针对数据库中每一个数据维度,在所述数据维度中随机抽取媒体资源作为样本媒体资源;
[0011]根据是否发生待观察的关键事件为标准,将所述样本媒体资源划分为观测组以及对照组;
[0012]分别计算所述观测组的样本媒体资源和所述对照组的样本媒体资源的生存时间,得到待观察的关键事件发生后的生命时间的分布特点;
[0013]根据所述生命时间的长短,估算得到各个时间点的生存率;
[0014]利用所述生命时间以及所述生存率绘制生存曲线。
[0015]可选的,所述媒体资源生命周期的预测方法,还包括:
[0016]通过生存率以及所述生存率的标准误对各个所述样本媒体资源的生存率进行检验,得到检验结果;其中,所述检验结果为是否存在差异。
[0017]可选的,所述媒体资源生命周期的预测方法,还包括:
[0018]对生命周期终结的媒体资源的生命周期长度进行更新,并存入数据库;其中,所述生命周期终结的媒体资源为在预设时间内无任何访问产生的媒体资源。
[0019]可选的,所述生命周期预测模型的构建方法,包括:
[0020]构建训练样本集;其中,所述训练样本集包括:至少一个训练样本媒体资源的相关信息;所述训练样本媒体资源的相关信息包括:所述训练样本媒体资源的基本信息、所述训练样本媒体资源的线上指标、所述训练样本媒体资源的所有所述关键性事件的生命周期期望值以及所述训练样本媒体资源的真实生命周期;
[0021]针对所述训练样本集中的每一个训练样本媒体资源,将所述训练样本媒体资源的相关信息输入至回归模型中,得到所述训练样本媒体资源的预测生命周期;
[0022]利用所述训练样本媒体资源的预测生命周期与所述训练样本媒体资源的真实生命周期之间的误差,对所述回归模型中的参数进行不断调整,直至调整后的所述训练样本媒体资源的预测生命周期与所述训练样本媒体资源的真实生命周期之间的误差满足预设的收敛条件时,将所述调整后的回归模型确定为生命周期预测模型。
[0023]可选的,所述将所有所述关键性事件的生命周期期望值、所述线上指标以及所述基本属性输入至生命周期预测模型中,输出得到所述媒体资源的预测生命周期之后,还包括:
[0024]判断所述媒体资源的预测生命周期是否大于生命周期阈值;
[0025]若判断出所述媒体资源的预测生命周期不大于生命周期阈值,则对所述媒体资源进行主动清理。
[0026]可选的,所述媒体资源生命周期的预测方法,还包括:
[0027]接收并响应用户针对目标媒体资源的管理指令;其中,所述目标媒体资源为预测生命周期大于生命周期阈值的媒体资源;所述管理指令分为预热、保留、清理和推送。
[0028]本申请第二方面提供了一种媒体资源生命周期的预测装置,包括:
[0029]获取单元,用于针对每一个媒体资源,在数据库中获取得到所述媒体资源的基本属性以及在日志数据中提取所述媒体资源在预设时间段内的线上指标;
[0030]确定单元,用于针对所述媒体资源的每一个关键性事件,根据所述关键性事件所属类型对应的生存曲线确定所述关键性事件的生命周期期望值;其中,所述生存曲线由生存率和生存时间绘制;
[0031]输入单元,用于将所有所述关键性事件的生命周期期望值、所述线上指标以及所述基本属性输入至生命周期预测模型中,输出得到所述媒体资源的预测生命周期;其中,所述生命周期预测模型由训练样本集对回归模型进行训练得到;所述训练样本集包括:至少
一个训练样本媒体资源的相关信息;所述训练样本媒体资源的相关信息包括:所述训练样本媒体资源的基本信息、所述训练样本媒体资源的线上指标、所述训练样本媒体资源的所有所述关键性事件的生命周期期望值以及所述训练样本媒体资源的真实生命周期。
[0032]可选的,所述生存曲线的绘制单元,包括:
[0033]抽取单元,用于针对数据库中每一个数据维度,在所述数据维度中随机抽取媒体资源作为样本媒体资源;
[0034]划分单元,用于根据是否发生待观察的关键事件为标准,将所述样本媒体资源划分为观测组以及对照组;
[0035]计算单元,用于分别计算所述观测组的样本媒体资源和所述对照组的样本媒体资源的生存时间,得到待观察的关键事件发生后的生命时间的分布特点;
[0036]估算单元,用于根据所述生命时间的长短,估算得到各个时间点的生存率;
[0037]绘制子单元,用于利用所述生命时间以及所述生存率绘制生存曲线。
[0038]可选的,媒体资源生命周期的预测装置,还包括:...

【技术保护点】

【技术特征摘要】
1.一种媒体资源生命周期的预测方法,其特征在于,包括:针对每一个媒体资源,在数据库中获取得到所述媒体资源的基本属性以及在日志数据中提取所述媒体资源在预设时间段内的线上指标;针对所述媒体资源的每一个关键性事件,根据所述关键性事件所属类型对应的生存曲线确定所述关键性事件的生命周期期望值;其中,所述生存曲线由生存率和生存时间绘制;将所有所述关键性事件的生命周期期望值、所述线上指标以及所述基本属性输入至生命周期预测模型中,输出得到所述媒体资源的预测生命周期;其中,所述生命周期预测模型由训练样本集对回归模型进行训练得到;所述训练样本集包括:至少一个训练样本媒体资源的相关信息;所述训练样本媒体资源的相关信息包括:所述训练样本媒体资源的基本信息、所述训练样本媒体资源的线上指标、所述训练样本媒体资源的所有所述关键性事件的生命周期期望值以及所述训练样本媒体资源的真实生命周期。2.根据权利要求1所述的预测方法,其特征在于,所述生存曲线的绘制方法,包括:针对数据库中每一个数据维度,在所述数据维度中随机抽取媒体资源作为样本媒体资源;根据是否发生待观察的关键事件为标准,将所述样本媒体资源划分为观测组以及对照组;分别计算所述观测组的样本媒体资源和所述对照组的样本媒体资源的生存时间,得到待观察的关键事件发生后的生命时间的分布特点;根据所述生命时间的长短,估算得到各个时间点的生存率;利用所述生命时间以及所述生存率绘制生存曲线。3.根据权利要求2所述的预测方法,其特征在于,还包括:通过生存率以及所述生存率的标准误对各个所述样本媒体资源的生存率进行检验,得到检验结果;其中,所述检验结果为是否存在差异。4.根据权利要求1所述的预测方法,其特征在于,还包括:对生命周期终结的媒体资源的生命周期长度进行更新,并存入数据库;其中,所述生命周期终结的媒体资源为在预设时间内无任何访问产生的媒体资源。5.根据权利要求1所述的预测方法,其特征在于,所述生命周期预测模型的构建方法,包括:构建训练样本集;其中,所述训练样本集包括:至少一个训练样本媒体资源的相关信息;所述训练样本媒体资源的相关信息包括:所述训练样本媒体资源的基本信息、所述训练样本媒体资源的线上指标、所述训练样本媒体资源的所有所述关键性事件的生命周期期望值以及所述训练样本媒体资源的真实生命周期;针对所述训练样本集中的每一个训练样本媒体资源,将所述训练样本媒体资源的相关信息输入至回归模型中,得到所述训练样本...

【专利技术属性】
技术研发人员:盛骥斌曾迅迅曹问唐文滔刘维曹望李兴平
申请(专利权)人:湖南快乐阳光互动娱乐传媒有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1