一种社交数据爆发时间点的预测方法、装置及存储介质制造方法及图纸

技术编号:35412615 阅读:16 留言:0更新日期:2022-11-03 11:09
本申请提供了一种社交数据爆发时间点的预测方法、装置及存储介质,预测方法包括:获取预设历史时间段内的历史社交数据下,以及历史社交数据在每一历史时间点下的行为交互数据;基于历史社交数据在每一历史时间点下的行为交互数据,确定出历史时间特征序列数据;将历史时间特征序列数据输入至数据预测模型的长短期记忆网络,确定出在未来时间段内的数据趋势二维矩阵;将数据趋势二维矩阵输入至数据预测模型的分类网络,预测出在未来时间段内是否出现数据爆发,若出现数据爆发,则确定出爆发时间点。从而实现了准确地预测出爆发时间点,为数据短期快速爆发提前做好了资源准备。为数据短期快速爆发提前做好了资源准备。为数据短期快速爆发提前做好了资源准备。

【技术实现步骤摘要】
一种社交数据爆发时间点的预测方法、装置及存储介质


[0001]本申请涉及数据处理
,尤其是涉及一种社交数据爆发时间点的预测方法、装置及存储介质。

技术介绍

[0002]社区数据为社区平台(微博平台、博客平台等其他社交平台)上的用户发表的文章、图片或者是帖子等其他信息,在社区平台上某一社区数据会突然被更多的其他用户转发,导致该社区数据量波动较大。
[0003]针对社区数据量波动大的问题,一般是采用了动态采集频率的方式,进行数据采集,通常是发现数据更新,就加快采集频率,没更新就减慢采集频率。但如果是突发事件,如几十分钟内,突然快速上升几十倍,动态采集频率一般也就最多增加几倍,爬虫系统采集遇到种突发事件采集情况,基础的动态采集频率切换,并不能够快速的解决问题。这就需要对数据量的增长情况进行预测,提前预备好爬虫资源。因此,在实际的社区数据采集更新频率预测,最关键的问题是解决数据爆发的时间点预测问题,否则,按照一般网页的更新频率确定方法,很难解决社区平台数据短期快速爆发的情况。所以,如何准确地预测到社交数据的爆发时间点成为了不容小觑的技术问题。

技术实现思路

[0004]有鉴于此,本申请的目的在于提供一种社交数据爆发时间点的预测方法、装置及存储介质,通过根据历史社交数据的历史时间特征序列数据输入至数据预测模型之中,快速准确地预测出历史社交数据在未来时间段是否出现数据爆发,若出现则确定出爆发时间点,从而实现了准确地预测出爆发时间点,为数据短期快速爆发提前做好了资源准备。
[0005]本申请实施例提供了一种社交数据爆发时间点的预测方法,所述预测方法包括:
[0006]获取预设历史时间段内的历史社交数据,以及所述历史社交数据在每一历史时间点下的行为交互数据;
[0007]基于所述历史社交数据和所述历史社交数据在每一历史时间点下的行为交互数据,确定出历史时间特征序列数据;
[0008]将所述历史时间特征序列数据输入至预先训练好的数据预测模型的长短期记忆网络,确定出在未来时间段内的数据趋势二维矩阵;其中,所述数据趋势二维矩阵包括在未来时间段内每一未来时间点以及每一未来时间点对应的数据量;
[0009]将所述数据趋势二维矩阵输入至所述数据预测模型的分类网络,预测出在所述未来时间段内是否会出现数据爆发,若出现数据爆发,则确定出爆发时间点。
[0010]在一种可能的实施方式中,所述行为交互数据包括点赞数据、转发数据以及评论数据,所述基于所述历史社交数据和所述历史社交数据在每一历史时间点下的行为交互数据,确定出历史时间特征序列数据,包括:
[0011]将在历史时间段内获取到的所述历史社交数据在每一历史时间点下的所述点赞
数据、所述转发数据、所述评论数据以及所述历史社交数据根据相对应的历史时间点进行关联处理,确定出关联后的每一历史时间点相对应的行为交互数据;
[0012]按照每一个历史时间点的时间信息,将多个所述关联后的每一历史时间点相对应的行为交互数据进行排序,确定出所述历史时间特征序列数据。
[0013]在一种可能的实施方式中,通过以下步骤确定出所述数据预测模型:
[0014]获取第一时间段内的样本社交数据对应的历史时间特征序列数据以及第二时间段内的所述样本社交数据对应的数据量;其中,所述第二时间段为所述第一时间段的下一时间段;
[0015]将所述第一时间段内的所述样本社交数据对应的历史时间特征序列数据输入至初始神经网络模型之中,确定出样本预测结果;
[0016]基于所述样本预测结果和所述第二时间段内的所述样本社交数据对应的数据量对所述初始神经网络模型的模型参数进行调整,确定出所述数据预测模型。
[0017]在一种可能的实施方式中,所述将所述数据趋势二维矩阵输入至所述数据预测模型的分类网络,预测出所述历史社交数据在所述未来时间段内是否出现数据爆发,若出现数据爆发,则确定出爆发时间点,包括:
[0018]将所述数据趋势二维矩阵输入至所述分类网络,对所述数据趋势二维矩阵进行回归处理,确定出数据趋势二维矩阵中的每一未来时间点对应的数据量斜率;其中,所述数据量斜率是所述数据量的变化量与发生这一变化所用时间的比值;
[0019]基于多个所述未来时间点对应的数据量斜率,预测出所述历史社交数据在所述未来时间段内是否出现数据爆发,若出现数据爆发,则确定出爆发时间点。
[0020]在一种可能的实施方式中,在确定出爆发时间点之后,所述预测方法还包括:确定所述爆发时间点相对应的数据爆发量;
[0021]根据所述数据爆发量,确定出与处理所述数据爆发量相匹配的资源预备策略。
[0022]本申请实施例还提供了一种社交数据爆发时间点的预测装置,所述预测装置包括:
[0023]获取模块,用于获取预设历史时间段内历史社交数据,以及所述历史社交数据在每一历史时间点下的行为交互数据;
[0024]第一确定模块,用于基于所述历史社交数据在每一历史时间点下的行为交互数据,确定出历史时间特征序列数据;
[0025]第二确定模块,用于将所述历史时间特征序列数据输入至预先训练好的数据预测模型的长短期记忆网络,确定出在未来时间段内的数据趋势二维矩阵;其中,所述数据趋势二维矩阵包括在未来时间段内每一未来时间点以及每一未来时间点对应的数据量;
[0026]分类模块,用于将所述数据趋势二维矩阵输入至所述数据预测模型的分类网络,预测出在所述未来时间段内是否会出现数据爆发,若出现数据爆发,则确定出爆发时间点。
[0027]在一种可能的实施方式中,所述第一确定模块在用于所述行为交互数据包括点赞数据、转发数据以及评论数据,所述基于所述历史社交数据在每一历史时间点下的行为交互数据,确定出历史时间特征序列数据时,所述第一确定模块具体用于:
[0028]将在历史时间段内获取到的所述历史社交数据在每一历史时间点下的所述点赞数据、所述转发数据、所述评论数据以及所述历史社交数据根据相对应的历史时间点进行
关联处理,确定出关联后的每一历史时间点相对应的行为交互数据;
[0029]按照每一个历史时间点的时间信息,将多个所述关联后的每一历史时间点相对应的行为交互数据进行排序,确定出所述历史时间特征序列数据。
[0030]在一种可能的实施方式中,所述预测装置还包括训练模块,所述训练模块通过以下步骤确定出所述数据预测模型:
[0031]获取第一时间段内的样本社交数据对应的历史时间特征序列数据以及第二时间段内的所述样本社交数据对应的数据量;其中,所述第二时间段为所述第一时间段的下一时间段;
[0032]将所述第一时间段内的所述样本社交数据对应的历史时间特征序列数据输入至初始神经网络模型之中,确定出样本预测结果;
[0033]基于所述样本预测结果和所述第二时间段内的所述样本社交数据对应的数据量对所述初始神经网络模型的模型参数进行调整,确定出所述数据预测模型。
[0034]本申请实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种社交数据爆发时间点的预测方法,其特征在于,所述预测方法包括:获取预设历史时间段内的历史社交数据,以及所述历史社交数据在每一历史时间点下的行为交互数据;基于所述历史社交数据和所述历史社交数据在每一历史时间点下的行为交互数据,确定出历史时间特征序列数据;将所述历史时间特征序列数据输入至预先训练好的数据预测模型的长短期记忆网络,确定出在未来时间段内的数据趋势二维矩阵;其中,所述数据趋势二维矩阵包括在未来时间段内每一未来时间点以及每一未来时间点对应的数据量;将所述数据趋势二维矩阵输入至所述数据预测模型的分类网络,预测出在所述未来时间段内是否会出现数据爆发,若出现数据爆发,则确定出爆发时间点。2.根据权利要求1所述的预测方法,其特征在于,所述行为交互数据包括点赞数据、转发数据以及评论数据,所述基于所述历史社交数据和所述历史社交数据在每一历史时间点下的行为交互数据,确定出历史时间特征序列数据,包括:将在历史时间段内获取到的所述历史社交数据在每一历史时间点下的所述点赞数据、所述转发数据、所述评论数据以及所述历史社交数据根据相对应的历史时间点进行关联处理,确定出关联后的每一历史时间点相对应的行为交互数据;按照每一个历史时间点的时间信息,将多个所述关联后的每一历史时间点相对应的行为交互数据进行排序,确定出所述历史时间特征序列数据。3.根据权利要求1所述的预测方法,其特征在于,通过以下步骤确定出所述数据预测模型:获取第一时间段内的样本社交数据对应的历史时间特征序列数据以及第二时间段内的所述样本社交数据对应的数据量;其中,所述第二时间段为所述第一时间段的下一时间段;将所述第一时间段内的所述样本社交数据对应的历史时间特征序列数据输入至初始神经网络模型之中,确定出样本预测结果;基于所述样本预测结果和所述第二时间段内的所述样本社交数据对应的数据量对所述初始神经网络模型的模型参数进行调整,确定出所述数据预测模型。4.根据权利要求1所述的预测方法,其特征在于,所述将所述数据趋势二维矩阵输入至所述数据预测模型的分类网络,预测出在所述未来时间段内是否会出现数据爆发,若出现数据爆发,则确定出爆发时间点,包括:将所述数据趋势二维矩阵输入至所述分类网络,对所述数据趋势二维矩阵进行回归处理,确定出数据趋势二维矩阵中的每一未来时间点对应的数据量斜率;其中,所述数据量斜率是所述数据量的变化量与发生这一变化所用时间的比值;基于多个所述未来时间点对应的数据量斜率,预测出在所述未来时间段内是否会出现数据量爆发,若出现数据量爆发,则确定出爆发时间点。5.根据权利要求1所述的预测方法,其特征在于,在确定出爆发时间点之后,所述预测方法还包括:确定所述爆发时间点对应的数据爆发量;根据所述数据爆发量,确...

【专利技术属性】
技术研发人员:武寨青程国艮李欣杰
申请(专利权)人:中译语通科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1