基于迭代优化策略的多模态信息社交媒体流行度预测方法技术

技术编号:26478821 阅读:69 留言:0更新日期:2020-11-25 19:23
本发明专利技术公开了一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,为了解决多模态数据利用不充分的缺陷,从帖子中提取了多模态特征;为了增强特征的时效稳定性,使用滑动窗口中对帖子特征进行平均,再进行多模态特征的融合,融合的特征利用LightGBM模型进行回归预测。为了解决流行度极值预测的难点,提出了一种迭代优化的策略,有效补偿了预测流行度分数的残差,特别是极值补偿。通过在SMPD2020数据集上进行的大量实验,取得了较好的效果,证明了本方法的有效性。

【技术实现步骤摘要】
基于迭代优化策略的多模态信息社交媒体流行度预测方法
本专利技术涉及人工智能
,尤其涉及一种基于迭代优化策略的多模态信息社交媒体流行度预测方法。
技术介绍
随着互联网技术的发展以及智能终端设备的兴起,社交媒体已成为人们生活的重要组成部分。与传统媒体不同,Flickr、Facebook、Twitter等现代社交媒体平台更多地依靠用户关系网络进行信息交流和传播。然而,由于网络中的信息过载、用户注意力有限,社交媒体上的信息存在关注不均衡的情况。因此,利用用户信息、帖子等进行社交媒体流行度预测,具有很高的研究价值和商业价值,也可以帮助内容创作者制作出更受欢迎的作品。现有的社交媒体流行度预测工作,主要分为以下几个步骤:提取可能与流行度相关的因素特征,利用融合后的特征训练回归模型,最后使用模型预测出未发布的帖子流行度的值。在社交媒体特征提取部分,目前大多数方法都是基于单模态的文本类型数据,忽视了图像和用户的特征数据以及同一用户不同帖子之间流行度的相关性,这种对社交媒体数据的不充分利用往往造成预测结果的片面性和不理想。在模型回归预测方面,当前大多本文档来自技高网...

【技术保护点】
1.一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,包括:/n对于包含多媒体特征的帖子,从中提取多模态特征,包括:图像特征、文本特征、类别概念特征、时序和空间特征、以及用户ID特征;/n使用滑动窗口平均化策略来处理文本特征和图像特征,将平均后的文本特征和图像特征与其他特征融合;/n将融合特征输入LightGBM模型,并通过分类器与回归器进行多次迭代优化,获得帖子的流行度预测结果。/n

【技术特征摘要】
1.一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,包括:
对于包含多媒体特征的帖子,从中提取多模态特征,包括:图像特征、文本特征、类别概念特征、时序和空间特征、以及用户ID特征;
使用滑动窗口平均化策略来处理文本特征和图像特征,将平均后的文本特征和图像特征与其他特征融合;
将融合特征输入LightGBM模型,并通过分类器与回归器进行多次迭代优化,获得帖子的流行度预测结果。


2.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,通过预训练的SAT模型生成图像的文本描述,再将文本描述编码与解码,得到图像特征。


3.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,通过对文字数据进行清洗与去噪处理,再利用预训练的深度学习模型Bert提取出文本特征;同时,还统计每条帖子中文本的单词数与字符数。


4.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,通过预训练的Glove来提取帖子概念的单词表示,作为类别概念特征。


5.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,将帖子的时间转换为北京时间,再按照划分的时间尺度,从转换的北京时间中提取时间特征的统计信息,再结合帖子的发布位置,构成时序和空间特征。


6.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,将用户ID表示为一个独热向量,并利用tsvd算法进行降维处理,再结合用户的粉丝数和用户的发帖数,构成用户ID特征。


7.根据权利要求1所述的一种基于...

【专利技术属性】
技术研发人员:毛震东张勇东黄梦琪
申请(专利权)人:北京中科研究院中国科学技术大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1