【技术实现步骤摘要】
本专利技术涉及一种社交舆情关键特征提取方法,尤其涉及一种基于多模态信息融合的社交舆情关键特征提取方法。
技术介绍
1、近年来,随着抖音、小红书、bilibili等多种社交媒体的普及,人们越来越依赖社交媒体来获取信息和表达观点。当前社交媒体平台上的舆情信息具有庞大的规模和多样的形式,如文本、语音、图片和视频等多模态数据,这些数据中蕴含着丰富的舆情信息,为用户提供最新鲜直观的新闻报道,可帮助人们快速的了解新闻事件的概况和影响,也可以帮助政府、企业和研究机构了解公众的观点、情绪和行为,从而指导决策、改善产品或服务、进行市场分析等。
2、在现代社会,社会舆情的作用和力量越来越大,成为影响人们思想和行为的重要因素。然而,互联网的发展使得社会舆情的测度和分析也日益复杂化,舆情信息缺乏有序的知识组织,其中大量有价值的、面向决策支持的信息往往会被忽略,也存在某些虚假的舆情信息会影响社会舆情事件发展的方向。
3、而社交媒体上的信息极其丰富和多样化,难以从海量的文字、图片音频和视频中获取有用的信息。因此,需要一种高效的方法来自动提取
...【技术保护点】
1.一种基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第1步中,初步采集的内容包括:标题、发布时间、点赞量、评论量、转发量和浏览量。
3.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第2步中,对采集得到的图像,先进行相似度检测,删除冗余数据,具体包括:
4.根据权利要求3所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,步骤2.1)中,DCT变换公式如式(2)所示,
【技术特征摘要】
1.一种基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第1步中,初步采集的内容包括:标题、发布时间、点赞量、评论量、转发量和浏览量。
3.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第2步中,对采集得到的图像,先进行相似度检测,删除冗余数据,具体包括:
4.根据权利要求3所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,步骤2.1)中,dct变换公式如式(2)所示,
5.根据权利要求3所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第2步中,使用图像描述模型提取每张图像中的中文描述信息以及对图像进行文字识别,获取图像的描述信息以及文字识别信息,具体包括:
6.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特...
【专利技术属性】
技术研发人员:张随雨,俞定国,王娇娇,汪哲,丁可,
申请(专利权)人:浙江传媒学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。