一种基于多模态信息融合的社交舆情关键特征提取方法技术

技术编号:43151796 阅读:51 留言:0更新日期:2024-10-29 17:51
本发明专利技术公开了一种基于多模态信息融合的社交舆情关键特征提取方法,该方法使用网络爬虫以及数据库技术对社交媒体数据进行采集与存储,并用通用文字识别技术、通用音频识别技术以及通用信息抽取技术对互联网上的多源信息进行特征提取,最后利用相关算法对多维度数据结果进行信息融合并对舆情信息真假做出判断,最后使用通用信息抽取技术抽取舆情信息的关键特征,获取全面准确的社交舆情分析结果。

【技术实现步骤摘要】

本专利技术涉及一种社交舆情关键特征提取方法,尤其涉及一种基于多模态信息融合的社交舆情关键特征提取方法


技术介绍

1、近年来,随着抖音、小红书、bilibili等多种社交媒体的普及,人们越来越依赖社交媒体来获取信息和表达观点。当前社交媒体平台上的舆情信息具有庞大的规模和多样的形式,如文本、语音、图片和视频等多模态数据,这些数据中蕴含着丰富的舆情信息,为用户提供最新鲜直观的新闻报道,可帮助人们快速的了解新闻事件的概况和影响,也可以帮助政府、企业和研究机构了解公众的观点、情绪和行为,从而指导决策、改善产品或服务、进行市场分析等。

2、在现代社会,社会舆情的作用和力量越来越大,成为影响人们思想和行为的重要因素。然而,互联网的发展使得社会舆情的测度和分析也日益复杂化,舆情信息缺乏有序的知识组织,其中大量有价值的、面向决策支持的信息往往会被忽略,也存在某些虚假的舆情信息会影响社会舆情事件发展的方向。

3、而社交媒体上的信息极其丰富和多样化,难以从海量的文字、图片音频和视频中获取有用的信息。因此,需要一种高效的方法来自动提取社交媒体上的关键特征本文档来自技高网...

【技术保护点】

1.一种基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第1步中,初步采集的内容包括:标题、发布时间、点赞量、评论量、转发量和浏览量。

3.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第2步中,对采集得到的图像,先进行相似度检测,删除冗余数据,具体包括:

4.根据权利要求3所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,步骤2.1)中,DCT变换公式如式(2)所示,

>5.根据权利要求3...

【技术特征摘要】

1.一种基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第1步中,初步采集的内容包括:标题、发布时间、点赞量、评论量、转发量和浏览量。

3.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第2步中,对采集得到的图像,先进行相似度检测,删除冗余数据,具体包括:

4.根据权利要求3所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,步骤2.1)中,dct变换公式如式(2)所示,

5.根据权利要求3所述的基于多模态信息融合的社交舆情关键特征提取方法,其特征在于,第2步中,使用图像描述模型提取每张图像中的中文描述信息以及对图像进行文字识别,获取图像的描述信息以及文字识别信息,具体包括:

6.根据权利要求1所述的基于多模态信息融合的社交舆情关键特征提取方法,其特...

【专利技术属性】
技术研发人员:张随雨俞定国王娇娇汪哲丁可
申请(专利权)人:浙江传媒学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1