【技术实现步骤摘要】
一种基于概率情感词典的情感分析系统及方法
本专利技术涉及计算机自然语言处理
,尤其涉及一种基于概率情感词典的情感分析系统及方法。
技术介绍
情感分析是自然语言处理中常见的场景,主要根据大数据来定性定量分析人类情感,是大数据智能的重要体现。情感分析广泛应用在舆情监控、客服监控、电商评价等多个领域。例如各种微博评论、视频网站评价以及电商商品评论等,对于相关部门和人员能够更好了解用户情感需求具有关键性作用。通过对信息数据的情感分析,可以挖掘出项目产品在各个维度的优劣,从而明确如何改进项目产品。比如对视频网站的视频评价分析,可以分析用户喜好程度、视频类型以及受众群众等多个维度的用户情感指数,从而从各个维度上改进视频网站的视频上架和视频推广。目前,情感分析的方法可以采用基于情感词典的传统方法,先对文本进行分词和停用词处理等预处理,再利用先构建好的情感词典(一般由正面词、负面词、否定词以及程度副词等部分构建),对文本进行字符串匹配,将向量词组匹配到具体的词典中输出权值,最后计算总的权值从而分析出目标信息的情感是正面还是负面,同时具 ...
【技术保护点】
1.一种基于概率情感词典的情感分析系统,其特征在于,包括数据层、业务层、接口层和用户层;/n所述数据层存储对于情感分析算法中所需要使用的不同模态下已标注过情感标签的训练集,以及用户待分析的视频数据;/n所述业务层对数据存储层的数据进行训练和分析,包括图像特征提取模块、音频特征提取模块、文本特征提取模块和多模态情感分析模块;所述图像特征提取模块提取图片及从视频中拆分出来的视频图像的特征并存储;所述音频特征提取模块提取从视频中拆分出来的音频特征并存储;所述文本特征提取模块提取文本信息的特征并存储;/n所述接口层包括待分析视频输入接口、情感分析结果可视化接口、应用系统调用接口和w ...
【技术特征摘要】
1.一种基于概率情感词典的情感分析系统,其特征在于,包括数据层、业务层、接口层和用户层;
所述数据层存储对于情感分析算法中所需要使用的不同模态下已标注过情感标签的训练集,以及用户待分析的视频数据;
所述业务层对数据存储层的数据进行训练和分析,包括图像特征提取模块、音频特征提取模块、文本特征提取模块和多模态情感分析模块;所述图像特征提取模块提取图片及从视频中拆分出来的视频图像的特征并存储;所述音频特征提取模块提取从视频中拆分出来的音频特征并存储;所述文本特征提取模块提取文本信息的特征并存储;
所述接口层包括待分析视频输入接口、情感分析结果可视化接口、应用系统调用接口和web应用调用接口;所述待分析视频输入接口将用户层的待分析视频传输至数据存储层进行存储;所述情感分解结果可视化接口将分析结果传输至用户层。
2.采用权利要求1所述的基于概率情感词典的情感分析系统进行情感分析的方法,其特征在于包括两个阶段:
第一阶段:多模态情感词典的构建,包括如下步骤:
步骤1:采用已知情感词典库,调用已有的第三方网站的文本情感词典库构建本系统的文本情感词典;
步骤2:导入已经进行过情感标注的图片训练集,提取图片像素点,统计图片像素值;并构建受限玻尔兹曼机RBM神经网络对图片进行特征提取,将提取的特征与已经标注的情感相结合,构建图片的情感词典;
步骤3:导入已进行情感标注的视频训练集并将其拆分成音频与视频图像,采用音频特征提取软件提取音频特征,并将提取的特征与已经标注的情感相结合,构建音频的情感词典;
步骤4:将步骤3中拆分后的图像导入到3D卷积神经网络3DCNN中进行行为识别,将行为识别提取的特征向量与已经标注的情感相结合,构建视频图像的情感词典;
第二阶段:多模态情感分析,包括如下步骤:
S1:导入数据,分析数据的模态构造并对数据的不同模态即文本、视频和图片进行拆分存储;
S2:将拆分后的文本数据,进行分词处理,并将分词后的文本数据进行存储;
S3:将拆分后的图片数据,导入深度置信网络中进行特征提取,将提取出的图片特征进行存储;
S4:将拆分后的视频数据即音频数据和视频图像数据,分别导入音频特征提取软件和3DCNN中进行特征提取,分别将提取的音频与视频图像特征进行存储;
S5:若数据信息文本、音频和图像三模态中某一模态的源数据缺失,为了防止因缺失某种模态导致最终情感值出现过大偏差,将未缺失的另外两种模态放入对抗生成网络中,输出对抗生成网络生成的情感特征数据,将补全后的文本、音频、图像的特征信息与情感词典进行匹配,计算权值;
S6:若数据信息无缺...
【专利技术属性】
技术研发人员:信俊昌,王之琼,王司亓,隋玲,唐俊日,雷盛楠,汪宇,李嘉欣,
申请(专利权)人:东北大学,
类型:发明
国别省市:辽宁;21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。