一种基于多模态数据的影评质量的识别方法及相关装置制造方法及图纸

技术编号:31509223 阅读:15 留言:0更新日期:2021-12-22 23:45
本申请公开了一种基于多模态数据的影评质量的识别方法及相关装置,方法包括提取影评语句的句向量、句向量的隐状态及影评图片的图片特征;确定各图片特征相对于各隐状态的注意力权重;基于各注意力权重及各隐状态确定各图片特征的特征张量;基于各特征张量确定影评数据对应的影评质量。本申请通过提取影片数据中的文本影评数据、表情影评数据的句向量及影评图片的图片特征,再通过注意力机制整合图片特征及句向量以得到融合了影评图片信息、文本影评信息及表情影评信息的特征张量,最后基于特征张量确定影评质量,从而可以快速准确的识别影评质量,解决了互联网时代网络视频影评需人工逐条审核的难题,节约了影评数据筛选所花费的人力资源。的人力资源。的人力资源。

【技术实现步骤摘要】
一种基于多模态数据的影评质量的识别方法及相关装置


[0001]本申请涉及互联网
,特别涉及一种基于多模态数据的影评质量的识别方法及相关装置。

技术介绍

[0002]互联网的时代,电影电视剧等网络视频指数式增长,而各种视频影评也愈发丰富和多态,其可以包括包含文本、图片和emoji表情等多种模态的数据。而为筛选出和视频主题相关性强且具表达通顺的影评进行优先展示,需要人工进行逐条审核并对优质评论打上深度影评等类似标签再做后续展示处理。但随着网络视频量迅速增加,这种人工筛选深度影评方法需要花费大量的人力资源,已经最逐渐无法适应网络需求。
[0003]因而现有技术还有待改进和提高。

技术实现思路

[0004]本申请要解决的技术问题在于,针对现有技术的不足,提供一种基于多模态数据的影评质量的识别方法及相关装置。
[0005]为了解决上述技术问题,本申请实施例第一方面提供了一种基于多模态数据的影评质量的识别方法,所述的识别方法包括:
[0006]获取待识别的影评数据,并检测所述影评数据是否包括影评图片;
[0007]当所述影评数据包括影评图片时,采用语言模型获取所述影评数据中的各影评语句各自对应的句向量,并获取各句向量各自对应的隐状态;
[0008]通过图片特征提取模型提取各影评图片各自对应的图片特征,并基于各影评图片各自对应的图片特征对各隐状态进行注意力学习,以得到各图片特征相对于各隐状态的注意力权重;
[0009]基于各图片特征相对于各隐状态的注意力权重以及各隐状态,确定各图片特征各自对应的特征张量;
[0010]基于各图片特征各自对应的特征张量,确定所述影评数据对应的影评质量。
[0011]所述基于多模态数据的影评质量的识别方法,其中,所述方法还包括:
[0012]当所述影评数据不包括影评图片时,采用语言模型获取所述影评数据中的各影评语句各自对应的句向量,并获取各句向量各自对应的隐状态;
[0013]基于所述句向量各自对应的隐状态,确定所述影评数据对应的影评质量。
[0014]所述基于多模态数据的影评质量的识别方法,其中,所述获取待识别的影评数据具体包括:
[0015]获取目标视频对应的影评数据以及所述目标视频对应的视频信息;
[0016]检测所述影评数据是否包括文本影评内容;
[0017]若包括文本影评内容,检测所述影评数据中是否包括至少一个预设关键词,其中,所述预设关键词为基于所述视频信息确定得到的;
[0018]若包括至少一个预设关键词,将所述影评数据作为待识别的影评数据。
[0019]所述基于多模态数据的影评质量的识别方法,其中,所述方法还包括:
[0020]若所述影评数据为包括文件影评内容,或者未包括至少一个预设关键词,则直接将所述影评数据的影片质量设置为低质量。
[0021]所述基于多模态数据的影评质量的识别方法,其中,所述检测所述影评数据中是否包括至少一个预设关键词之前,所述方法还包括:
[0022]若包括文本影评内容,则获取所述影评数据的语句通顺度;
[0023]当所述语句通顺度大于预设通顺度阈值时,检测所述影评数据中是否包括至少一个预设关键词;
[0024]当所述语句通顺度小于或者等于预设通顺阈值时,直接将所述影评数据的影片质量设置为低质量。
[0025]所述基于多模态数据的影评质量的识别方法,其中,所述采用语言模型获取所述影评数据中的各影评语句各自对应的句向量具体包括:
[0026]检测所述影评获取所述影评数据中的各影评语句,其中,所述影评语句包括文本影评内容,或者包括文本影评内容和表情影评内容;
[0027]通过语言模型获取文本影评内容中各影评词语各自对应的词向量,或者各影评词语各自对应的词向量以及表情影评内容种各表情影评的词向量;
[0028]将各影评词语各自对应的词向量拼接,或者将各影评词语各自对应的词向量以及表情影评内容种各表情影评的词向量拼接,以得到各影评语句各自对应的句向量。
[0029]所述基于多模态数据的影评质量的识别方法,其中,所述基于各图片特征各自对应的特征张量,确定所述影评数据对应的影评质量具体包括:
[0030]基于注意力机制以及各图片特征各自对应的特征张量,确定所述影评数据对应的影评向量;
[0031]基于激活函数以及所述影评向量,确定所述影评数据对应的影评质量,其中,所述影评质量包括高质量、中质量或低质量。
[0032]本申请实施例第二方面提供了一种基于多模态数据的影评质量的识别装置,所述的识别装置包括:
[0033]检测模块,用于获取待识别的影评数据,并检测所述影评数据是否包括影评图片;
[0034]获取模块,当所述影评数据包括影评图片时,采用语言模型获取所述影评数据中的各影评语句各自对应的句向量,并获取各句向量各自对应的隐状态;
[0035]提取模块,用于通过图片特征提取模型提取各影评图片各自对应的图片特征,并基于各影评图片各自对应的图片特征对各隐状态进行注意力学习,以得到各图片特征相对于各隐状态的注意力权重;
[0036]第一确定模块,用于基于各图片特征相对于各隐状态的注意力权重以及各隐状态,确定各图片特征各自对应的特征张量;
[0037]第二确定模块,用于基于各图片特征各自对应的特征张量,确定所述影评数据对应的影评质量。
[0038]本申请实施例第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实
现如上任一所述的基于多模态数据的影评质量的识别方法中的步骤。
[0039]本申请实施例第四方面提供了一种终端设备,其包括:处理器、存储器及通信总线;所述存储器上存储有可被所述处理器执行的计算机可读程序;
[0040]所述通信总线实现处理器和存储器之间的连接通信;
[0041]所述处理器执行所述计算机可读程序时实现如上任一所述的基于多模态数据的影评质量的识别方法中的步骤。
[0042]有益效果:与现有技术相比,本申请通过语言模型提取影片数据中的文本影评数据以及表情影评数据的句向量,然后通过特征提取模型提取影评图片的图片特征,再通过注意力机制整合图片特征以及句向量以得到融合了影评图片信息、文本影评信息以及表情影评信息的特征张量,最后基于该特征张量确定影评数据的影评质量,从而可以快速准确的识别影评数据的影评质量,解决了互联网时代网络视频影评需人工逐条审核的难题,节约了影评数据筛选所花费的人力资源。
附图说明
[0043]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员而言,在不符创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0044]图1为本本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多模态数据的影评质量的识别方法,其特征在于,所述的识别方法包括:获取待识别的影评数据,并检测所述影评数据是否包括影评图片;当所述影评数据包括影评图片时,采用语言模型获取所述影评数据中的各影评语句各自对应的句向量,并获取各句向量各自对应的隐状态;通过图片特征提取模型提取各影评图片各自对应的图片特征,并基于各影评图片各自对应的图片特征对各隐状态进行注意力学习,以得到各图片特征相对于各隐状态的注意力权重;基于各图片特征相对于各隐状态的注意力权重以及各隐状态,确定各图片特征各自对应的特征张量;基于各图片特征各自对应的特征张量,确定所述影评数据对应的影评质量。2.根据权利要求1所述基于多模态数据的影评质量的识别方法,其特征在于,所述方法还包括:当所述影评数据不包括影评图片时,采用语言模型获取所述影评数据中的各影评语句各自对应的句向量,并获取各句向量各自对应的隐状态;基于所述句向量各自对应的隐状态,确定所述影评数据对应的影评质量。3.根据权利要求1所述基于多模态数据的影评质量的识别方法,其特征在于,所述获取待识别的影评数据具体包括:获取目标视频对应的影评数据以及所述目标视频对应的视频信息;检测所述影评数据是否包括文本影评内容;若包括文本影评内容,检测所述影评数据中是否包括至少一个预设关键词,其中,所述预设关键词为基于所述视频信息确定得到的;若包括至少一个预设关键词,将所述影评数据作为待识别的影评数据。4.根据权利要求3所述基于多模态数据的影评质量的识别方法,其特征在于,所述方法还包括:若所述影评数据为包括文件影评内容,或者未包括至少一个预设关键词,则直接将所述影评数据的影片质量设置为低质量。5.根据权利要求3所述基于多模态数据的影评质量的识别方法,其特征在于,所述检测所述影评数据中是否包括至少一个预设关键词之前,所述方法还包括:若包括文本影评内容,则获取所述影评数据的语句通顺度;当所述语句通顺度大于预设通顺度阈值时,检测所述影评数据中是否包括至少一个预设关键词;当所述语句通顺度小于或者等于预设通顺阈值时,直接将所述影评数据的影片质量设置为低质量。6.根据权利要求1或2所述基于多模态数据的影评质量的识别方法,其特征在于,所述采用语言模型获取所述影评数据中的各影评语句各自对应的句向量具体包括:检测所...

【专利技术属性】
技术研发人员:乔文杰
申请(专利权)人:深圳市易平方网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1