一种基于多模态数据的影评质量的识别方法及相关装置制造方法及图纸

技术编号：31509223 阅读：15 留言：0更新日期：2021-12-22 23:45

本申请公开了一种基于多模态数据的影评质量的识别方法及相关装置，方法包括提取影评语句的句向量、句向量的隐状态及影评图片的图片特征；确定各图片特征相对于各隐状态的注意力权重；基于各注意力权重及各隐状态确定各图片特征的特征张量；基于各特征张量确定影评数据对应的影评质量。本申请通过提取影片数据中的文本影评数据、表情影评数据的句向量及影评图片的图片特征，再通过注意力机制整合图片特征及句向量以得到融合了影评图片信息、文本影评信息及表情影评信息的特征张量，最后基于特征张量确定影评质量，从而可以快速准确的识别影评质量，解决了互联网时代网络视频影评需人工逐条审核的难题，节约了影评数据筛选所花费的人力资源。的人力资源。的人力资源。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多模态数据的影评质量的识别方法及相关装置

[0001]本申请涉及互联网
，特别涉及一种基于多模态数据的影评质量的识别方法及相关装置。

技术介绍

[0002]互联网的时代，电影电视剧等网络视频指数式增长，而各种视频影评也愈发丰富和多态，其可以包括包含文本、图片和emoji表情等多种模态的数据。而为筛选出和视频主题相关性强且具表达通顺的影评进行优先展示，需要人工进行逐条审核并对优质评论打上深度影评等类似标签再做后续展示处理。但随着网络视频量迅速增加，这种人工筛选深度影评方法需要花费大量的人力资源，已经最逐渐无法适应网络需求。
[0003]因而现有技术还有待改进和提高。

技术实现思路

[0004]本申请要解决的技术问题在于，针对现有技术的不足，提供一种基于多模态数据的影评质量的识别方法及相关装置。
[0005]为了解决上述技术问题，本申请实施例第一方面提供了一种基于多模态数据的影评质量的识别方法，所述的识别方法包括：
[0006]获取待识别的影评数据，并检测所述影评数据是否包括影评图片；
[0007]当所述影评数据包括影评图片时，采用语言模型获取所述影评数据中的各影评语句各自对应的句向量，并获取各句向量各自对应的隐状态；
[0008]通过图片特征提取模型提取各影评图片各自对应的图片特征，并基于各影评图片各自对应的图片特征对各隐状态进行注意力学习，以得到各图片特征相对于各隐状态的注意力权重；
[0009]基于各图片特征相对于各隐状态的注意力权重以及...

【技术保护点】

【技术特征摘要】
1.一种基于多模态数据的影评质量的识别方法，其特征在于，所述的识别方法包括：获取待识别的影评数据，并检测所述影评数据是否包括影评图片；当所述影评数据包括影评图片时，采用语言模型获取所述影评数据中的各影评语句各自对应的句向量，并获取各句向量各自对应的隐状态；通过图片特征提取模型提取各影评图片各自对应的图片特征，并基于各影评图片各自对应的图片特征对各隐状态进行注意力学习，以得到各图片特征相对于各隐状态的注意力权重；基于各图片特征相对于各隐状态的注意力权重以及各隐状态，确定各图片特征各自对应的特征张量；基于各图片特征各自对应的特征张量，确定所述影评数据对应的影评质量。2.根据权利要求1所述基于多模态数据的影评质量的识别方法，其特征在于，所述方法还包括：当所述影评数据不包括影评图片时，采用语言模型获取所述影评数据中的各影评语句各自对应的句向量，并获取各句向量各自对应的隐状态；基于所述句向量各自对应的隐状态，确定所述影评数据对应的影评质量。3.根据权利要求1所述基于多模态数据的影评质量的识别方法，其特征在于，所述获取待识别的影评数据具体包括：获取目标视频对应的影评数据以及所述目标视频对应的视频信息；检测所述影评数据是否包括文本影评内容；若包括文本影评内容，检测所述影评数据中是否包括至少一个预设关键词，其中，所述预设关键词为基于所述视频信息确定得到的；若包括至少一个预设关键词，将所述影评数据作为待识别的影评数据。4.根据权利要求3所述基于多模态数据的影评质量的识别方法，其特征在于，所述方法还包括：若所述影评数据为包括文件影评内容，或者未包括至少一个预设关键词，则直接将所述影评数据的影片质量设置为低质量。5.根据权利要求3所述基于多模态数据的影评质量的识别方法，其特征在于，所述检测所述影评数据中是否包括至少一个预设关键词之前，所述方法还包括：若包括文本影评内容，则获取所述影评数据的语句通顺度；当所述语句通顺度大于预设通顺度阈值时，检测所述影评数据中是否包括至少一个预设关键词；当所述语句通顺度小于或者等于预设通顺阈值时，直接将所述影评数据的影片质量设置为低质量。6.根据权利要求1或2所述基于多模态数据的影评质量的识别方法，其特征在于，所述采用语言模型获取所述影评数据中的各影评语句各自对应的句向量具体包括：检测所...

【专利技术属性】
技术研发人员：乔文杰，
申请(专利权)人：深圳市易平方网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人