【技术实现步骤摘要】
基于人工智能的生成视频评论的方法及设备
本公开涉及人工智能服务领域,更具体地涉及一种基于人工智能的生成视频评论的方法、设备、电子设备和计算机可读存储介质。本公开还涉及一种基于人工智能的生成文本评论的方法。
技术介绍
用户在视频平台发布视频后将期望获得对其发布的视频的评价信息以对自己发布的视频进行改进。目前,用户只能等待视频观看者在观看该视频之后手动输入评论。由于并非所有用户都会在观看视频后对视频进行评论,因此用户可能在短时间内无法获得对其发布的视频的评价信息。另一方面,视频观看者在观看视频后也常常苦于无法写出合适的视频评论,因此需要向视频观看者提供参考视频评论。类似地,用户在文本发布平台发布文本(例如,小说、新闻、帖子、论文等)后也可能需要获得对其发布的文本的评价信息。并且,文本阅读者也可能需要一些文本评价信息来辅助他/她撰写其阅读的文本的评论。
技术实现思路
本公开的实施例提供了基于人工智能的生成视频评论的方法、设备、电子设备和计算机可读存储介质。本公开的实施例提供了一种基于人工智能的生成视频评 ...
【技术保护点】
1.一种基于人工智能的生成视频评论的方法,包括:/n确定视频库中与待评论视频相似的相似视频集;/n获取所述相似视频集的历史评论集;以及/n基于所述相似视频集的历史评论集,生成所述待评论视频的视频评论。/n
【技术特征摘要】
1.一种基于人工智能的生成视频评论的方法,包括:
确定视频库中与待评论视频相似的相似视频集;
获取所述相似视频集的历史评论集;以及
基于所述相似视频集的历史评论集,生成所述待评论视频的视频评论。
2.如权利要求1所述的基于人工智能的生成视频评论的方法,其中,所述确定视频库中与待评论视频相似的相似视频集包括:
获取所述待评论视频的多模态深度表示向量;
基于所述待评论视频的多模态深度表示向量,确定视频库中与所述待评论视频相似的相似视频集。
3.如权利要求2所述的基于人工智能的生成视频评论的方法,其中,所述获取所述待评论视频的多模态深度表示向量,包括:
获取所述待评论视频的图像特征向量、音频特征向量和文本特征向量中的至少两个特征向量;
将所获取的至少两个特征向量拼接成所述待评论视频的多模态特征融合表示向量;
将所述多模态特征融合表示向量转换为所述待评论视频的多模态深度表示向量。
4.如权利要求1所述的基于人工智能的生成视频评论的方法,还包括:
发布所生成的视频评论;或者
将所生成的视频评论提供为候选视频评论。
5.如权利要求3所述的基于人工智能的生成视频评论的方法,其中,所述获取所述待评论视频的图像特征向量包括:
从所述待评论视频抽取所述待评论视频的多个代表视频帧;
将所述多个代表视频帧转换为多个初步视频帧表示向量;以及
将所述多个初步视频帧表示向量转换为所述待评论视频的图像特征向量。
6.如权利要求3所述的基于人工智能的生成视频评论的方法,其中,所述获取所述待评论视频的音频特征向量包括:
从所述待评论视频抽取所述待评论视频的多个代表音频片段;以及
将所述多个代表音频片段转换为所述待评论视频的音频特征向量。
7.如权利要求3所述的基于人工智能的生成视频评论的方法,其中,所述获取所述待评论视频的文本特征向量包括:
获取所述待评论视频的标题、描述和字幕;
将所述待评论视频的标题、描述和字幕转换为编码隐藏状态向量;
将所述编码隐藏状态向量转换为所述待评论视频的文本特征向量。
8.如权利要求1所述的基于人工智能的生成视频评论的方法,其中,所述基于所述待评论视频的多模态深度表示向量,获取与所述待评论视频相似的相似视频集包括:
将所述待评论视频的多模态深度表示向量作为查询键,
利用所述查询键,从检索数据库中获取与所述待评论的视频相似的多个备选视频,
利用所述多个备选视频构建相似视频集;
其中,所述检索数据库包括所述视频库中多个视频的视频信息,其中每个视频的视频信息包括所述视频的唯一标识符、以及所述视频的多模态深度...
【专利技术属性】
技术研发人员:陈小帅,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。