【技术实现步骤摘要】
视频弹幕的生成方法、装置、计算机设备及存储介质
本专利技术实施例涉及人工智能领域,尤其涉及一种视频弹幕的生成方法、装置、计算机设备及存储介质。
技术介绍
“弹幕”是用户在观看在线视频时发送的一种短文本,它们自上而下分布且以一定速度从右到左飘过视频播放窗口。用户可以通过弹幕共享信息、表达评论、讨论话题或者社交通讯等。这种体验提升了用户观看视频的兴致、乐趣、群体观看感以及交互感等。目前,大部分视频站点均可以向用户提供弹幕功能。一般来说,各个用户针对某一视频输入的历史弹幕可以存储在弹幕数据库中,当该视频被再次播放后,可以从弹幕数据库中获取该历史弹幕进行播放。当某一个视频的历史弹幕较少时,可以通过一定的弹幕扩充技术增加弹幕。现阶段,可以通过视频评论信息对应的字符图像自动渲染生成弹幕,也可以基于情绪信息和Seq2Seq(SequencetoSequence,序列到序列)模型自动生成情绪反馈弹幕,以增加弹幕。但是,现有技术的方法生成的弹幕一般与当前视频播放场景的匹配度较低,生成弹幕的内容单一。
技术实现思路
...
【技术保护点】
1.一种视频弹幕的生成方法,其特征在于,包括:/n获取与一条视频弹幕匹配的预测文本,并提取预测文本中的预测特征;/n将预测特征输入至预先训练的GPT-2模型中,获取GPT-2模型输出的预测文本的后文预测词,GPT-2模型使用视频关联文本,和/或视频弹幕训练得到;/n将后文预测词追加至预测文本的尾部,得到新的预测文本后,返回执行提取预测文本中的预测特征的操作,直至满足结束预测条件;/n将结束预测后得到预测文本作为与原始弹幕匹配的扩充弹幕。/n
【技术特征摘要】
1.一种视频弹幕的生成方法,其特征在于,包括:
获取与一条视频弹幕匹配的预测文本,并提取预测文本中的预测特征;
将预测特征输入至预先训练的GPT-2模型中,获取GPT-2模型输出的预测文本的后文预测词,GPT-2模型使用视频关联文本,和/或视频弹幕训练得到;
将后文预测词追加至预测文本的尾部,得到新的预测文本后,返回执行提取预测文本中的预测特征的操作,直至满足结束预测条件;
将结束预测后得到预测文本作为与原始弹幕匹配的扩充弹幕。
2.根据权利要求1所述的方法,其特征在于,在获取与一条视频弹幕匹配的预测文本之前,还包括:
生成与视频关联文本匹配的预训练数据集,以及与视频弹幕匹配的微调数据集;
构建GPT-2模型对象,并使用预训练数据集中各预训练数据的预测特征,对GPT-2模型对象进行迭代学习,生成GPT-2预训练模型;
使用微调数据集中各微调数据的预测特征,对所述GPT-2预训练模型中的各个参数进行优化,生成GPT-2模型。
3.根据权利要求1或2所述的方法,其特征在于,获取与一条视频弹幕匹配的预测文本,包括下述至少一项:
获取所述视频弹幕中包括的命名实体,作为与视频弹幕匹配的预测文本;
获取所述视频弹幕的全部内容,作为与视频弹幕匹配的预测文本;以及
获取所述视频弹幕中的部分内容,作为与视频弹幕匹配的预测文本。
4.根据权利要求1或2所述的方法,其特征在于,提取预测文本中的预测特征,包括:
获取所述预测文中包括的至少一个分词;
在预设的符号表中查询各所述分词,获取与各所述分词对应的符号编号;所述符号表中存储有符号与符号编号之间的映射关系,所述符号包括:分词、分隔符以及结尾符;
将查询得到的各所述符号编号按照分词在预测文本中的排布顺序进行组合,得到与所述预测文本对应的预测特征。
5.根据权利要求4所述的方法,其特征在于,将预测特征输入至预先训练的GPT-2模型中,获取GPT-2模型输出的预测文本的后文预测词,包括:
将预测特征输入至预先训练的GPT-2模型中;
通过GPT-2模型中的logits生成模块...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。