视频处理方法、装置、服务器及计算机可读存储介质制造方法及图纸

技术编号:29703422 阅读:9 留言:0更新日期:2021-08-17 14:31
本公开关于一种视频处理方法、装置、服务器及计算机可读存储介质,属于多媒体处理技术领域。本公开中,通过从视频对应的文本数据中识别出用于对物品的相关信息进行介绍的第一文本片段,进而自动从视频中拆解出目标第一文本片段对应的目标视频片段,由于目标第一文本片段都是用来对相同物品的相关信息进行介绍的,因而这些目标视频片段也是对相同物品的相关信息进行介绍的,从而基于这些目标视频片段,自动生成对某个物品的相关信息进行介绍的目标视频,无需手动生成视频,提高了生成视频的效率。

【技术实现步骤摘要】
视频处理方法、装置、服务器及计算机可读存储介质
本公开涉及多媒体处理
,尤其涉及一种视频处理方法、装置、服务器及计算机可读存储介质。
技术介绍
随着移动互联网的飞速发展,视频播放类应用程序中的视频资源也越来越丰富。为了在视频播放类应用程序中持续发布视频,视频发布者需要不断的提供新的视频素材,而这些视频素材,需要视频发布者自行拍摄才能得到,耗费时间较长,从而导致生成视频的效率较低。
技术实现思路
本公开提供一种视频处理方法、装置、服务器及计算机可读存储介质,以提高生成视频的效率。本公开的技术方案如下:根据本公开实施例的第一方面,提供一种视频处理方法,该方法包括:获取视频对应的文本数据;从该文本数据中确定多个第一文本片段,该第一文本片段用于对物品的相关信息进行介绍;基于该多个第一文本片段,从该视频中确定目标第一文本片段对应的多个目标视频片段,该目标第一文本片段用于对相同物品的相关信息进行介绍;基于该多个目标视频片段,生成目标视频。本公开实施例中,通过从视频对应的文本数据中识别出用于对物品的相关信息进行介绍的第一文本片段,进而自动从视频中拆解出目标第一文本片段对应的目标视频片段,由于目标第一文本片段都是用来对相同物品的相关信息进行介绍的,因而这些目标视频片段也是对相同物品的相关信息进行介绍的,从而基于这些目标视频片段,自动生成对某个物品的相关信息进行介绍的目标视频,无需手动生成视频,提高了生成视频的效率。在一些实施例中,该从该文本数据中确定多个第一文本片段,包括:将该文本数据输入文本识别模型,通过该文本识别模型,输出该第一文本片段的时间戳。本公开实施例中,通过文本识别模型来对文本数据进行识别,从而直接能够直接从文本数据中,确定出对物品的相关信息进行介绍的第一文本片段的时间戳,无需视频发布者手动操作,提高第一文本片段的确定效率,而且,通过模型来进行第一文本片段的确定,能够提高确定出的第一文本片段的准确性。在一些实施例中,该通过该文本识别模型,输出该第一文本片段的时间戳,包括:通过该文本识别模型,对该文本数据进行语义识别,得到该文本数据的语义描述信息,该语义描述信息用于指示该文本数据的各个文本片段所描述的内容;从该文本数据中确定满足第一目标条件的语义描述信息对应的第一文本片段,输出该第一文本片段的时间戳。本公开实施例中,通过文本识别模型来对文本数据进行识别,进而基于识别出的语义描述信息,从文本数据中确定出对物品的相关信息进行介绍的第一文本片段,无需视频发布者手动操作,提高第一文本片段的确定效率,而且,通过模型来进行第一文本片段的确定,能够提高确定出的第一文本片段的准确性。在一些实施例中,该基于该多个第一文本片段,从该视频中确定目标第一文本片段对应的多个目标视频片段,包括:将该视频、该文本数据和该第一文本片段的时间戳输入片段分割模型,通过该片段分割模型,输出该目标视频片段的时间戳;基于该目标视频片段的时间戳,从该视频中确定该多个目标视频片段。本公开实施例中,通过片段分割模型,来确定目标视频片段的时间戳,进而根据确定出的时间戳,从视频中拆解出多个目标视频片段,实现可使用的视频片段的自动挑选,无需视频发布者手动操作,提高目标视频片段的确定效率,而且,通过模型来进行目标视频片段的确定,能够提高确定出的目标视频片段的准确性。在一些实施例中,该通过该片段分割模型,输出该目标视频片段的时间戳,包括:通过该片段分割模型,从该文本数据中确定该目标第一文本片段对应的第二文本片段;基于该第二文本片段,从该视频中确定目标视频片段,作为该目标第一文本片段对应的多个目标视频片段。本公开实施例中,通过片段分割模型,从文本数据中识别出语义完整的第二文本片段,进而根据第二文本片段,从视频中拆解出多个目标视频片段,实现可使用的视频片段的自动挑选,无需视频发布者手动操作,提高目标视频片段的确定效率,还能够保证确定出的目标视频片段的完整性,而且,通过模型来进行目标视频片段的确定,能够提高确定出的目标视频片段的准确性。在一些实施例中,该基于该多个第一文本片段,从该视频中确定目标第一文本片段对应的多个目标视频片段之后,该方法还包括:对于任一目标视频片段,获取该任一目标视频片段对应的第三文本片段;将该第三文本片段输入文本分类模型,通过该文本分类模型,确定该第三文本片段的内容类型,作为该任一目标视频片段的内容类型,该内容类型用于指示该任一目标视频片段所介绍的物品的相关信息的类型;该基于该多个目标视频片段,生成目标视频,包括:基于该多个目标视频片段的内容类型,对满足第二目标条件的目标视频片段进行拼接,得到该目标视频。本公开实施例中,通过对目标视频片段对应的第三文本片段进行识别,以获取各个目标视频片段的内容类型,以获知各个目标视频片段所介绍的物品的相关信息的类型,进而对内容类型满足第二目标条件的目标视频片段进行拼接,以实现目标视频的生成,无需视频发布者手动操作,提高视频生成效率。在一些实施例中,该基于该多个目标视频片段,生成目标视频之后,该方法还包括:获取目标音频,合成该目标视频和该目标音频。本公开实施例中,通过合成目标视频和目标音频,以实现对目标视频的配乐,进而提高目标视频的质量,以便通过目标视频能够吸引更多的用户,提高用户体验。在一些实施例中,该合成该目标视频和该目标音频之后,该方法还包括:对于任一目标视频片段,基于目标音频的节奏点时间戳,对该目标视频片段的播放时长进行调整,得到调整后的目标视频片段;其中,该调整后的目标视频片段的起始时间戳与第一节奏点的时间戳重合,且该调整后的目标视频片段的结束时间戳与第二节奏点的时间戳重合,该第一节奏点的时间戳在该第二节奏点的时间戳之前。本公开实施例中,通过在目标视频片段的画面切换时间与目标音频的节奏点时间戳不匹配时,对目标视频片段的播放时长进行调整,以保证调整后的目标视频片段的起止时间戳均能与目标音频的节奏时间戳重合,增强目标视频的节奏感,提高目标视频的配乐效果,从而提高用户体验。在一些实施例中,该对于任一目标视频片段,基于目标音频的节奏点时间戳,对该目标视频片段的播放时长进行调整,得到调整后的目标视频片段,包括下述至少一项:基于目标音频的节奏点时间戳,对该任一目标视频片段的播放速度进行调整,得到调整后的目标视频片段;基于目标音频的节奏点时间戳,删除该任一目标视频片段中不满足第三目标条件的视频帧,得到调整后的目标视频片段。本公开实施例中,通过对目标视频片段的播放速度进行调整,或者,删除目标视频片段中不满足第三目标条件的视频帧,能够在保证目标视频片段的完整性的前提下,实现对目标视频片段的播放时长的调整,以使调整后的目标视频片段的起止时间戳均能与目标音频的节奏时间戳重合,增强目标视频的节奏感。在一些实施例中,该基于目标音频的节奏点时间戳,删本文档来自技高网...

【技术保护点】
1.一种视频处理方法,其特征在于,所述方法包括:/n获取视频对应的文本数据;/n从所述文本数据中确定多个第一文本片段,所述第一文本片段用于对物品的相关信息进行介绍;/n基于所述多个第一文本片段,从所述视频中确定目标第一文本片段对应的多个目标视频片段,所述目标第一文本片段用于对相同物品的相关信息进行介绍;/n基于所述多个目标视频片段,生成目标视频。/n

【技术特征摘要】
1.一种视频处理方法,其特征在于,所述方法包括:
获取视频对应的文本数据;
从所述文本数据中确定多个第一文本片段,所述第一文本片段用于对物品的相关信息进行介绍;
基于所述多个第一文本片段,从所述视频中确定目标第一文本片段对应的多个目标视频片段,所述目标第一文本片段用于对相同物品的相关信息进行介绍;
基于所述多个目标视频片段,生成目标视频。


2.根据权利要求1所述的视频处理方法,其特征在于,所述从所述文本数据中确定多个第一文本片段,包括:
将所述文本数据输入文本识别模型,通过所述文本识别模型,输出所述第一文本片段的时间戳。


3.根据权利要求2所述的方法,其特征在于,所述通过所述文本识别模型,输出所述第一文本片段的时间戳,包括:
通过所述文本识别模型,对所述文本数据进行语义识别,得到所述文本数据的语义描述信息,所述语义描述信息用于指示所述文本数据的各个文本片段所描述的内容;
从所述文本数据中确定满足第一目标条件的语义描述信息对应的第一文本片段,输出所述第一文本片段的时间戳。


4.根据权利要求2所述的视频处理方法,其特征在于,所述基于所述多个第一文本片段,从所述视频中确定目标第一文本片段对应的多个目标视频片段,包括:
将所述视频、所述文本数据和所述第一文本片段的时间戳输入片段分割模型,通过所述片段分割模型,输出所述目标视频片段的时间戳;
基于所述目标视频片段的时间戳,从所述视频中确定所述多个目标视频片段。


5.根据权利要求4所述的方法,其特征在于,所述通过所述片段分割模型,输出所述目标视频片段的时间戳,包括:
通过所述片段分割模型,从所述文本数据中确定所述目标第一文本片段对应的第二文本片段;
基于所述第二文本片段,从所述视频中确定目标视频片段,作为所述目标第一文本片段对应的多个目标视频片段。

【专利技术属性】
技术研发人员:刘旭东张梦馨梅晓茸李杰漆跃昕高帆
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1