【技术实现步骤摘要】
一种基于文字创意的视频自动生成方法和装置
[0001]本专利技术属于视频制作领域,特别是涉及一种基于文字创意的视频自动生成方法和装置
。
技术介绍
[0002]当前对于文字生成视频相关技术主要是在于以下三个方面:(1)通过一定的规则来将输入的文字和图片转化成视频
。
例如,公开号为 CN115988149A
的专利申请“一种
AI
智能图文生成视频的方法”,这类专利技术虽然提高了现有图文生成视频方法的实用性和便捷性,但是只能基于选择好的图片和文字做自动时间线效果的组装,无法解决基于已有资源库的海量视频以及文字来生成视频,实用度有限
。
[0003](2)基于文字直接生成视频
。
例如,公开号为 CN113934890A
的专利申请“一种自动文字生成场景视频的方法及系统”,这类专利技术基于自然语言预训练模型和计算机视觉技术
,
通过给定的语言输入自动生成短视频,但直接由文生图,再把图片做视频化的效果,存在生成的视频内容的真实性以及效果单一的问题
。
[0004](3)基于文字驱动生成人物播报的视频专利技术
。
例如,公开号为 CN114040126A
的专利申请“一种文字驱动的人物播报视频生成方法及装置”,这类专利技术主要是解决的人物播报的视频生成的单一场景,无法适配普适的短视频生成场景
。
技术实现思路
[0005]本专利技术的目的在于克服现有技术的不 ...
【技术保护点】
【技术特征摘要】
1.
一种基于文字创意的视频自动生成方法,其特征在于,包括:根据用户输入的创意描述生成口播文案;基于所述口播文案确定场景分割模式,并按照确定的场景分割模式对所述口播文案进行分割,生成多个文案片段;确定所述文案片段对应的视频片段;将所述视频片段组装成最终的视频
。2.
根据权利要求1所述的一种基于文字创意的视频自动生成方法,其特征在于,基于所述口播文案确定场景分割模式,并按照确定的场景分割模式对所述口播文案进行分割,生成多个文案片段,包括:检测口播文案的文案信息,所述文案信息包括段落数和字符数;若文案信息满足第一预设条件,则根据口播文案的段落数量将口播文案分割为若干个文案片段;若文案信息满足第二预设条件,则根据口播文案的语句数量将口播文案分割为若干个文案片段;若文案信息满足第三预设条件,则检测口播文案的类型,若口播文案属于第一预设类型,则根据口播文案的关键词将口播文案分割为若干个文案片段,否则根据口播文案中的标点符号将口播文案分割为若干个文案片段
。3.
根据权利要求2所述的一种基于文字创意的视频自动生成方法,其特征在于,第一预设条件为:口播文案的段落数大于第一阈值;或者,口播文案的段落数大于第二阈值
、
小于等于第一阈值,同时口播文案的字符数大于第三阈值;第二预设条件为:口播文案的段落数大于第二阈值
、
小于等于第一阈值,同时口播文案的字符数大于第四阈值
、
小于等于第三阈值;或者,口播文案的段落数小于等于第二阈值,同时口播文案的字符数大于第三阈值;第三预设条件为:口播文案的段落数大于第二阈值
、
小于等于第一阈值,同时口播文案的字符数小于等于第四阈值;或者,口播文案的段落数小于等于第二阈值,同时口播文案的字符数小于第三阈值;第一预设类型包括娱乐类型和短视频类型
。4.
根据权利要求2所述的一种基于文字创意的视频自动生成方法,其特征在于,根据口播文案的段落数量将口播文案分割为若干个文案片段,包括:将口播文案中的每个段落分割为一个文案片段;根据口播文案的语句数量将口播文案分割为若干个文案片段,包括:将口播文案中的每个语句分割为一个文案片段;根据口播文案中的标点符号将口播文案分割为若干个文案片段,包括:将口播文案中两个标点符号之间的文字分割为一个文案片段,若分割得到的一个文案片段的字数少于预设值,则将该文案片段与相邻的一个文案片段合并;根据口播文案的关键词将口播文案分割为若干个文案片段,包括:将口播文案分割成句子,对每个句子进行关键词提取,每个关键词作为一个文案片段;当相邻的两个关键词中间没有标点符号时,将这两个关键词构成一个文案片段
。5.
根据权利要求1所述的一种基于文字创意的视频自动生成方法,其特征在于,确定所
述文案片段对应的视频片段,包括:确定所述文案片段的关键词;基于所述关键词在预设的素材库中进行检索,得到检索结果;在检索结果中包括素材时,将检索结果中的一个素材确定为所述文案片段对应的视频片段;在检索结果中不包括素材时,基于所述关键词,利用
AI
...
【专利技术属性】
技术研发人员:唐学怡,余军,袁渊,唐尚海,董精松,刘盾,刘婷婷,
申请(专利权)人:成都华栖云科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。