一种基于文字创意的视频自动生成方法和装置制造方法及图纸

技术编号:39492400 阅读:8 留言:0更新日期:2023-11-24 11:14
本发明专利技术公开了一种基于文字创意的视频自动生成方法和装置,属于视频制作领域

【技术实现步骤摘要】
一种基于文字创意的视频自动生成方法和装置


[0001]本专利技术属于视频制作领域,特别是涉及一种基于文字创意的视频自动生成方法和装置


技术介绍

[0002]当前对于文字生成视频相关技术主要是在于以下三个方面:(1)通过一定的规则来将输入的文字和图片转化成视频

例如,公开号为 CN115988149A
的专利申请“一种
AI
智能图文生成视频的方法”,这类专利技术虽然提高了现有图文生成视频方法的实用性和便捷性,但是只能基于选择好的图片和文字做自动时间线效果的组装,无法解决基于已有资源库的海量视频以及文字来生成视频,实用度有限

[0003](2)基于文字直接生成视频

例如,公开号为 CN113934890A
的专利申请“一种自动文字生成场景视频的方法及系统”,这类专利技术基于自然语言预训练模型和计算机视觉技术
,
通过给定的语言输入自动生成短视频,但直接由文生图,再把图片做视频化的效果,存在生成的视频内容的真实性以及效果单一的问题

[0004](3)基于文字驱动生成人物播报的视频专利技术

例如,公开号为 CN114040126A
的专利申请“一种文字驱动的人物播报视频生成方法及装置”,这类专利技术主要是解决的人物播报的视频生成的单一场景,无法适配普适的短视频生成场景


技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足,提供一种基于文字创意的视频自动生成方法和装置

[0006]本专利技术的目的是通过以下技术方案来实现的:一种基于文字创意的视频自动生成方法,包括:根据用户输入的创意描述生成口播文案;基于所述口播文案确定场景分割模式,并按照确定的场景分割模式对所述口播文案进行分割,生成多个文案片段;确定所述文案片段对应的视频片段;将所述视频片段组装成最终的视频

[0007]进一步地,基于所述口播文案确定场景分割模式,并按照确定的场景分割模式对所述口播文案进行分割,生成多个文案片段,包括:检测口播文案的文案信息,所述文案信息包括段落数和字符数;若文案信息满足第一预设条件,则根据口播文案的段落数量将口播文案分割为若干个文案片段;若文案信息满足第二预设条件,则根据口播文案的语句数量将口播文案分割为若干个文案片段;若文案信息满足第三预设条件,则检测口播文案的类型,若口播文案属于第一预
设类型,则根据口播文案的关键词将口播文案分割为若干个文案片段,否则根据口播文案中的标点符号将口播文案分割为若干个文案片段

[0008]进一步地,第一预设条件为:口播文案的段落数大于第一阈值;或者,口播文案的段落数大于第二阈值

小于等于第一阈值,同时口播文案的字符数大于第三阈值;第二预设条件为:口播文案的段落数大于第二阈值

小于等于第一阈值,同时口播文案的字符数大于第四阈值

小于等于第三阈值;或者,口播文案的段落数小于等于第二阈值,同时口播文案的字符数大于第三阈值;第三预设条件为:口播文案的段落数大于第二阈值

小于等于第一阈值,同时口播文案的字符数小于等于第四阈值;或者,口播文案的段落数小于等于第二阈值,同时口播文案的字符数小于第三阈值;第一预设类型包括娱乐类型和短视频类型

[0009]进一步地,根据口播文案的段落数量将口播文案分割为若干个文案片段,包括:将口播文案中的每个段落分割为一个文案片段;根据口播文案的语句数量将口播文案分割为若干个文案片段,包括:将口播文案中的每个语句分割为一个文案片段;根据口播文案中的标点符号将口播文案分割为若干个文案片段,包括:将口播文案中两个标点符号之间的文字分割为一个文案片段,若分割得到的一个文案片段的字数少于预设值,则将该文案片段与相邻的一个文案片段合并;根据口播文案的关键词将口播文案分割为若干个文案片段,包括:将口播文案分割成句子,对每个句子进行关键词提取,每个关键词作为一个文案片段;当相邻的两个关键词中间没有标点符号时,将这两个关键词构成一个文案片段

[0010]进一步地,确定所述文案片段对应的视频片段,包括:确定所述文案片段的关键词;基于所述关键词在预设的素材库中进行检索,得到检索结果;在检索结果中包括素材时,将检索结果中的一个素材确定为所述文案片段对应的视频片段;在检索结果中不包括素材时,基于所述关键词,利用
AI
作画生成图片素材,并为所述图片素材设置动画效果,得到所述文案片段对应的视频片段

[0011]进一步地,基于所述关键词在预设的素材库中进行检索,得到检索结果,包括:将每个文案片段对应的所有关键词作为一个关键词组;对关键词组中的关键词进行词性以及词频率分析,按照词频先后进行排序,同词频下按名词

动词

形容词

副词的顺序进行排序;将关键词组中所有关键词同时作为检索词在素材库中进行检索,若匹配到素材,则将匹配到的素材作为检索结果;若未匹配到素材,则将关键词组中词频超过一的关键词同时作为检索词在素材库中进行检索,若匹配到素材,则将匹配到的素材作为检索结果;若未匹配到素材,将关键词组的所有名词同时作为检索词在素材库中进行检索,若匹配到素材,则将匹配到的素材作为检索结果;若未匹配到素材,则将关键词中排名第一的关键词作为检索词在素材库中进行检索,若匹配到素材,则将匹配到的素材作为检索结果;若未匹配到素材,则将关键词中排名第二的关键词作为检索词在素材库中进行检索,以此类推,直到
匹配到素材或者关键词组中每个关键词均作为检索词进行一次检索

[0012]进一步地,将检索结果中的一个视频片段确定为所述文案对应的视频片段,包括:当检索结果中只包括一个素材时,将该素材确定所述文案片段对应的视频片段;当检索结果中包括两个及以上素材时,基于所述素材对应的元数据信息,按预设规则对所述素材进行打分,将得分最高的一个素材确定所述文案片段对应的视频片段

[0013]进一步地,基于所述素材对应的元数据信息,按预设规则对所述素材进行打分,包括:根据关键词是否直接命中以及命中次数确定第一分值;根据关键词与素材的元数据内容的匹配结果确定第二分值;根据文案片段的时长与素材的时长的匹配度确定第三分值;根据素材的入库时间确定第四分值;根据素材的历史选用频率确定第五分值;根据素材的格式确定第六分值;根据素材在同一预设时间段内被同一用户用相同关键词命中的次数确定第七分钟;根据预设权重对第一分值至第七分值进行加权求和,得到最终的打分结果

[0014]进一步地,将所述视频片段组装成最终的视频,包括:将所述视频片段及文案片段组装成时间线;根据预选的视频包装模板将音视频特技

图文字幕效果以及背景配音组装进时间线;将所述时间线渲染为最终的视频
。<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于文字创意的视频自动生成方法,其特征在于,包括:根据用户输入的创意描述生成口播文案;基于所述口播文案确定场景分割模式,并按照确定的场景分割模式对所述口播文案进行分割,生成多个文案片段;确定所述文案片段对应的视频片段;将所述视频片段组装成最终的视频
。2.
根据权利要求1所述的一种基于文字创意的视频自动生成方法,其特征在于,基于所述口播文案确定场景分割模式,并按照确定的场景分割模式对所述口播文案进行分割,生成多个文案片段,包括:检测口播文案的文案信息,所述文案信息包括段落数和字符数;若文案信息满足第一预设条件,则根据口播文案的段落数量将口播文案分割为若干个文案片段;若文案信息满足第二预设条件,则根据口播文案的语句数量将口播文案分割为若干个文案片段;若文案信息满足第三预设条件,则检测口播文案的类型,若口播文案属于第一预设类型,则根据口播文案的关键词将口播文案分割为若干个文案片段,否则根据口播文案中的标点符号将口播文案分割为若干个文案片段
。3.
根据权利要求2所述的一种基于文字创意的视频自动生成方法,其特征在于,第一预设条件为:口播文案的段落数大于第一阈值;或者,口播文案的段落数大于第二阈值

小于等于第一阈值,同时口播文案的字符数大于第三阈值;第二预设条件为:口播文案的段落数大于第二阈值

小于等于第一阈值,同时口播文案的字符数大于第四阈值

小于等于第三阈值;或者,口播文案的段落数小于等于第二阈值,同时口播文案的字符数大于第三阈值;第三预设条件为:口播文案的段落数大于第二阈值

小于等于第一阈值,同时口播文案的字符数小于等于第四阈值;或者,口播文案的段落数小于等于第二阈值,同时口播文案的字符数小于第三阈值;第一预设类型包括娱乐类型和短视频类型
。4.
根据权利要求2所述的一种基于文字创意的视频自动生成方法,其特征在于,根据口播文案的段落数量将口播文案分割为若干个文案片段,包括:将口播文案中的每个段落分割为一个文案片段;根据口播文案的语句数量将口播文案分割为若干个文案片段,包括:将口播文案中的每个语句分割为一个文案片段;根据口播文案中的标点符号将口播文案分割为若干个文案片段,包括:将口播文案中两个标点符号之间的文字分割为一个文案片段,若分割得到的一个文案片段的字数少于预设值,则将该文案片段与相邻的一个文案片段合并;根据口播文案的关键词将口播文案分割为若干个文案片段,包括:将口播文案分割成句子,对每个句子进行关键词提取,每个关键词作为一个文案片段;当相邻的两个关键词中间没有标点符号时,将这两个关键词构成一个文案片段
。5.
根据权利要求1所述的一种基于文字创意的视频自动生成方法,其特征在于,确定所
述文案片段对应的视频片段,包括:确定所述文案片段的关键词;基于所述关键词在预设的素材库中进行检索,得到检索结果;在检索结果中包括素材时,将检索结果中的一个素材确定为所述文案片段对应的视频片段;在检索结果中不包括素材时,基于所述关键词,利用
AI
...

【专利技术属性】
技术研发人员:唐学怡余军袁渊唐尚海董精松刘盾刘婷婷
申请(专利权)人:成都华栖云科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1