一种基于AI生成个性化口播的方法、装置、设备和介质制造方法及图纸

技术编号:45040751 阅读:18 留言:0更新日期:2025-04-22 17:29
本发明专利技术提供一种基于AI生成个性化口播的方法、装置、设备和介质,方法包括:将口播数据以及设置的提示词输入至多模态模型中;所述口播数据包括原始文本以及对应的场景图片;多模态模型输出设定输出格式的标识文本,所述标识文本包括设定标识;将所述标识文本进行分割,通过语音模型生成对应的音频文件;若所述音频文件仅一个,则完成生成;否,则将其进行拼接,完成生成,可以根据用户需求生成对应的音频,降低了用户的时间成本。

【技术实现步骤摘要】

本专利技术涉及人工智能,特别涉及一种基于ai生成个性化口播的方法、装置、设备和介质。


技术介绍

1、视频口播是指在视频内容创作中,创作者通过口头讲述的方式来传达信息、表达观点、讲述故事或介绍产品等诸多内容;在电商视频、好物推荐视频中非常常见。博主通过口播详细介绍产品的各种属性;产品推荐型口播不仅要介绍产品本身,还会涉及价格、优惠活动、购买渠道等信息,并且通常会结合自身的使用体验,增强可信度和吸引力。

2、视频口播的要求:

3、1、清晰流畅:要确保口齿清晰,避免结巴或含混不清的表述。例如,提前练习台词,熟悉内容,这样在录制时就能自然流畅地表达。

4、2、语速语调:合理控制语速,根据内容的重要性和情感色彩调整语调。在介绍重点内容时可以适当放慢语速,而在表达激动、兴奋等情绪时可以提高语调。比如在推荐一款令人惊喜的产品时,可以用稍高的语调来突出它的优点。

5、3、口语化:尽量使用通俗易懂的口语,避免过于生僻的词汇和复杂的句子结构,让观众能够轻松理解。

6、而现有的视频口播,是通过创作者自己进行录制音频,然本文档来自技高网...

【技术保护点】

1.一种基于AI生成个性化口播的方法,其特征在于:包括下述步骤:

2.根据权利要求1所述的一种基于AI生成个性化口播的方法,其特征在于:所述步骤1具体为:

3.根据权利要求2所述的一种基于AI生成个性化口播的方法,其特征在于:所述步骤3具体为:采用正则匹配将所述标识文本根据情绪标识、语速标识、音量标识以及第二停顿标识进行分割,得到分割文本,将所述分割文本通过T2A语音模型生成对应的音频文件。

4.根据权利要求1所述的一种基于AI生成个性化口播的方法,其特征在于:所述步骤4具体为:若所述音频文件仅一个,则完成生成;否,则通过FFmpeg将所有音频文件按照...

【技术特征摘要】

1.一种基于ai生成个性化口播的方法,其特征在于:包括下述步骤:

2.根据权利要求1所述的一种基于ai生成个性化口播的方法,其特征在于:所述步骤1具体为:

3.根据权利要求2所述的一种基于ai生成个性化口播的方法,其特征在于:所述步骤3具体为:采用正则匹配将所述标识文本根据情绪标识、语速标识、音量标识以及第二停顿标识进行分割,得到分割文本,将所述分割文本通过t2a语音模型生成对应的音频文件。

4.根据权利要求1所述的一种基于ai生成个性化口播的方法,其特征在于:所述步骤4具体为:若所述音频文件仅一个,则完成生成;否,则通过ffmpeg将所有音频文件按照设定顺序进行拼接,完成生成。

5.一种基于ai生成个性化口播的装置,其特征在于:包括:

6.根据权利要求5所述的一种基于ai生成个性化口播的装置,其特征在于:所述设定模块具体为:提示词包括:设...

【专利技术属性】
技术研发人员:刘志海王勤政
申请(专利权)人:福建紫讯信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1