一种基于AI生成个性化口播的方法、装置、设备和介质制造方法及图纸

技术编号：45040751 阅读：18 留言：0更新日期：2025-04-22 17:29

本发明专利技术提供一种基于AI生成个性化口播的方法、装置、设备和介质，方法包括：将口播数据以及设置的提示词输入至多模态模型中；所述口播数据包括原始文本以及对应的场景图片；多模态模型输出设定输出格式的标识文本，所述标识文本包括设定标识；将所述标识文本进行分割，通过语音模型生成对应的音频文件；若所述音频文件仅一个，则完成生成；否，则将其进行拼接，完成生成，可以根据用户需求生成对应的音频，降低了用户的时间成本。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能，特别涉及一种基于ai生成个性化口播的方法、装置、设备和介质。

技术介绍

1、视频口播是指在视频内容创作中，创作者通过口头讲述的方式来传达信息、表达观点、讲述故事或介绍产品等诸多内容；在电商视频、好物推荐视频中非常常见。博主通过口播详细介绍产品的各种属性；产品推荐型口播不仅要介绍产品本身，还会涉及价格、优惠活动、购买渠道等信息，并且通常会结合自身的使用体验，增强可信度和吸引力。

2、视频口播的要求：

3、1、清晰流畅：要确保口齿清晰，避免结巴或含混不清的表述。例如，提前练习台词，熟悉内容，这样在录制时就能自然流畅地表达。

4、2、语速语调：合理控制语速，根据内容的重要性和情感色彩调整语调。在介绍重点内容时可以适当放慢语速，而在表达激动、兴奋等情绪时可以提高语调。比如在推荐一款令人惊喜的产品时，可以用稍高的语调来突出它的优点。

5、3、口语化：尽量使用通俗易懂的口语，避免过于生僻的词汇和复杂的句子结构，让观众能够轻松理解。

6、而现有的视频口播，是通过创作者...

【技术保护点】

1.一种基于AI生成个性化口播的方法，其特征在于：包括下述步骤：

2.根据权利要求1所述的一种基于AI生成个性化口播的方法，其特征在于：所述步骤1具体为：

3.根据权利要求2所述的一种基于AI生成个性化口播的方法，其特征在于：所述步骤3具体为：采用正则匹配将所述标识文本根据情绪标识、语速标识、音量标识以及第二停顿标识进行分割，得到分割文本，将所述分割文本通过T2A语音模型生成对应的音频文件。

4.根据权利要求1所述的一种基于AI生成个性化口播的方法，其特征在于：所述步骤4具体为：若所述音频文件仅一个，则完成生成；否，则通过FFmpeg将所有音频文件按照...

【技术特征摘要】

1.一种基于ai生成个性化口播的方法，其特征在于：包括下述步骤：

2.根据权利要求1所述的一种基于ai生成个性化口播的方法，其特征在于：所述步骤1具体为：

3.根据权利要求2所述的一种基于ai生成个性化口播的方法，其特征在于：所述步骤3具体为：采用正则匹配将所述标识文本根据情绪标识、语速标识、音量标识以及第二停顿标识进行分割，得到分割文本，将所述分割文本通过t2a语音模型生成对应的音频文件。

4.根据权利要求1所述的一种基于ai生成个性化口播的方法，其特征在于：所述步骤4具体为：若所述音频文件仅一个，则完成生成；否，则通过ffmpeg将所有音频文件按照设定顺序进行拼接，完成生成。

5.一种基于ai生成个性化口播的装置，其特征在于：包括：

6.根据权利要求5所述的一种基于ai生成个性化口播的装置，其特征在于：所述设定模块具体为：提示词包括：设...

【专利技术属性】
技术研发人员：刘志海，王勤政，
申请(专利权)人：福建紫讯信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人