多媒体资源的生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:46063905 阅读:7 留言:0更新日期:2025-08-11 15:50
本公开提供了一种多媒体资源的生成方法、装置、电子设备及存储介质,属于多媒体技术领域。方法包括:获取输入的参考图像和文本提示词;通过图像处理模型对参考图像进行图像识别,得到参考图像的图像描述信息和主体形态信息,图像描述信息包括参考图像中至少一个主体对象的类别,主体形态信息用于指示至少一个主体对象在参考图像中的位置;基于图像描述信息、主体形态信息、参考图像以及文本提示词,生成多媒体资源,多媒体资源包括至少一个主体对象和特效,且多媒体资源中特效的位置与至少一个主体对象的位置不同。上述方法能够避免生成的特效遮挡参考图像中的主体对象等关键内容,提高了多媒体资源的质量。

【技术实现步骤摘要】

本公开涉及多媒体,特别涉及一种多媒体资源的生成方法、装置、电子设备及存储介质


技术介绍

1、随着多媒体技术的不断发展,文本到图像(text-to-image)生成技术和图像到图像(image -to-image)生成技术已成为人们惯用的图像生成方法,如何生成高质量的图像是本领域所研究的重点。

2、相关技术中,通常采用的方式是:向图像生成模型中输入用户提供的参考图像和文本提示词,通过图像生成模型在参考图像中添加文本提示词所指示的特效,以生成新的图像。

3、但是,上述技术方案中仅仅是在参考图像中直接添加特效,未考虑参考图像中的具体内容,导致生成的图像中特效会遮挡参考图像的关键内容,导致生成的图像的质量依旧较低。比如参考图像是“人坐在椅子上”,提示词是“生长出鲜花”,而生成的图像中鲜花位于人的面部,且遮挡住人像,形成人像变成一朵花的效果,令人不适。


技术实现思路

1、本公开提供一种多媒体资源的生成方法、装置、电子设备及存储介质,能够避免生成的特效遮挡参考图像中的主体对象等关键内容,提高了多本文档来自技高网...

【技术保护点】

1.一种多媒体资源的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的多媒体资源的生成方法,其特征在于,所述基于所述图像描述信息、所述主体形态信息、所述参考图像以及所述文本提示词,生成所述多媒体资源,包括:

3.根据权利要求2所述的多媒体资源的生成方法,其特征在于,所述基于所述图像描述信息、所述主体形态信息以及所述文本提示词,生成资源描述信息,包括:

4.根据权利要求3所述的多媒体资源的生成方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的多媒体资源的生成方法,其特征在于,所述获取资源提示信息,包括下述任一项:

...

【技术特征摘要】

1.一种多媒体资源的生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的多媒体资源的生成方法,其特征在于,所述基于所述图像描述信息、所述主体形态信息、所述参考图像以及所述文本提示词,生成所述多媒体资源,包括:

3.根据权利要求2所述的多媒体资源的生成方法,其特征在于,所述基于所述图像描述信息、所述主体形态信息以及所述文本提示词,生成资源描述信息,包括:

4.根据权利要求3所述的多媒体资源的生成方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的多媒体资源的生成方法,其特征在于,所述获取资源提示信息,包括下述任一项:

6.根据权利要求5所述的多媒体资源的生成方法,其特征在于,所述基于所述参考图像和所述文本提示词,确定所述资源提示信息,包括...

【专利技术属性】
技术研发人员:王骥超施侃乐张迪盖坤
申请(专利权)人:北京达佳互联信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1