System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种动漫表情包生成方法技术_技高网

一种动漫表情包生成方法技术

技术编号:40464972 阅读:4 留言:0更新日期:2024-02-22 23:18
本发明专利技术公开了一种动漫表情包生成方法。它具体包括如下步骤:获取用户输入图进行预处理;将预处理后的图输入到Blip语言模型,得到对应输入图的文本描述;选择某一种动漫风格的生成模型,将预处理的图和对应文本描述输入到生成模型中,生成与用户形象一致的表情包;制作多组不同的表情引导图用来驱动多样性的表情包生成;以生成的表情包作为动漫形象参考图,同时将表情引导图输入到条件控制模型和生成模型中,得到一组具有用户形象且不同表情的动漫表情包。本发明专利技术的有益效果是:采用自动化工作流程,大大减少了制作高质量表情包所需的时间和劳动力,以提高表情包生成效率。

【技术实现步骤摘要】

本专利技术涉及计算机视觉图像处理相关,尤其是指一种动漫表情包生成方法


技术介绍

1、表情包作为一种流行的数字沟通形式,它允许用户以一种直观且有趣的方式表达情感。在社交媒体、即时通讯和网络文化中,表情包扮演着加强交流互动、表达复杂情绪和创造幽默感的角色,已经成为现代人们在线交流不可或缺的部分。

2、传统的表情包制作方法依赖于设计师的技能和创意,通常使用如photoshop等图形编辑软件进行制作。尽管这些方法可以创造出高质量的作品,但它们通常需要专业技能和大量时间。同时在面对不断变化的趋势和用户需求,传统方法可能难以快速适应,从而限制了表情包的多样性和个性化水平。尤其是在定制用户形象表情包这方面,缺乏创新性和多样性。


技术实现思路

1、本专利技术是为了克服现有技术中存在上述的不足,提供了一种减少制作时间和劳动力的动漫表情包生成方法。

2、为了实现上述目的,本专利技术采用以下技术方案:

3、一种动漫表情包生成方法,具体包括如下步骤:

4、(1)获取用户输入图;

5、(2)对获取的用户输入图进行预处理;

6、(3)将预处理后的图输入到blip语言模型,得到对应输入图的文本描述;

7、(4)选择某一种动漫风格的生成模型,将预处理的图和对应文本描述输入到生成模型中,生成与用户形象一致的表情包;

8、(5)制作不同的表情引导图用来驱动多样性的表情包生成;

9、(6)以步骤(4)中生成的表情包作为动漫形象参考图,同时将步骤(5)中的表情引导图输入到条件控制模型和步骤(4)中的生成模型中,得到具有用户形象且不同表情的动漫表情包。

10、本方法利用先进的扩散模型技术,在保证高分辨率和视觉吸引力的同时,创建独特和创新的表情包设计,采用自动化工作流程,大大减少了制作高质量表情包所需的时间和劳动力,以提高表情包生成效率,同时能够根据用户的形象生成与其一致的动漫表情包组图。

11、作为优选,在步骤(1)中,具体为:获取用户输入图i,主要包含用户自身形象。

12、作为优选,在步骤(2)中,具体为:对获取的用户图i进行预处理,主要包括人脸矫正和背景替换两个步骤;(21)准备一个标准的模特图i1,分别对用户图i和模特图i1进行人脸检测,得到对应的人脸五官点位;(22)根据用户图i和模特图i1的人脸五官点位,计算得到仿射变换矩阵m,利用仿射变换矩阵m对用户图i进行放射变换,得到矫正后的用户图i2;(23)用抠像算法将矫正后的用户图i2的背景替换为纯白色,得到预处理后的图i3。

13、作为优选,在步骤(3)中,具体为:将预处理后的图i3送入到blip语言模型中,该模型将输入图转化成对应的文本描述,得到输入图的文本描述p。

14、作为优选,在步骤(4)中,针对不同动漫风格的生成模型训练,具体为:准备n组不同风格的动漫数据集,每组数据集至少包括20张以上的动漫图片,将每张动漫图片输入到步骤(3)中提到的blip语言模型中,得到对应的动漫文本描述;通过n组动漫数据集训练得到n个动漫风格的模型,以某一动漫风格的模型n1为例,将步骤(2)中的处理图i3和步骤(3)中对应的文本描述p输入到模型n1中,得到用户形象的动漫图x1。

15、作为优选,在步骤(5)中,针对制作脸部的表情引导图,具体为:拍摄模特不同表情的真实图片,对这些图片进行人脸关键点及人体姿态点检测,得到表情引导图l,每张表情引导图最多包括68个人脸关键点及18个人体姿态点。

16、作为优选,在步骤(6)中,条件控制模型采用controlnet模型,其主要作用是将步骤(5)中的表情引导图转换成特征向量,然后将特征向量输入到生成模型中,以步骤(4)中的动漫图x1作为用户动漫形象参考图,选取对应的动漫模型n1,选取一张表情引导图l1,将l1输入到条件控制模型中,得到对应的特征向量y1,y1由13个4维特征矩阵组成,然后将{x1,y1}输入到模型n1中,得到一张具有用户形象的动漫表情包图,根据表情包内动漫表情包图的数量对步骤(6)循环执行对应的次数,即可得到一组包含对应次数用户形象的不同动漫表情包组图。

17、本专利技术的有益效果是:利用先进的扩散模型技术,在保证高分辨率和视觉吸引力的同时,创建独特和创新的表情包设计,采用自动化工作流程,大大减少了制作高质量表情包所需的时间和劳动力,以提高表情包生成效率。

本文档来自技高网...

【技术保护点】

1.一种动漫表情包生成方法,其特征是,具体包括如下步骤:

2.根据权利要求1所述的一种动漫表情包生成方法,其特征是,在步骤(1)中,具体为:获取用户输入图I,主要包含用户自身形象。

3.根据权利要求2所述的一种动漫表情包生成方法,其特征是,在步骤(2)中,具体为:对获取的用户图I进行预处理,主要包括人脸矫正和背景替换两个步骤;(21)准备一个标准的模特图I1,分别对用户图I和模特图I1进行人脸检测,得到对应的人脸五官点位;(22)根据用户图I和模特图I1的人脸五官点位,计算得到仿射变换矩阵M,利用仿射变换矩阵M对用户图I进行放射变换,得到矫正后的用户图I2;(23)用抠像算法将矫正后的用户图I2的背景替换为纯白色,得到预处理后的图I3。

4.根据权利要求3所述的一种动漫表情包生成方法,其特征是,在步骤(3)中,具体为:将预处理后的图I3送入到Blip语言模型中,该模型将输入图转化成对应的文本描述,得到输入图的文本描述P。

5.根据权利要求4所述的一种动漫表情包生成方法,其特征是,在步骤(4)中,针对不同动漫风格的生成模型训练,具体为:准备N组不同风格的动漫数据集,每组数据集至少包括20张以上的动漫图片,将每张动漫图片输入到步骤(3)中提到的Blip语言模型中,得到对应的动漫文本描述;通过N组动漫数据集训练得到N个动漫风格的模型,以某一动漫风格的模型N1为例,将步骤(2)中的处理图I3和步骤(3)中对应的文本描述P输入到模型N1中,得到用户形象的动漫图X1。

6.根据权利要求5所述的一种动漫表情包生成方法,其特征是,在步骤(5)中,针对制作脸部的表情引导图,具体为:拍摄模特不同表情的真实图片,对这些图片进行人脸关键点及人体姿态点检测,得到表情引导图L,每张表情引导图最多包括68个人脸关键点及18个人体姿态点。

7.根据权利要求6所述的一种动漫表情包生成方法,其特征是,在步骤(6)中,条件控制模型采用Controlnet模型,其主要作用是将步骤(5)中的表情引导图转换成特征向量,然后将特征向量输入到生成模型中,以步骤(4)中的动漫图X1作为用户动漫形象参考图,选取对应的动漫模型N1,选取一张表情引导图L1,将L1输入到条件控制模型中,得到对应的特征向量Y1,Y1由13个4维特征矩阵组成,然后将{X1,Y1}输入到模型N1中,得到一张具有用户形象的动漫表情包图,根据表情包内动漫表情包图的数量对步骤(6)循环执行对应的次数,即可得到一组包含对应次数用户形象的不同动漫表情包组图。

...

【技术特征摘要】

1.一种动漫表情包生成方法,其特征是,具体包括如下步骤:

2.根据权利要求1所述的一种动漫表情包生成方法,其特征是,在步骤(1)中,具体为:获取用户输入图i,主要包含用户自身形象。

3.根据权利要求2所述的一种动漫表情包生成方法,其特征是,在步骤(2)中,具体为:对获取的用户图i进行预处理,主要包括人脸矫正和背景替换两个步骤;(21)准备一个标准的模特图i1,分别对用户图i和模特图i1进行人脸检测,得到对应的人脸五官点位;(22)根据用户图i和模特图i1的人脸五官点位,计算得到仿射变换矩阵m,利用仿射变换矩阵m对用户图i进行放射变换,得到矫正后的用户图i2;(23)用抠像算法将矫正后的用户图i2的背景替换为纯白色,得到预处理后的图i3。

4.根据权利要求3所述的一种动漫表情包生成方法,其特征是,在步骤(3)中,具体为:将预处理后的图i3送入到blip语言模型中,该模型将输入图转化成对应的文本描述,得到输入图的文本描述p。

5.根据权利要求4所述的一种动漫表情包生成方法,其特征是,在步骤(4)中,针对不同动漫风格的生成模型训练,具体为:准备n组不同风格的动漫数据集,每组数据集至少包括20张以上的动漫图片,将每张动漫图片输入到步骤...

【专利技术属性】
技术研发人员:张明琦吴茗韩晟
申请(专利权)人:杭州小影创新科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1