【技术实现步骤摘要】
人体手部图像的生成方法、装置、设备和存储介质
[0001]本申请一个或多个实施例涉及计算机应用
,尤其涉及一种人体手部图像的生成方法
、
装置
、
设备和存储介质
。
技术介绍
[0002]现如今,
AI(Artificial Intelligence
,人工智能
)
作画越来越流行
。AI
作画可以根据用户输入的描述文本输出相应的图像
。
例如,对外提供
AI
作画功能的应用程序可以面向用户输出用户界面,使用户可以通过该用户界面输入描述文本,假设该描述文本为“一个人拿着一个杯子”,则该应用程序可以通过该用户界面输出包含一个人体和一个杯子的图像,并且在该图像中,这个人体的胳膊和手部所处的姿态是拿着这个杯子
。
[0003]然而,目前的
AI
作画中经常会出现输出图像包含的人体手部不合理的问题,从而导致输出图像对于用户而言是不可用的,影响用户在使用
AI
作画时的体验
。
人体手部不合理的问题通常包括:人体手部多手指或少手指
(
即单手手指的数量不为
5)
,或者人体手部所处的姿态不符合常理
(
例如:手指向手背弯折的角度达到
90
度
、
两根手指张开的夹角达到
180
度等
)
,等等
。
因此,对于< ...
【技术保护点】
【技术特征摘要】
1.
一种人体手部图像的生成方法,所述方法包括:获取与人体手部样本对应的二维手部图像,并将所述二维手部图像输入三维重建模型,以使所述三维重建模型基于所述二维手部图像重建出三维手部图形;将所述三维手部图形投影至预设的二维平面,以将所述三维手部图形转化为二维图像;获取用于生成人体手部图像的噪声图像,并将所述二维图像和所述噪声图像输入生成模型,以使所述生成模型基于所述噪声图像,生成与所述二维图像匹配的人体手部图像
。2.
根据权利要求1所述的方法,所述三维重建模型包括基于神经网络构建的参数化模型;所述将所述二维手部图像输入三维重建模型,以使所述三维重建模型基于所述二维手部图像重建出三维手部图形,包括:将所述二维手部图像输入所述基于神经网络构建的参数化模型,以使所述基于神经网络构建的参数化模型将所述二维手部图像转化为三维手部参数,并基于所述三维手部参数生成三维手部图形
。3.
根据权利要求2所述的方法,所述参数化模型包括
MANO
模型
。4.
根据权利要求1所述的方法,所述生成模型包括基于
Control Net
构建的扩散模型
。5.
根据权利要求4所述的方法,所述扩散模型包括
Stable Diffusion
模型
。6.
根据权利要求4所述的方法,所述
Control Net
支持的输入通道的数量,基于由所述三维手部图形转化得到的二维图像的数量进行了扩展;所述将所述二维图像和所述噪声图像输入生成模型,以使所述生成模型基于所述噪声图像,生成与所述二维图像匹配的人体手部图像,包括:针对由所述三维手部图形转化得到的二维图像进行拼接处理;将拼接后的所述二维图像和所述噪声图像输入所述基于
Control Net
构建的扩散模型,以使所述基于
Control Net
构建的扩散模型基于所述噪声图像,生成与所述二维图像匹配的人体手部图像
。7.
根据权利要求1所述的方法,所述三维手部图形包含预设的若干人体手部关键点;所述二维图像包括...
【专利技术属性】
技术研发人员:陈豪,
申请(专利权)人:蚂蚁区块链科技上海有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。