阿里巴巴达摩院杭州科技有限公司专利技术

阿里巴巴达摩院杭州科技有限公司共有620项专利

  • 本申请公开了一种图像生成方法、装置、存储介质及电子设备。其中,该方法包括:获取主体图像和背景图像,其中,主体图像用于为待生成的目标图像提供图像主体内容,背景图像用于为目标图像提供图像背景内容;对背景图像进行背景解析,得到解析结果;对背景...
  • 本说明书实施例提供文本生成方法和对话文本生成方法,其中所述文本生成方法包括:获取实体对象的对象数据,并将对象数据转换为对应的图数据,其中,图数据包括节点和节点之间的边;将图数据输入文本生成模型的嵌入层,将图数据转换为对应的图嵌入序列,基...
  • 本申请实施例提供了一种区域检测及视觉感知模型训练方法、电子设备及计算机存储介质,其中,区域检测方法包括:对自动驾驶设备采集的二维环境图像进行可行驶区域的边界点更新检测,获得边界点更新检测的结果;根据边界点更新检测的结果,确定边界变化异常...
  • 本说明书实施例提供问答方法以及问答模型训练方法,其中所述问答方法包括:获取待答复的问题信息;将所述问题信息输入问答模型,获得所述问题信息对应的答复信息;其中,所述问答模型基于预测答复信息训练获得,所述预测答复信息为利用预训练问答模型对问...
  • 本申请公开了一种神经辐射场处理方法、装置及电子设备。其中,该方法包括:获取预训练神经辐射场;获取风格图像,其中,风格图像具有预定风格;在预训练神经辐射场上构建初始变型模块,得到初始神经辐射场;基于风格图像,对初始神经辐射场进行训练,得到...
  • 本申请公开了一种三维物体的处理方法、系统、电子设备及存储介质。其中,该方法包括:捕获对三维物体进行观测的观测视角,其中,三维物体用于表征与真实环境中的真实物体对应的虚拟物体;从三维物体对应的隐式表征模型上,确定观测视角对应的目标模型;基...
  • 本申请公开了一种虚拟服饰适配方法。其中,该方法包括:响应于图像采集指令,在交互界面上显示第一图像以及基于第一图像预估得到的第一位姿;响应于对象模型显示指令,在交互界面上显示目标部位在三维空间中初始位姿下的初始三维模型;响应于服饰选择指令...
  • 本申请公开了一种图像处理方法、计算机可读存储介质及电子设备。其中,该方法包括:获取原始图像,其中,原始图像包括对象;根据原始图像,预测对象在三维空间中的第一位置姿态;确定对象的第一位置姿态对应的原始三维模型,其中,原始三维模型包括与对象...
  • 本申请实施例公开了一种说话人转换点的检测方法、训练检测模型的方法及装置,涉及人工智能和语音处理技术。其中方法包括:将待检测音频切分成两个以上的预设时长的音频段;依据从各音频段中提取的声纹特征对两个以上的音频段进行聚类处理,得到两个以上的...
  • 本申请提出一种模型剪枝方法、装置、设备、存储介质及程序产品,该模型剪枝方法包括:为待剪枝模型的各处理层分别构建早退分支,处理层对应的早退分支用作处理层计算的数据提前退出待剪枝模型的通道;将预设数据集输入构建早退分支的待剪枝模型,得到模型...
  • 本申请公开了一种虚拟对象表面材质的生成方法和电子设备。其中,该方法包括:获取对多个真实环境中的实体对象进行拍摄得到的图像集合,其中,图像集合至少包括:第一图像和第二图像,第一图像是对环境光照环境中的实体对象进行拍摄得到的图像,第二图像是...
  • 本申请公开了一种虚拟对象的生成方法、三维姿态的处理方法及电子设备。其中,该方法包括:获取真实场景中的实体对象在多个视角下的二维姿态图,其中,二维姿态图用于表征实体对象上的关节点在多个视角下的位置信息;基于多个视角下的二维姿态图,预测得到...
  • 本申请实施例提供了一种视觉处理加速器及其加速方法、芯片、计算设备,其中,视觉处理加速器与处理器核合封于通用计算芯片中,且挂载于所述通用计算芯片的总线上;所述视觉处理加速器通过所述总线与所述处理器核交互,以根据所述处理器核的指令,对图像的...
  • 本申请公开了一种生成三维虚拟场景的方法、装置、存储介质及系统。其中,该方法包括:对场景描述信息和待参考图像进行场景解析,得到外围结构信息,其中,场景描述信息用于确定在三维虚拟场景中划分得到的多个区域,待参考图像用于提供纹理参考信息,外围...
  • 本申请实施例提供了一种仿真测试数据处理方法、电子设备及计算机存储介质,其中,仿真测试数据处理方法包括:通过交互界面展示用于生成自动驾驶的场景测试用例的交通场景控件,其中,所述交通场景控件包括以下至少之一:用于指示多种交通行为的组合方式的...
  • 本申请公开了一种虚拟物体的生成方法、电子设备和计算机可读存储介质。其中,该方法包括:捕获处于物理环境中的目标对象在不同视角下的实体图像,其中,目标对象为覆盖在实体物体表面的物体信息;基于目标对象的类别,确定虚拟物体的基准网格和基准纹理,...
  • 本申请实施例提供了一种测试场景生成方法、电子设备及计算机存储介质,其中,测试场景生成方法包括:获取用于生成自动驾驶仿真测试场景的空间约束描述信息,所述空间约束描述信息用于描述待测试的仿真自动驾驶设备和障碍物在仿真测试场景中的行驶约束条件...
  • 本申请公开了一种虚拟对象的材质生成方法、电子设备和存储介质。其中,该方法包括:获取虚拟对象和描述文本,其中,虚拟对象为在虚拟环境中创建的与实体对象关联的对象,描述文本用于表征对虚拟对象的材质进行描述的文本;基于描述文本,生成虚拟对象对应...
  • 本申请公开了一种虚拟对象的纹理生成方法、电子设备以及存储介质。其中,该方法包括:读取在虚拟场景中预先构建的虚拟对象;捕获用于表述覆盖在虚拟对象表面的纹理的描述信息;基于描述信息对虚拟对象表面的纹理进行无监督学习,得到虚拟对象对应的目标纹...
  • 本申请公开了一种三维虚拟场景中布局容器组件的方法、存储介质及系统。其中,该方法包括:获取场景配置信息和待布局对象的属性信息,其中,待布局对象用于确定三维虚拟场景内待放置的容器组件,属性信息用于确定容器组件的布局约束;基于场景配置信息确定...