计算机模拟中的语音驱动制造技术

技术编号:39814767 阅读:6 留言:0更新日期:2023-12-22 19:32
根据自然语言描述生成由一个或多个对象组成的

【技术实现步骤摘要】
【国外来华专利技术】计算机模拟中的语音驱动3D静态资产创建


[0001]本申请涉及必须植根于计算机技术并且产生具体技术改进的技术上创新的非常规解决方案


技术介绍

[0002]如本文所理解的,诸如常见背景对象之类的常用计算机游戏资产被用来增加计算机游戏的视觉吸引力


技术实现思路

[0003]目前的原理允许内容创建者以自然语言输入的方式描述他们想要的资产,并且从所述
(
语音
)
输入创建
2D

3D
资产

还有助于为艺术家创建初始原型资产以进行迭代

[0004]因此,一种方法包括接收诸如来自语音转换的文本,以及使用至少一个神经网络处理所述文本以渲染计算机模拟资产的二维
(2D)
图像

所述方法还包括将所述
2D
图像转换为三维
(3D)
资产

所述方法包括在至少一个计算机模拟中呈现所述
3D
资产

[0005]所述文本可从键盘输入或从语音输入并且可指示至少一个位置,并且所述
3D
资产与所述位置一致

所述文本
/
语音可指示至少多个对象,并且所述
3D
资产与所述多个对象一致

所述方法可包括在呈现所述
3D
资产之前使用艺术家计算机修改所述
3D
资产<br/>。
可使用麦克风来将所述
3D
资产的修改输入到艺术家计算机

[0006]在另一个方面中,一种装置包括至少一个计算机存储器,所述至少一个计算机存储器不是瞬时信号并且继而包括可由至少一个处理器执行以接收二维
(2D)
图像的相片的指令

所述指令可执行以将所述
2D
图像转换为
3D
资产,并且在至少一个计算机模拟中呈现所述
3D
资产

[0007]在另一个方面中,一种设备包括至少一个处理器和被配置为由所述处理器控制的至少一个计算机输出装置

所述处理器用指令编程以识别二维
(2D)
图像

将所述
2D
图像转换为
3D
资产,以及使用所述
3D
资产作为计算机模拟中的对象

[0008]本申请的关于其结构和操作两者的细节可参考附图得到最好的理解,在附图中相同的附图标记指代相同的部分,并且在附图中:
附图说明
[0009]图1是包括根据本专利技术原理的示例的示例系统的框图;
[0010]图2示出了提示人输入语音以用于计算机模拟资产的文本识别的示例屏幕截图;
[0011]图3以示例流程图格式示出了用于将语音转换为文本再转换为
3D
资产的示例逻辑;
[0012]图4示出了提示人输入图像以生成计算机模拟资产的示例屏幕截图;
[0013]图5以示例流程图格式示出了用于将图像转换为
3D
资产的示例逻辑;
[0014]图6以示例流程图格式示出了用于将来自语言的文本转换为
3D
资产的位置和部分
的示例逻辑;
[0015]图7示出了与图6相关的示例屏幕截图;
[0016]图8示出了与图6相关的示例屏幕截图;
[0017]图9示出了与图6相关的用于修改资产的一部分的示例屏幕截图;
[0018]图
10
以示例流程图格式示出了用于修改资产的一部分的示例逻辑;
[0019]图
11
以示例流程图格式示出了用于
3D
资产与物理引擎之间的闭环处理的示例逻辑;
[0020]图
12
示出了用于
2D

3D
资产生成的技术的概述;
[0021]图
13
示出了用于受控特征变换的技术;
[0022]图
14
示出了
2D

3D
重建方法;以及
[0023]图
15
示出了用于在无
2D
输入的情况下生成
3D
资产的技术

具体实施方式
[0024]本公开总体上涉及计算机生态系统,所述计算机生态系统包括消费型电子
(CE)
装置网络的各方面,诸如但不限于计算机游戏网络

本文中的系统可包括服务器部件和客户端部件,其可通过网络连接,使得可在客户端部件与服务器部件之间交换数据

客户端部件可包括一个或多个计算装置,所述计算装置包括游戏控制台
(
诸如
Sony 或由微软
(Microsoft)
或任天堂
(Nintendo)
或其他制造商制作的游戏控制台
)、
虚拟现实
(VR)
头戴式耳机

增强现实
(AR)
头戴式耳机

便携式电视机
(
例如,智能
TV、
支持因特网的
TV)、
便携式计算机
(
诸如膝上型计算机和平板计算机
)
以及其他移动装置
(
包括智能电话和下文讨论的额外示例
)。
这些客户端装置可在多种操作环境中操作

例如,一些客户端计算机可采用例如
Linux
操作系统

来自微软的操作系统


Unix
操作系统

或由苹果公司
(Apple,Inc.)
或谷歌
(Google)
生产的操作系统

可使用这些操作环境来执行一个或多个浏览程序,诸如由微软或谷歌或摩斯拉
(Mozilla)
制作的浏览器或可访问由下文讨论的因特网服务器托管的网站的其他浏览器程序

此外,可使用根据本专利技术原理的操作环境来执行一个或多个计算机游戏程序

[0025]服务器和
/
或网关可包括一个或多个处理器,所述一个或多个处理器执行将服务器配置为通过诸如因特网的网络来接收和传输数据的指令

或者,客户端和服务器可通过本地内联网或虚拟专用网络连接

服务器或控制器可由游戏控制台
(
诸如
Sony )、
个人计算机等实例化

[0026]可通过网络在客户端与服务器之间交换信息
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.
一种方法,所述方法包括:接收文本;使用至少一个神经网络处理所述文本以渲染计算机模拟资产的二维
(2D)
图像;将所述
2D
图像转换为三维
(3D)
资产;以及在至少一个计算机模拟中呈现所述
3D
资产
。2.
如权利要求1所述的方法,其中所述文本是从语音转换接收
。3.
如权利要求1所述的方法,所述方法包括至少部分地基于所述文本将音频与所述
3D
资产相关联
。4.
如权利要求2所述的方法,其中所述语音转换指示至少一个位置,并且所述
3D
资产与所述位置一致
。5.
如权利要求2所述的方法,其中所述语音转换指示至少多个对象,并且所述
3D
资产与所述多个对象一致
。6.
如权利要求1所述的方法,所述方法包括在呈现所述
3D
资产之前使用艺术家计算机修改所述
3D
资产
。7.
如权利要求6所述的方法,所述方法包括使用麦克风来将所述
3D
资产的修改输入到所述艺术家计算机
。8.
一种装置,所述装置包括:至少一个计算机存储器,所述至少一个计算机存储器不是瞬时信号并且包括可由至少一个处理器执行以进行以下操作的指令:接收二维
(2D)
图像的相片;将所述
2D
图像转换为
3D
资产;以及在至少一个计算机模拟中呈现所述
3D
资产
。9.
如权利要求8所述的装置,其中所述指令可执行以至少部分地基于所述文本将音频与所述
3D
资产相关联
。10.
如权利要求8所述的装置,其中所述指令可执行以接收指示至少一个位置的语音,并且所述
3D
资产与所述位置一致
。11.
如权利要求8所述的装置,其中所述指令可执行以接收指示至少多个对象的语音,并且所述
3D
资产与所述多个对象一致
。12.
如权利要求8所述的装置,其中所述指令可执行以在呈现所述
3D
资产之前使用艺术家计算机修改所述
3D
资产
。13....

【专利技术属性】
技术研发人员:S
申请(专利权)人:索尼互动娱乐股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1