亚马逊技术股份有限公司专利技术

亚马逊技术股份有限公司共有381项专利

  • 计算资源服务提供商可以在多租户环境中向客户提供计算资源。这些计算资源可以在防火墙或其他安全装置之后,使得某些信息不会到达提供给所述客户的所述计算资源。日志记录实体可以在由所述计算资源服务提供商操作的计算机服务器上实现。所述日志记录实体可...
  • 本文公开了用于加速如神经网络等应用中的卷积运算或其它矩阵乘法的技术。一种计算机实施的方法包含从存储装置接收用于卷积运算的低精度输入以及从所述低精度输入中减去表示高精度零值的低精度值以生成差值,其中所述低精度输入是从高精度输入非对称量化的...
  • 本文公开了用于针对多个上下文执行多层神经网络处理的技术。在一个实施例中,计算引擎被设置成第一配置以实施神经网络的第二层并且处理与第一上下文有关的第一数据以生成第一上下文第二层输出。所述计算引擎可以从所述第一配置切换到第二配置以实施所述神...
  • 本申请涉及联合密钥管理。一种系统使用结合请求提交的信息来确定是否和如何处理所述请求。所述信息可由请求者使用密钥电子地签名,使得处理所述请求的所述系统可验证所述请求者具有所述密钥且所述信息是真实的。所述信息可包括识别用于处理所述请求所需的...
  • 描述了用于最近邻搜索服务的技术,所述最近邻搜索服务使得用户能够执行最近邻搜索。所述最近邻搜索服务包括接口,所述接口使得用户能够创建可搜索矢量的集合,向集合添加和更新矢量,从集合中删除矢量,以及对给定矢量执行针对最近邻的搜索。所述最近邻搜...
  • 描述了用于提供和服务于诸如算法、数据、模型、流水线和/或笔记本的所列存储库项目的技术。在一些示例中,web服务提供商:接收来自请求者的对于所列存储库项目的请求,所述请求至少指示所述存储库项目的类别,并且存储库项目的每个列表包括对所列存储...
  • 用于在客户端装置与一个或多个远程计算资源之间创建持久连接的技术,其可形成网络可访问计算平台的一部分。这种连接可被认为是“永久的”或“几乎永久的”以允许客户端装置在几乎任何时间同时发送数据到远程资源并且从所述远程资源接收数据。此外,客户端...
  • 一种计算机实施的方法包含在声控装置的麦克风处接收来自用户的语音输入,以及由所述声控装置确定耦接到所述声控装置的AV显示装置的电源状态处于打开或关闭状态。基于从所述语音输入和所述AV显示器的所述电源状态确定的用户意图,所述声控装置将数据发...
  • 本公开描述了用于使用边缘装置和非边缘装置中的一个来生成和执行机器学习(ML)模型的执行计划的技术。在一些示例中,对生成所述执行计划的请求包括对于所述ML模型的所述执行的至少一个目标,并且所述执行计划至少部分地基于比较性执行信息和网络延迟...
  • 公开了用于计算设备的语音控制的系统和方法。可以通过具有显示器的设备来下载和/或访问应用,并且可以显示与所述应用相关联的内容。许多应用不允许使用语音命令来与所述显示内容进行交互。本文描述的改进允许非语音启动的应用通过确定所述设备显示的屏幕...
  • 一种脉动阵列的处理元件(PE)可以使用相同权重对输入数据集的两个或更多个顺序数据元素并行执行神经网络计算。因此,可以并行生成与输出数据集相对应的两个或更多个输出数据元素。基于所述输入数据集的大小和输入数据类型,所述脉动阵列可以并行处理单...
  • 描述了使用利用容器的评分算法来进行灵活的机器学习推断的技术。在一些实施方案中,接收到代表用户在服务提供商网络内托管机器学习(ML)模型的请求,所述请求识别端点以使用所述ML模型执行评分。端点基于容器镜像被初始化为在虚拟机上运行的容器,并...
  • 描述了用于机器学习(ML)模型的基于动态准确度的试验和部署的技术。分析流向ML模型的推理业务和所述模型的准确度并使用其以经由模型选择来确保更频繁地执行表现更好的模型。预测部件可以评估哪个模型对于某些输入数据元素来说更可能准确。集成技术可...
  • 提供用于神经网络处理的系统、方法和集成电路。在各种实施方案中,用于神经网络处理的集成电路可包含存储用于神经网络的权重值的多个存储器组。所述存储器组可与处理引擎的阵列在同一芯片上。在接收输入数据后,所述电路可被配置成使用一组权重值来执行针...
  • 描述了用于进行自动语音识别(ASR)的技术。用户可以将音频文件上传到存储位置。然后,所述用户向所述ASR服务提供对所述音频文件的引用。ASR引擎通过以下方式分析音频文件:使用声学模型将音频数据划分为单词,并且使用语言模型识别所述音频文件...
  • 描述了用于自动缩放托管的机器学习模型以进行产生式推断的技术。可以在托管环境中部署机器学习模型,使得支持所述机器学习模型的基础设施根据需求进行动态缩放,以致不会影响性能。可以使用反应性技术或预测性技术对所述模型进行自动缩放。
  • 描述了用于基于请求分析存储的视频的技术。例如,描述了一种接收分析存储的视频的第一应用程序编程接口(API)请求的方法,所述API请求包括所述存储的视频的位置和要对所述存储的视频执行的至少一个分析动作;访问所述存储的视频的所述位置以检索所...
  • 本技术的实施方案可以提供在SoC(102)上的不同的计算子系统间对各种计算资源的细粒动态划分的灵活性。多个处理核心(206)、高速缓存层级结构(212)、存储器控制器(208)和I/O资源(210)可以在所述SoC上的网络计算子系统(1...
  • 本公开部分描述了基于上下文的设备仲裁技术,以从多个语音使能设备中选择一个语音使能设备,为包括在用户语音发声中的命令提供响应。在一些示例中,所述上下文驱动的仲裁技术可包括确定语音使能设备的排序表,所述语音使能设备的排序是基于各语音使能设备...
  • 一种计算机系统实施管理程序,所述管理程序则实施一个或多个计算机系统实例和控制器。所述控制器和计算机系统实例共享存储器。使用所述计算机系统实例和所述控制器两者的设备来处理请求。作为请求处理的一部分,信息经由共享存储器而在所述计算机系统实例...