谷歌有限责任公司专利技术

谷歌有限责任公司共有6604项专利

  • 确定用于对块进行编码的模式决策的卷积神经网络包括特征提取层和多个分类器。非重叠卷积运算通过设置等于内核大小的步幅值来在特征提取层处执行。所述块具有N×N大小,并且所述块的最小分割输出具有S×S大小。每个分类器的分类层接收具有特征尺寸的特...
  • 本公开针对至少部分地基于影像来确定地理方位。具体地,本公开的方法和系统可以:接收由相机(118)生成并表示包括物理真实世界环境的至少一部分的影像的数据,该物理真实世界环境包括相机(118)和行进路线(312);以及至少部分地基于数据和机...
  • 本发明涉及用于机器人抓取的深度机器学习方法和装置。一些实施方式涉及训练语义抓取模型以预测指示机器人的末端执行器的运动数据是否将导致对物体的成功抓取的量度;并且预测指示所述物体是否具有期望的语义特征的附加量度。一些实施方式涉及利用经训练的...
  • 本公开涉及用于神经网络的计算高效富于表达的输出层。包括在计算机存储介质上编码的计算机程序的方法、系统和设备,用于将计算高效富于表达的输出层并入在神经网络中。所述输出层被配置成通过根据隐藏状态生成针对多个门中的每一个的相应的上下文嵌入来将...
  • 描述了实现能够执行对称多普勒干扰减轻的基于智能设备的雷达系统的技术和装置。该雷达系统采用对称多普勒干扰减轻技术以对由雷达系统的振动或其他对象的振动引起的干扰伪像(706)进行滤波。该滤波操作将干扰伪像(706)合并入噪声基底中,而没有显...
  • 提供了用于在多个设备上同步媒体内容回放的方法、系统和介质。在一些实施例中,该方法包括:在服务器处,从第一用户设备接收呈现媒体内容项的第一请求和从第二用户设备接收呈现媒体内容项的第二请求;从服务器向第一用户设备和第二用户设备传输与媒体内容...
  • 视频代码化可以包括:通过对来自输入比特流的当前帧进行编码来生成编码帧;生成在时空上与当前帧相对应的参考共帧;以及使用参考共帧来对当前帧进行编码。当前帧是来自输入帧序列的帧,来自输入帧序列的每个帧在输入帧序列中具有相应的顺序位置,并且当前...
  • 图像质量在压缩期间的损失是使用质量控制度量序列控制的。质量控制度量序列基于误差级定义来被选择以量化图像的区域内的变换系数。然后,候选比特成本是通过根据误差级定义或修改误差级和质量控制度量序列量化变换系数来确定的。在由使用修改误差级而的候...
  • 一种方法生成跨不同设备一致的压缩视频。该方法包括识别输出比特率。该方法还包括解析输入视频的参数。该方法还包括基于输入视频的参数来生成具有固定持续时间的空白视频。该方法还包括基于将空白视频作为输入提供给解码器来生成代表性视频。该方法还包括...
  • 一些实施方式可以包括用于识别静态视频的计算机实现的方法和/或系统。一种方法可以包括从输入视频的一个或多个视频帧中获得输入视频帧,其中在接收到快门按下指示之前和在接收到快门按下指示之后获取视频帧。该方法还包括下采样,平滑,计算时间梯度,估...
  • 在一种用于有效地引导车辆的驾驶员通过交叉路口的方法中,关于位于一个或多个交叉路口处的一个或多个交通灯的状态的信息由与所述驾驶员或车辆相关联的计算设备或系统接收,并且当所述车辆接近所述(一个或多个)交叉路口时监视所述车辆的当前速度。基于所...
  • 用于确定神经网络架构的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。其中一种方法包括获得用于密集图像预测任务的训练数据;以及确定被配置为执行密集图像预测任务的神经网络的架构,包括:使用训练数据搜索候选架构的空间以识别一个或多...
  • 方法、系统和设备包括编码在计算机存储介质上的计算机程序,用于跨计算装置分布张量计算。所述方法中的一种方法包括:接收指定张量计算在多个计算装置之中的分布的规范数据,其中,每个张量计算(i)被定义为接收分别具有一个或多个相应输入维度的一个或...
  • 在视频解码器内引入用于滤波和机器学习的分离通路。第一通路对重构帧的第一副本进行滤波以产生滤波帧,所述滤波帧被包括在输出视频流中以供显示。第二通路使用学习模型处理所述重构帧的第二副本,诸如用于训练和/或推理。所述第一通路和所述第二通路是在...
  • 提供了用于分析球形视频内容的方法、系统和介质。更具体地,提供了用于检测滥用球形视频内容中放置在球体上的二维视频的方法、系统和介质。在一些实施例中,该方法包括:接收球形视频内容项的标识符,其中球形视频内容项具有多个视图;以及选择球形视频内...
  • 训练机器学习预测器模型以从未染色或用H&E染色的输入图像中生成用特殊染色剂(诸如IHC染色剂)染色的组织样品的显现的预测。训练数据采用成千上万精确对齐的图像对的形式,所述图像对中的一个是用H&E染色或未染色的组织样本的图...
  • 描述了与利用自动助理的先前场境检索有关的技术。在各种实施方式中,在用户和自动助理之间的人机对话会话期间从用户接收的自由形式的自然语言输入的实例可以用于生成第一对话场境。第一对话场境可以包括意图和与该意图相关联的插槽值。可以用附加输入来执...
  • 本文描述了使能在电子设备中实现的智能手机、系统和方法的技术和系统。所述技术和系统使用雷达场来准确地确定用户相对于诸如智能手机等电子设备的位置和身体定向。所述雷达场还使所述设备能够从所述用户接收3D手势,以与所述设备交互。所述技术允许所述...
  • 本文公开了一种方法和系统,所述方法包括:由媒体服务器的处理器从用户装置接收对关于要向用户显示的第一媒体项目的附加媒体项目的请求;从所述请求确定所述第一媒体项目被显示或可被显示在替代回放装置上;响应于确定所述第一媒体项目被显示或可被显示在...
  • 本公开涉及基于媒体消费来识别由计算设备的用户执行的身体活动。一种方法包括:基于运动传感器接收到的传感器数据,识别计算系统的用户在一时间段期间执行的身体活动;以及确定用户是否在用户执行身体活动的时间段期间消费了媒体。该方法还包括响应于确定...