北京通用人工智能研究院专利技术

北京通用人工智能研究院共有217项专利

  • 本发明公开了一种视频理解、模型训练方法、装置、计算机设备及存储介质,在目标视频理解模型的训练过程中,通过二元分类损失数据训练目标视频理解模型预测任意两个图像文本对帧顺序的能力,通过对比损失数据训练目标视频理解模型预测任意两个图像文本对是...
  • 本发明公开了一种视频理解、剧情预测、视频问答方法、装置、设备及介质。通过获取视频文件对应的多个图像文本对,对图像文本对中的图像帧和文本进行特征提取和特征融合,得到图像文本对的融合特征;其次,基于图像文本对的融合特征进行聚类处理,得到视频...
  • 本发明公开了一种样本构建、视频处理、模型训练方法、装置、设备及介质。获取视频文件对应的图像字幕组合,对视频文件进行分割,得到包括至少一个单位分段的视频片段,基于目标单位分段的分段标识生成目标图像字幕组合的层次标记信息,基于视频片段和目标...
  • 本发明涉及一种零样本视频时间定位方法和系统。该方法包括:使用预训练的图像描述生成模型为视频生成自由形式的自然语言查询;基于事件的时序结构,即事件内部与查询的相关性应该高,而事件外部与查询的相关性应该低,选择具有事件内相关性和事件外相关性...
  • 本发明提供多用户协同交互方法及装置,其中,所述多用户协同交互方法,包括:对目标混合现实环境进行监测,所述目标混合现实环境中多个用户通过各自的智能代理和/或用户自身进行交互,所述智能代理为虚拟化身或具身智能体;若监测到所述多个用户中的第一...
  • 本公开提供了一种基于音乐与或图的多模态输入乐谱生成方法和装置,其中该方法包括,选择音乐数据的节点信息,节点信息可以是乐段、乐句、小节或者音符,获取与节点信息对应的音乐属性特征,音乐属性特征可以是旋律、伴奏、和声或者节奏,基于节点信息和与...
  • 本发明实施例提供了一种基于情绪曲线的音乐生成方法及装置。所述方法包括:获取情绪曲线;在给定时间窗口内,统计所述情绪曲线的变化,生成表征情绪激烈程度的情感维度向量;基于所述情感维度向量,在训练好的音乐片段库模型中进行向量匹配,并选择对应的...
  • 本发明提供了一种基于自适应社会结构的多智能体环境运行系统包括:分别获取每一运行智能体对应的智能属性构建不同所述运行智能体对应的互动方式,根据社会结构搭建社会模拟环境模型,在所述社会模拟环境模型中分别分析每一所述互动方式对应的互动资源,在...
  • 本发明的实施例提供一种舞蹈配乐的实时生成方法及装置。所述方法包括:捕获人体动作实时画面,并解析出所述人体动作实时画面中的舞蹈视觉信息和场景信息;对所述舞蹈视觉信息进行人体动作信息提取和面部表情解析,得到人体姿态特征参数,并根据所述人体姿...
  • 本申请公开了一种智能体的抓握控制方法和装置,属于智能体领域。智能体的抓握控制方法,包括:基于目标速度控制智能体的执行机构关节运动;目标速度包括速度大小和转动方向;在检测到智能体的执行机构与目标对象的碰撞状态相较于上一图像帧发生变化的情况...
  • 本发明提供了一种多条件语句向量化语义表示方法及系统;设置基于Transformer的句子编码器F作为框架主干,获取设定条件C的嵌入;在句子编码器F最后一层提取公共语言规范词令牌的查询向量,将待识别句子S输入到同一句子编码器F中;选择句子...
  • 本申请涉及了一种数据处理方法、训练方法、信息处理方法和电子设备。该数据处理方法包括:获得包括文字的图像,并且获得针对文字的图像的结构特征;获得文字的部首,并且获得部首的部首特征;相关联地存储结构特征和/或部首特征以及文字,得到训练数据,...
  • 本发明涉及一种视频时间定位方法和系统。该方法包括:利用自然语言处理工具,从带标注的查询语句中提取短语;对查询语句及短语分别提取句子特征和短语特征,对视频提取候选时间框特征;计算候选时间框特征与句子特征、短语特征的相似度,获得视觉‑句子匹...
  • 本发明提供一种元宇宙体系下物理世界中的任务处理方法及装置,应用于所述元宇宙体系,元宇宙体系涉及物理世界和虚拟世界,所述方法包括:确定虚拟世界中的虚拟智能体的虚拟心智,其中,虚拟心智包括虚拟智能体学习到虚拟世界中虚拟化身在预设场景下的第一...
  • 本发明提出一种微服务调用异常检测方法、装置和电子设备,方法包括:获取第一时刻下时序指标数据对应的第一检测指标和第二时刻下时序指标数据对应的第二检测指标;根据第一检测指标和第二检测指标确定第一异常服务请求和第一异常服务请求对应的第一异常指...
  • 本发明提出一种时序指标异常检测方法及装置、控制器和电子设备,方法包括:获取第一预设时间段内的第一时序指标数据和第二预设时间内的第二时序指标数据;对第一时序指标数据进行一级异常判定,输出第一时序异常指标数据;对第一时序异常指标数据和第二时...
  • 本技术的实施例提供一种球形触觉探测器,包括:球形组件,球形组件包括透明柔性层,透明柔性层形成为球形结构,具有容纳腔,透明柔性层的外表面设有有色标记点阵,在透明柔性层的外表面上涂覆有反射层;固定架,固定架设于容纳腔;以及M个摄像头,M个摄...
  • 本发明公开了一种部分观测下多标签分类的系统、方法及电子设备,该系统包括:获取模块,用于获取部分观测下多标签数据集;构建模块,用于基于强化学习构建分类模型;分类模块,用于通过分类模型对部分观测下多标签数据集中的数据进行标签分类。本发明可以...
  • 本技术提供一种触觉探测器,包括:透明柔性环,透明柔性环为中空的环状结构,透明柔性环的外表面设有有色标记点阵,在透明柔性环的外环面上涂覆有反射层;光源,在透明柔性环的轴向方向上,光源设于透明柔性环的至少一端;以及M个摄像头,M个摄像头沿透...
  • 本申请的实施例提供一种基于分布式架构的数据管道的构建方法及装置、实时数据流的处理方法及装置、介质、设备,分布式架构包括中控组件和m个服务器单元,数据管道的构建方法包括:根据用户需求,确定数据处理的待应用拓扑图信息,其中,待应用拓扑图信息...