中电信人工智能科技北京有限公司专利技术

中电信人工智能科技北京有限公司共有525项专利

  • 本发明实施例提供了一种行人重识别模型的训练方法、装置、电子设备及存储介质,涉及大数据技术领域,所述方法包括:获取无标注的行人数据集以及所述行人数据集对应的摄像机类别;对所述行人数据集进行至少一种图像变换操作,并对变换后的行人数据集进行特...
  • 本发明实施例提供了一种视频流的播放方法、装置、电子设备及存储介质,涉及桌面应用技术领域,所述方法包括:通过浏览器端响应于视频播放指令,确定对应的视频播放请求,将视频播放请求通过websocket通信连接传输至桌面端;通过桌面端响应于视频...
  • 本发明公开了一种代码数据的填充方法、装置、处理器和可读存储介质。其中,该方法包括:获取待填充的初始代码数据;确定初始代码数据的代码语境数据,其中,代码语境数据用于指示初始代码数据在运行过程中的功能、操作和语义结构;基于代码语境数据,生成...
  • 本发明提供了一种知识图谱点边关系数据的管理方法、装置、设备和介质,该方法包括:构建目标映射表,目标映射表保存有被删除的点边关系数据的标识,以及被删除的点边关系数据对应的压缩包存储路径;确定待删除的目标点边关系数据,并对目标点边关系数据进...
  • 本发明提供了一种基于改进变分模态分解的音频信号去噪方法和相关产品,该方法包括:获取目标输入音频信号,并利用引入局部最优解跳出机制的改进粒子群优化算法和模糊熵搜索变分模态分解的目标分量个数和目标惩罚因子;根据目标分量个数和目标惩罚因子,对...
  • 本发明实施例提供了一种声学模型的生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,所述方法包括:获取训练数据,包括文本内容、文本内容对应的音频对儿数据、文本内容对应的文本韵律特征以及音频对儿数据对应的声学特征,声学模型包括二级韵...
  • 本发明公开了一种视频直播数据的输出方法、装置、处理器和存储介质。其中,该方法包括:获取待输出的视频直播数据流;将视频直播数据流切分为多个视频直播数据片段;分别确定多个视频直播数据片段中的起始帧数据,其中,起始帧数据用于指示从视频直播数据...
  • 本申请实施例提供了一种图像修复方法和装置、电子设备及存储介质,属于计算机视觉技术领域。该方法包括:获取待修复图像的目标检测框和重绘掩码;根据目标检测框裁剪待修复图像得到局部图像;根据局部图像生成引导向量;将引导向量与重绘掩码输入扩散模型...
  • 本申请实施例提供了一种文件处理方法、装置、设备和存储介质,获取待处理文件;解析待处理文件,得到文件数据;对文件数据进行行校验与列校验,得到检验后的文件数据;检验后的文件数据具有预设批量处理数据量;按照预设批量处理数据量,根据检验后的文件...
  • 本发明实施例提供了一种应用于政务平台的视觉处理系统、方法、设备及介质,涉及计算机技术领域。该系统包括:获取模块,用于获取第一图像集、第一模型和第二模型,第一模型为视觉大模型,第二模型的参数量、网络结构复杂性均小于第一模型;监督模块,用于...
  • 本发明实施例提供了一种语音情感的识别方法、装置、电子设备及存储介质,涉及数据处理技术领域,所述方法包括:获取目标语音数据,以及用于语音情感识别的情感识别模型,情感识别模型至少包括特征提取模型、特征降维模型以及分类器;将目标语音数据输入特...
  • 本申请提供一种全局掩模迭代剪枝方法、装置、设备和存储介质,属于深度学习的技术领域。所述方法包括:构建目标损失函数,所述目标损失函数中包括任务损失、剪枝损失和硬件资源损失;在任一次迭代训练过程中,根据全局掩模矩阵确定目标模型在本次迭代过程...
  • 本申请公开了基于多模态特征的伪造视频判别方法、装置、设备及介质,涉及人工智能技术领域,方法包括:从视频中提取得到画面帧和音频;从画面帧中识别得到目标,进而确定目标的画面特征;识别音频的音频特征;根据画面特征和音频特征动态输出画面帧与音频...
  • 本申请公开了一种多模态数据的标签管理方法、装置、设备及存储介质,涉及人工智能技术领域,方法包括:获取多模态数据,对多模态数据进行标准化处理;根据用户需求和多模态数据的应用场景构建分层分域标签体系;从标准化处理后的多模态数据中提取对应的单...
  • 本发明实施例提供了一种人脸图像识别方法、装置、电子设备和存储介质,包括:获取待识别人脸图像;对所述待识别人脸图像进行映射,生成人脸图像令牌向量序列;将所述人脸图像令牌向量序列与预设属性令牌特征向量序列进行交叉注意力处理,生成人脸特征序列...
  • 本申请实施例提供了一种视频画面拼接方法、装置、设备和存储介质,获取摄像机拍摄的待拼接的视频画面;从待拼接的视频画面中识别图像特征点;根据图像特征点,匹配图像特征点对应的空间特征点;筛选图像特征点与空间特征点组成的特征点对,得到目标特征点...
  • 本申请公开了基于多级投机采样的大语言模型推理方法、装置及设备,涉及人工智能技术领域,方法包括:若与输入文本匹配的第一草稿经过修改,则将第一草稿输入到生成第一草稿的目标层级草稿模型;利用第一草稿当前所处层级的草稿模型根据第一草稿生成第二草...
  • 本发明实施例提供了一种图片的检索方法及装置、电子设备、存储介质,包括:响应于图片检索请求,获取图片检索请求对应的检索文本,确定检索文本的多个同义文本以及多个子文本,将多个同义文本以及检索文本与预置的多个第一图片的第一特征数据进行比对,得...
  • 本发明实施例提供了一种中文通顺度检测方法、装置、电子设备及可读介质。所述方法包括:获取待检测文本;将待检测文本输入预设的中文通顺度检测模型中;中文通顺度检测模型包括双向表示模型以及专家模型;通过双向表示模型中至少两层编码器依次处理待检测...
  • 本申请实施例提供了一种语音识别方法、装置、设备和存储介质,其中语音识别方法包括:接收目标语音信号,所述目标语音信号包含一个或多个说话人的语音信号;获取所述目标语音信号的目标声学特征序列;根据所述目标声学特征序列生成目标编码序列;根据所述...