平安科技深圳有限公司专利技术

平安科技深圳有限公司共有16707项专利

  • 本申请涉及机器人控制技术领域及保险业务和智慧医疗领域,提供了一种机器人控制方法、装置、电子设备及计算机可读存储介质,方法包括:获取语音指令和初始观察图像;基于预训练的视觉语言模型中的因果注意力子模块、语音指令和初始观察图像进行视觉推理处...
  • 本申请涉及一种布局图像生成方法、装置、计算机设备及存储介质,所述方法包括下述步骤:对原始图像数据进行元素解析,得到图像元素信息;对图像元素信息进行特征提取,得到图像特征和文本特征;根据预设设计规则、图像特征、文本特征、图像元素信息进行超...
  • 本申请属于人工智能技术领域,涉及基于深度先验引导的图像生成方法及其相关设备,通过接收原始深度数据;将预处理后的标准归一化图像输入到图像生成模型中;获取基于原始图像数据识别到的辅助特征,其中,辅助特征为根据人类眼睛感知所识别出的特征,包括...
  • 本申请实施例提供了一种基于多模态的智能回复方法和装置、电子设备及介质,属于人工智能技术领域,应用于金融场景和医疗场景。该方法包括:获取目标问题信息的目标问题文本、目标问题图像及目标问题音频数据中至少两种模态数据,并将多模态数据进行特征提...
  • 本申请公开一种图像检索方法、装置、计算机设备及存储介质,属于人工智能技术领域,具有应用于保险营销场景图像的检索系统。本申请通过对待处理图像进行分割并编码,将图像的内容特征与位置信息结合,形成高质量的图像表示,并利用预设的图像索引生成器生...
  • 本申请属于人工智能技术领域,涉及一种人脸图像的处理方法、装置、计算机设备及存储介质,包括:获取源人脸图像和目标人脸图像;基于双分支特征编码器分别对源人脸图像和目标人脸图像进行多尺度特征提取得到对应的源特征与目标特征;基于注意力场生成器对...
  • 本申请属于人工智能技术领域,涉及一种基于人工智能的图像生成方法、装置、计算机设备及存储介质,包括:获取用户输入的初始文本,以及获取输入图像;基于文本姿势编码器对初始文本进行特征提取得到文本姿势嵌入;基于视觉姿势编码器对输入图像进行特征提...
  • 本发明涉及人工智能及医疗健康和金融技术领域,公开了文本提取重建方法、装置、计算机设备及存储介质。所述方法包括:获取待处理文本图像;将所述待处理文本图像输入至文本提取重建模型中进行文本重建,以得到目标文本图像;其中,所述文本提取重建模型包...
  • 本发明涉及人工智能领域,可应用于金融科技、医疗健康等业务系统平台中,公开了基于周期性稀疏变换的海报生成方法、装置、设备及介质,包括:获取原始输入元素;对原始输入元素进行解析和特征提取,生成相应的嵌入向量;通过周期性稀疏变换器周期性地激活...
  • 本发明涉及云计算技术领域,可应用于金融科技、医疗健康等业务系统平台中,揭露了一种智能体优化更新方法、装置、设备及介质,所述方法包括:获取初始智能体和任务请求,对初始智能体进行质量分级,得到中间智能体并对任务请求进行场景分类,得到目标任务...
  • 本发明公开了一种基于视频熵值的短视频文本生成方法、装置、设备及介质。所述方法包括:将待处理短视频的每一视频帧通过预设视觉模型进行视觉特征提取,获取视觉特征序列;根据视觉特征序列通过预设卷积神经网络计算每一视频帧的熵值,获取熵序列;将熵序...
  • 本申请实施例提供了一种基于多模态数据的任务预测方法和装置、电子设备、介质,涉及人工智能领域,应用于金融科技和医疗领域。该方法包括:获取目标任务的多模态序列数据;对多模态序列数据进行特征提取得到至少两个单模态时序特征,并对这些时序特征进行...
  • 本发明涉及人工智能领域,可应用于金融、医疗领域,本发明公开了图像局部编辑方法、装置、设备及介质,该方法包括获取原始图像、图像待替换位置掩码和提示文本,并获取提示文本对应的词元嵌入;其中,图像待替换位置掩码用于对原始图像的对应位置进行图像...
  • 本发明公开了广告图像生成方法、装置、计算机设备及存储介质,所述方法包括:接收用户输入的文本提示信息和指定的材质类型;对文本提示信息进行语义提取,以得到语义特征;对语义特征进行编码,以得到编码向量;将编码向量和指定的材质类型输入至生图模型...
  • 本发明涉及人工智能技术领域,可应用于机械臂抓取、金融科技及医疗健康等业务场景中,公开了一种基于多模态信息的目标操控方法、装置、设备及介质,包括:获取表述操作意图的语言指令并采集目标物体所在环境的视觉信息;通过语言处理模块生成语义表示,视...
  • 本申请涉及一种目标路径导航方法、装置、计算机设备及存储介质,所述方法包括下述步骤:获取空间结构信息和待导航目标信息,根据空间结构信息和待导航目标信息构建语义空间地图;对语义空间地图中的目标点进行信息增益预测,得到目标点信息增益;基于多模...
  • 本发明公开了一种基于场景的视频理解方法、装置、设备及介质。所述方法包括:将待理解视频进行视频帧提取获取离散帧序列,将所述离散帧序列通过预设特征提取网络进行特征提取,获取空间特征与时间特征;将所述空间特征与所述时间特征通过预设掩码生成器进...
  • 本发明涉及数据分析技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种作业流程分析优化方法、装置、设备及介质,包括:获取作业过程中坐席业务人员的语音录音、操作日志和视频记录,得到多维源数据,根据所述多维源数据获取预先定义的业...
  • 本发明公开了一种基于个性化配置的企业KPI考核方法、装置、设备及介质,涉及数据处理技术领域,对于组织结构复杂的金融、保险以及医疗等领域,该方法解决了固定模板导致的“考核指标与岗位实际职责脱节”这一根本性缺陷。方法包括:获取个性化配置指令...
  • 本申请提出的视频切片方法和装置、电子设备、存储介质,涉及人工智能技术领域,适用于金融科技领域及医疗健康领域。该方法包括:获取目标视频,对目标视频进行帧提取,得到有序图像帧序列;对每一图像帧进行时空编码,得到图像帧的图像密集特征;根据图像...