平安科技深圳有限公司专利技术

平安科技深圳有限公司共有16707项专利

  • 本申请公开了一种三维点云数据的分析方法、系统、设备及存储介质,获取多个样本对象的样本三维点云数据;根据所述样本三维点云数据,通过预设的非参数网络算法建立第一点云分类模型;其中,所述第一点云分类模型为非参数网络类型的神经网络模型;获取待分...
  • 本申请涉及金融科技技术领域,公开了一种代答行为检测方法、装置、设备及介质。包括:利用语音识别技术获取目标视频片段对应的语音文本内容以及语音文本内容中每个字的时间戳;若语音文本内容与预设话术模板匹配,则根据时间戳对目标视频片段进行嘴巴运动...
  • 本发明涉及人工智能技术领域,公开了基于异构关系图的端到端语音合成方法、装置、设备及介质,方法包括:接收给定文本并提取所述给定文本中的语言学信息;对所述语言学信息进行编码得到对应的异构关系图;采用图卷积网络对所述异构关系图中的每个节点进行...
  • 本发明实施例提供了一种智能工作台的任务处理方法、装置、设备及介质,该任务处理方法通过对任务清单中的所有任务进行分类,并设置分类任务中各任务的任务参数,使得分类后的各任务能够根据任务参数直接下发给目标用户,目标用户根据任务列表中排序后的任...
  • 本申请实施例提供了一种语音合成方法和装置、电子设备、存储介质,属于语音处理技术领域,应用于金融科技和医疗领域。该方法包括:根据预设的音文样本对进行停顿编码,得到样本停顿信息;其中,音文样本对包括音频样本和音频样本的文本样本;对音频样本进...
  • 本发明涉及人工智能技术领域,公开了一种文本合成语音方法、装置、计算机设备及存储介质,应用于金融交易信息语音合成场景和医疗诊单信息语音合成场景中,其中,所述方法包括:获取初始文本音频对,并对所述初始文本音频对进行预处理,生成训练数据集和验...
  • 本申请属于人工智能领域,可应用于医疗健康领域,涉及一种基于特定情感的语音转换方法,包括获取待转换文本,利用文本编码器提取所述待转换文本的内容特征;获取待转换风格,利用所述待转换风格从风格空间模块的风格空间中匹配出所述待转换风格的风格控制...
  • 本发明提供了一种基于RLAIF的艺术字生成方法、装置、设备及介质,通过将输入信息输入至预先训练的布局模型中,得到布局信息;将输入信息和布局信息输入至预设微调语言模型中,输出匹配度损失;利用匹配度损失对预先训练的布局模型进行调整,得到调整...
  • 本发明涉及人工智能及金融技术领域,提供一种基于人工智能的文生艺术字方法、装置、设备及介质,一方面,基于文生艺术字模型对目标文本进行栅格化处理得到目标栅格图像文字,将矢量文字图层转换为像素图层,使文本不受语言种类限制,规避了中文语言结构复...
  • 本申请实施例属于图像验证技术领域,应用于视频真伪性识别场景中,涉及一种视频上传验证方法、装置、设备及其存储介质,通过获取待上传视频;进行分帧处理;对分帧处理后的图片分别进行人脸检测;仅保留包含人脸的图片,生成验证图片集;获取人脸检测模型...
  • 本发明涉及人工智能、金融及医疗健康技术领域,提供一种基于转置双重注意力的语音转换方法、装置、设备及介质,一方面,本发明采用转置双重注意力机制,能够以内容相关的方式提取多个语音风格表示,无需文本转录或说话者标签;一方面,本发明基于HuBE...
  • 本发明涉及人工智能领域及医疗健康领域,公开了一种基于噪声梅尔谱的纯净语音生成方法、装置、计算机设备及介质,方法包括:将存在噪声的梅尔频谱图输入特征增强模型,利用卷积神经网络及自注意力机制从存在噪声的梅尔频谱图中提取与语音相关的清晰频谱特...
  • 本发明涉及人工智能技术领域及金融科技和医疗健康领域,公开了心理状态分析方法、装置、计算机设备及存储介质,其中,通过获取目标用户回答目标问题时的问答音频和面部视频;对所述问答音频和所述面部视频分别进行特征表示,得到对应的语义特征向量和面部...
  • 本申请属于人工智能技术领域,涉及一种语音对象识别方法、装置、计算机设备及存储介质,该方法包括:采用语音对象识别模型对待识别语音进行特征提取,得到语音特征向量;将语音特征向量与语音对象识别模型中的注册特征向量进行相减,得到目标差值向量,注...
  • 本申请属于人工智能技术领域,涉及一种语音处理方法、装置、计算机设备及存储介质,该方法包括:通过语音识别与合成模型,采用文本编码器预网络提取文本数据的目标文本特征向量;采用语音编码器预网络提取语音数据的目标语音特征向量;将目标文本特征向量...
  • 本发明涉及人工智能技术领域,公开了金融科技领域和医疗健康领域的一种环境声音分类方法、装置、计算机设备及存储介质。该环境声音分类方法通过获取实时环境声音数据,对实时环境声音数据进行预处理,得到待分析声音样本;通过预设分类模型对待分析声音样...
  • 本申请实施例提供了一种水印嵌入方法和装置、电子设备及存储介质,可应用于金融科技领域和医疗科技领域,该水印嵌入方法包括:获取包括第一解码器、水印提取器和第二解码器的预设水印嵌入模型;通过第一解码器对水印样本和音频样本向量表示进行条件生成,...
  • 本申请实施例属于智能决策技术领域,涉及一种对话生成方法、装置、计算机设备及存储介质,该方法包括:接收用户终端发送的携带有提问文本数据的对话生成请求;对所述提问文本数据进行向量转化操作,得到提问文本向量;根据多头词嵌入机制对所述提问文本向...
  • 本申请提出的视频处理方法和装置、电子设备、计算机可读存储介质,涉及人工智能技术领域,应用于金融科技领域。该方法包括:获取目标视频;对目标视频进行抽帧,得到至少两个图像帧;通过视觉语言模型的视觉编码器对每一图像帧进行视觉编码,得到图像特征...
  • 本发明涉及云技术与互联网技术领域,适用于医疗场景和金融场景下的云预算分析,尤其涉及一种云预算分析方法、装置、计算机设备及存储介质,该云预算分析方法包括,从所述多个云预算项目中选取当前账期在预算周期内的云预算项目作为待分析云预算项目;获取...