平安科技深圳有限公司专利技术

平安科技深圳有限公司共有16707项专利

  • 本发明属于人工智能技术领域以及医疗健康领域,公开了一种视频摘要的生成方法、装置、设备及存储介质,该方法包括:获取目标视频;分析所述目标视频中的不同场景;根据所述目标视频的不同场景,将目标视频分割为子目标视频,所述子目标视频与所述目标视频...
  • 本发明涉及语音处理技术领域,可应用于医疗健康、金融科技及无障碍服务领域等业务场景中,公开了一种基于知识蒸馏的文本转语音方法,包括:对输入文本进行标准化处理,生成标准文本序列;轻量化文本编码器对标准文本序列进行编码,生成文本隐向量;非自回...
  • 本申请属于人工智能技术领域,涉及一种数据分析方法,包括:接收用户输入的系统影响分析需求信息;基于预设的任务智体对系统影响分析需求信息进行分析,确定出与系统影响分析需求信息对应的目标系统组件;获取预先收集的与系统影响分析相关的初始数据集;...
  • 本发明涉及语言信号处理领域、金融科技领域以及医疗健康领域,公开了一种文本转换语音方法、装置、设备及介质,包括:对目标文本进行文本分词处理以及词性标注处理,得到预处理文本,利用预设的双自回归架构根据预处理文本生成输出编码,利用解码器根据输...
  • 本发明涉及语音合成、金融科技和医疗健康技术领域,公开了基于扩散的潜在韵律的语音合成方法、装置、设备及介质,根据梅尔频谱图以及预设的真实音素时长生成初始音频各频段对应的参考韵律向量;根据文本隐藏表示和说话人隐藏表示构建参考韵律向量对应的分...
  • 本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种语音风格迁移方法,包括:提取源语音和参考语音的特征,分离内容特征和风格特征;基于时间参数对初始源特征进行线性插值,生成中间特征;将中间特征输入流匹配模型,生成...
  • 本发明涉及数据分析技术领域,可应用于医疗健康、金融科技及文化研究等业务场景,公开了一种多模态摘要生成与输出方法,包括:采集目标领域资料并进行清洗处理,得到结构化数据;从结构化数据中抽取实体及实体间的关联关系,构建目标领域知识图谱;基于目...
  • 本发明涉及语音处理技术领域,可应用于医疗健康及金融科技等业务场景中,公开了一种基于多尺度特征学习的语音增强方法,包括:对输入音频信号进行分帧处理,提取梅尔频谱特征,利用多尺度卷积神经网络提取频域特征,并对其进行编码降维;通过深度残差网络...
  • 本发明提供了一种基于人工智能的心理健康评估方法、装置、设备及介质,通过预设决策树模型输出初始问题,并获取用户的初始回复;将初始问题和初始回复作为初始输入信息;按照预设节点排序策略对初始输入信息与预设决策树模型中关键节点的命中结果进行检测...
  • 本申请提出的语音合成方法、语音合成装置、电子设备及存储介质,涉及人工智能技术领域,适用于金融科技领域及医疗健康领域。该方法包括:对目标语音数据进行音色提取,得到目标音色特征;对源语音数据进行特征提取,得到源语言内容特征;对源语音数据进行...
  • 本发明属于人工智能技术领域以及医疗健康领域,公开了一种音频驱动数字人的方法、装置、设备及存储介质,该方法包括:提取目标音频的音频特征;将所述音频特征输入第一预设模型中,得到所述目标音频对应的目标人脸3D关键点;融合所述目标人脸3D关键点...
  • 本发明涉及人工智能技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了基于残差量化的语音生成方法、装置、设备及介质,包括:获取待生成语音的目标文本;将目标文本输入到文本风格预测器中,对目标文本进行文本编码与风格预测处理,获得文本...
  • 本申请属于人工智能领域,涉及一种图像生成方法,包括:获取目标图像;采用预设的图文编码模型,对目标图像进行编码,得到目标图像的图像特征向量;根据图像特征向量,通过反向优化生成与目标图像特征相似的文本提示词;采用图文编码模型,对文本提示词进...
  • 本发明涉及人工智能技术领域,尤其涉及一种样本生成方法、装置、设备及介质。应用于医疗场景,本发明中,根据样本中对象的标签文本生成多个新标签文本,用于丰富样本中的对象,根据新标签文本生成对应的对象,使用新标签文本生成的对象替换原有的对象,生...
  • 本申请提出的文字检测方法和装置、电子设备、计算机可读存储介质,涉及人工智能技术领域,应用于金融科技领域。该方法包括:获取包含文字区域的图像,得到初始文字图像,文字区域包含路标文字;通过预设的图像检测模型的主干网络对初始文字图像进行特征提...
  • 本发明涉及人工智能技术领域,可应用于金融科技、医疗健康等业务系统平台中,公开了一种情感语音生成方法、装置、设备及介质,包括:获取待生成语音的目标文本和基于自然语言描述的目标情感提示文本;将目标情感提示文本输入到预先训练的情感编码器中,获...
  • 本发明涉及图像检测技术领域,可应用于金融科技及医疗健康等业务系统平台中,揭露了一种图片素材自动扩展的方法、装置、设备及介质,包括:对待扩展视频中的每一帧图片进行高斯加噪,得到噪声图片集合;从噪声图片集合中选取目标噪声图片,将目标噪声图片...
  • 本发明涉及人工智能技术领域,可应用于医疗健康、金融科技及文化艺术等业务场景,公开了一种基于特征融合的音频解析方法,包括:获取目标领域内的目标音频及其关联的目标文本,提取目标音频的音乐特征向量,提取目标文本的文本语义特征向量,融合音乐特征...
  • 本发明涉及数据分析技术领域,可应用于医疗健康、金融科技及文化研究等业务场景,公开了一种多源知识处理与查询方法,包括:数据采集、清洗与标准化处理,构建标准化数据库;提取核心概念及关联关系,生成知识要素;基于知识要素构建多维知识图谱,并建立...
  • 本申请实施例提供了一种图像生成方法、图像生成装置、计算机设备及存储介质,涉及图像处理技术领域,适用于金融科技领域和医疗健康领域。该方法包括:获取样本风格图像;构建初始风格图像生成模型;通过所述风格特征提取模块,对所述样本风格图像进行风格...