平安科技深圳有限公司专利技术

平安科技深圳有限公司共有16707项专利

  • 本发明公开了线上问诊方法、装置、计算机设备及存储介质,涉及人工智能技术领域,应用于医疗服务相关的线上问诊场景中,其中,所述方法包括:获取线上用户输入的问诊信息和医疗图片;对所述医疗图片进行预处理、特征提取、内容识别以及内容提取的处理后,...
  • 本发明涉及人工智能技术领域,公开了一种语音合成方法、装置、设备及介质,包括:获取待合成文本和参考音频;采用滑动窗口算法将待合成文本划分为多个文本段;基于参考音频和预训练的语音合成模型,生成每个文本段对应的音频波形;对每个文本段对应的音频...
  • 本申请实施例提供了一种车辆定损方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取待定损车辆图片;将待定损车辆图片输入至编码器,生成潜在特征;将潜在特征输入至解码器,得到目标特征向量;通过多尺度适配器将潜在特征转换为多...
  • 本申请实施例提供了一种视频流的风险识别方法和装置、电子设备及存储介质,属于人工智能及金融技术领域。该方法包括:获取原始视频流数据,并获取视频流获取时间;基于视频流获取时间对原始视频流数据进行视频时间计算,得到视频流起始时间;对原始视频流...
  • 本发明涉及人工智能技术领域,公开了一种基于自监督学习的声音异常检测方法、装置、设备及介质,所述方法包括获取机械设备在正常运行状态下的第一声音样本集以及待测试的机械设备的声音样本;对第一声音样本集进行数据增强处理,得到第二声音样本集;将第...
  • 本发明涉及视频生成领域,公开了一种视频生成方法、装置、设备及介质,包括:对原始视频数据进行处理,得到若干个初始帧图像;将每个初始帧图像均分割重塑为二维图块序列并进行嵌入处理,生成图块嵌入序列;将图块嵌入序列输入到具有测试时学习层的视频生...
  • 本发明实施例公开了一种有声读物的制作方法、装置、计算机设备及存储介质。所述方法包括:识别并提取目标文本中应当插入背景声音的文本片段;根据提取的所述文本片段的内容生成目标背景声音;将目标文本转换成目标文本语音;在目标文本语音中与所述文本片...
  • 本发明涉及数据请求处理领域及金融科技领域,揭露一种基于知识图谱的关联数据处理方法,包括在目标节点的第一属性信息计算目标节点的第一信息评分;确定与目标节点相关联的多个关联节点,计算目标节点与各个关联节点之间的关联权重;计算各个关联节点对应...
  • 本发明涉及情感识别技术领域,公开了一种基于异构图上下文建模的对话式语音合成的情感渲染方法、装置、设备及介质,包括:接收多源信息;整理每个节点集合以及两个节点之间关系的边集合,基于节点集合与边集合构建情感感知图;提取情感感知图中的目标节点...
  • 本申请涉及人工智能技术领域,公开了一种基于人工智能的对话响应方法、装置、设备及介质,包括:获取目标用户的当前输入语音;通过目标多模态音频语言模型以及预设的目标上下文数据库生成当前输入语音的目标响应文本以及目标韵律风格向量,目标上下文数据...
  • 本申请实施例提供了一种用于对话中语音识别方法和装置、电子设备及存储介质,属于金融科技技术领域。该方法包括:取对话中的原始说话人语音,对原始说话人语音进行声纹特征提取,得到原始声纹特征,对预先构建的声纹特征数据库的样本声纹特征进行聚类,得...
  • 本申请涉及3D技术领域,提供了一种数字人生成方法、装置、电子设备及计算机可读存储介质,方法包括:获取多视角人物图像;基于预设的运动结构恢复算法对多视角人物图像进行计算处理,得到初始化点云;对初始化点云进行三维高斯分布渲染处理得到三维高斯...
  • 本申请涉及数据处理领域,本申请提供一种基于多轮对话的地址抽取方法、装置、计算机设备及计算机可读存储介质,所述方法首先基于地址抽取模型中的预处理模块,对语音对话进行预处理,确定语音对话的文本信息以及用户意图;然后基于地址抽取模型中的实体识...
  • 本发明涉及媒体数据传输和金融科技技术领域,公开了一种媒体数据抗弱网传输方法及系统,该方法中计算媒体包在第一用户端和媒体网关之间传输的第一丢包率,以及计算媒体包在媒体网关和第二用户端之间传输的第二丢包率,将第一丢包率和第二丢包率反馈到第一...
  • 本发明涉及语音识别及金融科技技术领域,公开了一种定制化音色的语音生成方法、装置、设备及介质,包括:根据初始声音对生成初始语音种群,将初始语音种群中的初始声音与预设的目标文本进行合成,得到合成语音;获取目标用户对合成语音的筛选结果,根据筛...
  • 本申请实施例提供了一种图像分割方法和装置、电子设备及存储介质,属于图像处理和人工智能技术领域。该方法包括:获取具有样本标注信息的对象标注图像;基于预设的初始图像分割模型,对所述对象标注图像进行图像编码处理,得到目标特征图像;基于所述对象...
  • 本发明涉及人工智能技术领域和金融科技领域,公开了一种智能视频交互方法,通过将待交互视频划分为多个视频帧,并提取每帧的视觉特征。结合视频帧的时序信息和交互任务指令,生成上下文令牌。利用线性投影器将上下文令牌和视觉特征映射到统一的表示空间生...
  • 本发明涉及人工智能技术领域,公开了一种车损识别方法、装置、计算机设备及存储介质,包括:获取待识别的N张车辆受损图像,将待识别的N张车辆受损图像输入对象分割模型,分别对N张车辆受损图像进行编码,生成对应的N个图像编码张量;将N个图像编码张...
  • 本发明涉及人工智能技术领域和金融科技领域,公开了一种音频数据标注方法,通过获取音频数据,利用性别分类器确定性别属性,利用口音分类器确定口音属性,分析音频质量以获取信噪比和早晚期反射比值,分析音高特征以获取说话者平均音高和音高标准差,计算...
  • 本申请涉及人工智能技术领域,提供一种交互式对话方法、装置、设备及存储介质,其中方法包括:采集用户输入的语音信号并对语音信号进行识别,得到语音信号对应的第一文本内容;提取语音信号的语音情感表征;提取第一文本内容的文本情感表征;将语音情感表...