广州赛灵力科技有限公司专利技术

广州赛灵力科技有限公司共有15项专利

  • 本发明公开了一种歌声转换模型的训练方法、歌声转换方法、系统和介质,可广泛应用于歌唱处理技术领域。本发明通过对获取到的单人朗读录音数据进行预处理得到单人语音数据集,然后通过单人语音数据集对歌声转换模型进行自训练,并在自训练过程中将单人语音...
  • 本申请公开了一种大语言模型驱动的虚拟人视频生成系统及控制方法和介质,其通过工具模块存储多个虚拟人视频生成工具,通过提示语模块根据虚拟人视频生成任务信息,生成任务计划信息和子任务提示语信息,通过代理模块利用大语言模型和调用虚拟人视频生成工...
  • 本发明公开一种跨语言语音生成方法、系统及存储介质,应用于语音合成技术领域,能够实现在不同语言之间目标对象的语音生成,提高语音生成的完整性和可靠性。该方法包括:获取待合成目标对象语音数据,输入预设语音合成模型;通过目标对象特征提取器对语音...
  • 本发明公开了一种多路文本召回方法、系统、电子设备和存储介质,可应用于文本处理技术领域。本发明通过先对若干个待处理文本进行预处理,得到待处理文本对应的第一文本块、反推问题和第一文本块关键词,然后对目标对象的查询问题进行预处理,得到查询文本...
  • 本发明公开了一种知识运维平台及其应用方法、系统和存储介质,可应用于语言模型处理技术领域。本发明通过在知识运维平台中设置BOT中心、数据管理中心和模型运维中心,并通过BOT中心根据目标对象的输入信息确定机器人对话角色、目标模型以及目标模型...
  • 本发明公开了一种语音驱动身体手势的处理方法、系统和存储介质,可广泛应用于虚拟技术领域。本发明通过包含与实体对象对应的待处理语音数据和待处理手势数据组成的训练数据集对对语音驱动手势生成模型进行训练,以训练该模型中的语音编码器、风格编码器和...
  • 本发明公开了一种基于私域信息对话的大语言模型处理方法、系统和介质,可广泛应用于智能问答对话处理技术领域。本发明通过将基于私域信息构造得到的对话指令输入到通用大语言模型后得到待选择对话语料数据库,并基于小企业的私域信息构造训练指令后,从待...
  • 本发明公开了语音体征识别方法、装置、电子设备及存储介质,方法包括:获取待识别的目标对象的语音数据,对语音数据进行标准化处理,获得语音波形数据;利用语音体征识别模型,对语音波形数据进行分析处理,获得体征识别结果;其中,体征识别结果包括目标...
  • 本发明公开了一种视频处理方法、系统、装置及存储介质,包括:根据第一视频确定插入的第二视频和视频插入时间;根据第一视频和视频插入时间确定视频分割后相邻的第一末帧图像和第一首帧图像,获取第二视频的第二首帧图像和第二末帧图像;将第一末帧图像和...
  • 本发明公开了语音情感识别方法、装置、电子设备及存储介质,方法包括:获取待识别的语音数据,对语音数据进行标准化处理,获得语音波形数据;利用语音情感识别模型,对语音波形数据进行分析处理,获得情感识别结果;语音情感识别模型通过已标注情感离散分...
  • 本发明公开了一种语音驱动图像的方法、系统、装置及存储介质,包括:获取音频数据,并通过语音特征提取模型提取所述音频数据对应的音频特征向量;通过唇形表情预测模型和确定的表情情绪向量对所述音频特征向量进行预测,得到唇形表情偏移量序列;获取三维...
  • 本发明公开了一种虚拟形象的生成方法、系统、装置及存储介质,包括:获取包含人脸的图像,并对所述图像进行预处理,得到符合预设要求的待处理图像;所述图像由单目摄像头拍摄得到;将所述待处理图像输入到人脸透视重建模型进行预测,得到三维人脸网格顶点...
  • 本发明公开了一种语音情感分类及合成方法、系统、装置及存储介质,语音情感分类方法包括:获取语音数据,进行预处理;将预处理后的语音数据输入训练好的情感特征提取模型以得到情感特征向量,将预处理后的语音数据输入训练好的语者识别模型以得到说话人特...
  • 本申请公开了一种用于3D虚拟人的姿态迁移方法、装置、设备及存储介质,通过单目相机采集目标对象的rgb图像;通过目标检测算法对rgb图像中的目标对象进行检测,得到目标框信息;根据目标框信息从rgb图像中裁剪得到目标图像,并提取目标图像的第...
  • 本发明公开了一种语音清洗及合成方法、系统、装置及存储介质,语音清洗方法包括:根据音频数据的响度值及时间间隔确定静默搜索范围;根据静默搜索范围将音频数据分成若干组分句,根据优化分句标准及若干组分句确定优化分句;拟合优化分句的音频时长与对应...
1