科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本申请公开了语音翻译方法及装置、电子设备以及计算机可读存储介质,语音翻译方法包括:获取到待翻译语音的第一语音编码向量;对第一语音编码向量进行实时顺滑处理,得到第一语音编码向量对应的标记信息与分段信息;基于第一语音编码向量、标记信息、分段...
  • 本发明公开一种笔迹识别方法及笔迹识别模型的训练方法,所述识别方法包括:获取待识别图像;待识别图像包括目标识别对象;将待识别图像输入目标笔迹识别模型进行特征提取,得到目标识别对象对应的待识别特征信息;基于目标笔迹识别模型,对待识别特征信息...
  • 本申请提出一种录音设备、录音方法、存储介质及产品,录音设备包括:控制器、第一麦克风模块和第一录音采集模块;第一录音采集模块中包括至少两种增益值不同的增益通道;第一麦克风模块采集音频信号,将音频信号传输给各个增益通道进行模拟增益;第一录音...
  • 本申请公开了一种语音识别方法及相关装置,涉及语音识别技术领域,语音识别方法包括:获取目标语音数据;通过对目标语音数据进行初步语音识别,获取目标语音数据的字级别声学信息以及候选语音识别结果;将目标语音数据的字级别声学信息投射到大语言模型的...
  • 本申请公开了一种故障预测方法及相关装置、设备和存储介质,其中,故障预测方法包括:获取待测设备在运行过程中关于若干种模态的采集数据;基于若干种模态采集数据各自的跳变检测结果,调整若干种模态各自的注意力参数;基于若干种模态各自的注意力参数,...
  • 本申请公开了一种地块变化检测方法及相关装置、设备和存储介质,其中,地块变化检测方法包括:基于目标地块在不同时间的目标拍摄图像,生成第一编码特征,以及基于关于目标拍摄图像的目标问题语句,生成第二编码特征;其中,第一编码特征与第二编码特征两...
  • 本申请公开了一种数据聚类方法及相关方法、设备和存储介质,其中,数据聚类方法包括:基于若干业务数据的数据特征进行分析,得到各个业务数据的分布密度和目标距离;其中,目标距离表征业务数据分别与各个具有更高分布密度的业务数据之间特征距离的最小值...
  • 本申请公开了一种球体高度估计方法及装置、电子设备和存储介质,该方法包括:获取目标图像;其中,目标图像包括参考物和球体;确定参考物在目标图像中的参考位置以及球体在目标图像中的球体位置;基于参考位置和球体位置,确定目标参考点;其中,目标参考...
  • 本申请公开了一种意图识别方法、系统和相关装置,该方法包括:获取用户输入的初始意图,从意图数据库中获取与所述初始意图相关的候选意图;获取所述初始意图与各个所述候选意图之间的相对模糊度;其中,所述相对模糊度基于所述初始意图的初始要素与对应所...
  • 本发明涉及计算机视觉领域,提供一种视角转换方法、装置、电子设备和存储介质,方法包括:获取第一数量张多个视角下的图像,并从所述图像中确定空间分布上相互独立的图像组;将所述图像组同时转换至同一鸟瞰图视角BEV空间,得到第二数量张初始BEV图...
  • 本申请公开了一种音频翻译方法及系统,翻译机通过USB与其它智能终端连接,在建立USB连接后智能终端将翻译机识别为耳机,在此基础上,智能终端当存在翻译需求时,可以将待翻译的原始音频数据通过USB发送给翻译机,在翻译机开启翻译功能的状态下,...
  • 本发明提供一种音质评测系统、方法以及介质,其中系统包括:控制单元、传送单元,以及多个待测样品;控制单元用于基于随机评测顺序,从多个待测样品中确定当前评测样品,针对当前评测样品执行音质评测操作;并在接收到样品切换指令的情况下,基于随机评测...
  • 本发明实施例提供一种标注数据的质检方法、服务器及存储介质,属于数据标注领域。该方法包括:获取含有雷文件的待检标注数据;确定雷文件中的第二待标注数据的标准标注结果与相同的第二待标注数据的待检标注结果之间的一致率;根据一致率,确定数据标注任...
  • 本发明提供一种试题推荐方法、装置、设备及存储介质,应用于计算机技术领域,该方法包括:根据目标用户输入的试题图像,确定试题图像中包括的试题文本;采用大模型对试题文本进行语义分析和知识点识别处理,确定试题文本中试题对应的目标知识点;根据各目...
  • 本申请公开了一种语音增广方法及相关方法、装置、设备和存储介质,其中,语音增广方法包括:获取待增广语音,并获取待合成文本;基于待增广语音进行特征提取,得到待增广语音所属说话人的声纹特征和待增广语音所属场景的环境噪声特征;基于各个待增广语音...
  • 本发明涉及人工智能技术领域,提供一种虚拟人表情合成方法、装置、电子设备和存储介质,方法包括:提取参考音频的音频特征,以及基于PDFGC编码器提取人脸参考图像的人脸特征;将所述人脸特征和所述音频特征输入至已训练的基于概率扩散过程的生成模型...
  • 本发明涉及弈棋机器人技术领域,提供一种弈棋机器人的校准方法、装置及弈棋机器人。弈棋机器人包括第一机械臂及拾取件;校准机器人包括第二机械臂,第二机械臂的执行末端与拾取件转动连接,校准方法包括:获取棋盘的全局图像,根据全局图像确定棋盘上的各...
  • 本发明提供一种虚拟人视频生成方法、装置、电子设备及存储介质,涉及人工智能技术领域,该方法中通过将每个视频帧中的人脸图像、遮盖图像以及语音特征一同输入至目标图像生成模型进行处理,可以使最终得到的虚拟人视频与待处理视频相比,仅虚拟人的口型发...
  • 本申请提供一种网页动作执行方法、装置、设备及程序产品,该网页动作执行方法包括:基于待执行任务、当前动作的网页操作信息、当前动作的截图、先前动作的网页操作信息以及先前动作的截图,确定下一步动作的网页操作信息;基于下一步动作的网页操作信息,...
  • 本申请公开了一种单目手势识别方法及相关装置,涉及手势识别技术领域,单目手势识别方法包括:获取目标手部图像序列;基于预先训练得到的单目3D手部姿态估计模型,获取目标手部图像序列的每个目标手部图像对应的手部3D关键点位置信息,得到目标手部3...