科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本申请实施例公开了一种作业批改方法、装置、设备及存储介质,获取包含待批改作业的目标图像后,对目标图像进行目标识别,以确定目标图像中的各个题目区域,各个手写答案区域,以及各个题目区域对应的题型;对各个题目区域和手写答案区域进行字符识别,确...
  • 本申请实施例公开了一种神经网络模型的部署方法、装置、设备及存储介质,方法包括:获得电子设备的当前算力信息;至少根据包含多个神经网络模型的模型集合,获得与所述当前算力信息相匹配的目标模型;其中,所述模型集合中的神经网络模型的卷积核参数预先...
  • 本申请公开了一种语音输入方法、电子设备以及计算机存储介质。该方法包括:接收语音识别引擎对用户输入语音进行语音识别而产生的识别文本;将用户个性化词库中的个性化词条与识别文本进行发音匹配,以获得与识别文本的发音相匹配的个性化候选词条;以及将...
  • 本发明提供一种版面结构分析方法、装置、电子设备和存储介质,其中方法包括:提取待分析的版面图像的图像特征;基于所述图像特征,对所述版面图像进行版面要素检测,得到所述版面图像中各要素的位置信息和要素类别;基于所述图像特征,对所述版面图像进行...
  • 本发明提供一种点云重建方法、装置、电子设备和存储介质,其中方法包括:基于目标相机和邻域相机的位姿信息,确定目标相机的待重建图像在邻域相机的候选匹配区域内的候选图像;基于候选图像与待重建图像之间的相似度,从候选图像中确定待重建图像的配对图...
  • 本发明公开了一种基于句子的语义相似度获得方法、装置以及设备,语义相似度获得方法包括:利用第一编码器获得第一句子的第一语义表征;利用所述第一编码器或第二编码器获得第二句子的第二语义表征;计算所述第一语义表征与所述第二语义表征之间的相似度,...
  • 本申请公开了一种发声者识别方法、装置、电子设备和存储介质。其中,发声者识别方法包括:提取发声者的目标声纹表征;对目标声纹表征进行信道迁移,得到第一迁移声纹表征,其中,目标声纹表征属于第一信道,第一迁移声纹表征和参考声纹表征属于第二信道;...
  • 本申请提供了一种面部动作识别及模型训练的方法、装置、设备和存储介质,其中模型训练方法包括:获得多个视频段样本;构建每个视频段样本的至少一个同源正样本对和至少一个同源负样本对;针对多个视频段样本构建至少一个非同源正样本对和至少一个非同源负...
  • 本申请公开了一种文本分类方法、装置、存储介质及设备,该方法包括:首先获取待分类的目标文本,并将目标文本输入至预先构建的文本分类模型,识别得到目标文本对应的超平面特征向量;然后分别计算目标文本对应的超平面特征向量与N个预设类别中心点对应的...
  • 本申请提供了一种基于焦点信息的语音合成方法、装置、设备和存储介质,所述方法根据文本样本以及对应的样本焦点分级标签学习文本中的焦点信息,并训练生成焦点预测模型。然后通过焦点预测模型预测用于表示待合成文本的需强调文本的目标焦点分级信息。并根...
  • 本申请涉及语音处理技术领域,并公开了一种语音增强方法、计算机设备及存储介质,通过提取目标场景中的语音信号,将语音信号中的第一声学特征信号输入训练完毕的的语音增强模型中进行语音增强,得到第一目标声学特征信号后,将第一目标声学特征信号和第一...
  • 本申请提供了一种用户词库的获取方法、候选词的生成方法及装置,该方法包括:获取用户的第一语种信息和第二语种信息,第一语种信息根据用户当前键盘信息确定;接收用户的输入字符;将输入字符中第一语种的字符存入预先构建的主数据结构,将输入字符中第二...
  • 本申请公开了一种语音合成方法及相关装置、设备和存储介质,该方法包括:基于待合成文本,提取若干帧级声学特征;分别基于各帧级声学特征分别进行预测,得到各帧级声学特征分别对应的声学参数;基于激励参数、噪声参数和帧级声学特征对应的声学参数进行融...
  • 本申请公开了一种语音合成方法及相关装置、电子设备和存储介质,其中,语音合成方法包括:将待合成文本进行口语化转换,得到口语化文本;其中,口语化转换参考至少一种转换模式;提取口语化文本的音素序列,并预测口语化文本的口语化控制标签;其中,口语...
  • 本申请提供了一种模型的训练方法及装置、人体姿态识别方法及装置,该方法应用于人体姿态估计模型,包括:将人体姿态样本图像输入初始人体姿态估计模型,以获取人体姿态样本图像上包括的单个人物图像;将单个人物图像输入至少一个单人姿态估计模型,以分别...
  • 本申请提供一种动作图像生成方法、模型构建方法、计算机设备及存储介质,其中,该模型构建方法包括:获取目标人物的第一图像集和第二图像集,第一图像集和第二图像集包括关于目标人物动作的序列图像;根据第一图像集的序列图像进行三维重建,得到多个第一...
  • 本发明提供一种知识图谱生成方法、系统、存储介质及电子设备,其中,所述方法包括:获取目标用户在预设时间段内的学习数据集合,所述学习数据集合包括至少一项学习数据;对所述学习数据集合中学习数据进行特征提取处理,得到目标特征向量,所述目标特征向...
  • 本发明公开了一种用于基于题目识别手写作答内容的方法、系统和计算设备,方法包括:接收包含手写作答内容的图像和与所述手写作答内容相对应的题目的题目文本序列;以及由经训练的手写作答内容识别模型,基于接收到的图像和所述题目文本序列识别出对所述手...
  • 本申请公开了一种数据处理引擎的测试方法、装置、系统和存储介质,该方法包括:获取数据处理引擎对应的测试工具;对测试工具所在的测试环境进行测试,得到第一环境测试结果;在第一环境测试结果满足预设条件时,采用测试工具对数据处理引擎进行测试,得到...
  • 本申请提供一种语音合成方法、模型训练方法、设备及存储介质,该语音合成方法包括:获取待合成文本,输入到训练好的目标语音合成模型,得到待合成文本对应的目标语音;其中,根据预训练集对预设的语音合成模型进行预训练得到语音合成模型;采用目标应用场...