科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本发明涉及功能测试技术领域,提供一种微控制单元功能测试方法及装置,该方法首先基于与辅助测试单元之间的通信服务,建立与微控制单元的通信连接,并执行微控制单元的待测试功能对应的测试用例脚本;然后基于测试用例脚本,调用待测试功能对应的功能模块...
  • 本申请提供了一种视线估计模型的训练方法及装置、视线估计方法及装置,涉及计算机视觉技术领域。该训练方法包括基于目标对象的双眼区域图像集合,确定目标对象的样本图像对,样本图像对中包括两幅样本图像;确定两幅样本图像各自对应的第一视线特征;基于...
  • 本申请提供了一种手写数据生成方法,装置、存储介质及电子设备,涉及图像处理技术领域。该方法包括:获取目标图像,目标图像中包括至少一个目标字符,至少一个目标字符的书写风格为第一书写风格;基于目标图像,确定至少一个目标字符各自对应的字形特征,...
  • 本申请提出一种扫描图像识别方法、装置、电子设备及存储介质,方法包括:从采集的扫描图像中,确定有效边界图像帧;确定有效边界图像帧中的边界字符是否为有效字符,若为有效字符,则从目标图像中确定边界字符的第一字符边界作为切分位置;若为无效字符,...
  • 本申请提供了一种视线估计方法及装置、存储介质及电子设备,涉及计算机视觉技术领域。该视线估计方法获取相机系统在当前时刻针对目标用户采集的多帧用户图像;基于多帧用户图像,确定目标用户在相机坐标系下的视线方向信息;基于多帧用户图像,确定目标用...
  • 本申请公开了一种盲文转换后文本的错别字检测方法、装置及相关设备,本申请提取待检测文本的文字模态特征,与待检测文本对应的盲文数据的盲文模态特征,将盲文模态特征和文字模态特征进行融合,基于融合特征确定盲文数据对应的真实文本,对比真实文本和待...
  • 本申请公开了一种音文平行数据中文本错别字检测方法、装置及相关设备,本申请提取音文平行数据中的待检测文本的文字模态特征,提取与待检测文本平行的音频的音频模态特征,将音频模态特征和文字模态特征进行融合,基于融合特征确定音频对应的真实文本,对...
  • 本申请公开了一种音频相关文本中错别字检测方法、装置、设备及存储介质,本申请提取待检测文本的文字模态特征,与待检测文本相关输入音频的情感模态特征,将情感模态特征和文字模态特征进行融合,基于融合特征确定待检测文本对应的真实文本,对比真实文本...
  • 本发明公开了一种电子控制单元的控制方法、装置及域控制器的控制方法,电子控制单元的控制方法包括:第一引导加载程序初始化成功后,第一引导加载程序识别第二引导加载程序的重编程标志位是否有效;若否,则第一引导加载程序对第二引导加载程序进行初始化...
  • 本申请提出一种文本识别方法、装置、电子设备和存储介质,能够针对多个具备相同文本内容的图像帧序列进行文本内容的识别,减少其他不具备相同文本内容的图像帧的干扰,提升视频场景下的文本识别准确性;而且,在对当前帧进行文本识别时能够结合上一帧图片...
  • 本发明公开了一种无线通信模组的测试方法、系统和测试设备,该方法应用于测试设备,测试设备与各被测设备之间采样串口通信连接,无线通信模组的测试方法包括:确定当前被测设备;通过相应的串口通信连接向当前被测设备发送测试指令,以对当前被测设备中的...
  • 本发明提供一种意图识别方法、装置、电子设备及存储介质,该方法包括:获取待识别文本;基于语言模型,提取所述待识别文本的文本意图特征;基于意图识别分支,确定所述文本意图特征对应的意图识别结果;其中,所述语言模型是结合掩膜预测分支进行掩膜预测...
  • 本申请公开了一种语音识别方法、装置、设备及存储介质,本申请获取说话人说话过程的语音和拍摄的视频,采用多模态语音识别模型处理语音及视频,得到输出的识别文本,其中模型被配置为:从输入的视频中提取视觉特征,从输入的语音中提取声学特征,并基于注...
  • 本发明公开了一种基于车载输入法的手写输入候选快速预判方法及电子设备,基于用户在车载输入法的手写输入模式下的书写习惯,将当前输入的非完整字符或单词与车辆当前工况、调用车载输入法的应用程序及预先基于用户在该应用程序的使用历史构建的个性化字词...
  • 本申请公开了一种文档分析方法、装置、存储介质及设备,该方法包括:首先获取目标文档所在的目标图像,并对其进行识别处理,得到目标文档中的目标文本行及目标文本行所在的文本框位置;然后将目标文本行和目标图像输入预先构建的文档分析模型,预测得到目...
  • 本申请公开了一种麦克风套件通信方法及相关装置、设备和存储介质,其中,麦克风套件通信方法包括:响应于发射器入仓时向电池仓上报的设备标识,基于电池仓检测到发射器的实际入仓位置和设备标识,获取发射器的校验标识;将发射器的标识信息发送至接收器。...
  • 本发明提供一种跳远评测方法、装置、电子设备和存储介质,其中方法包括:确定跳远评测区域下的待测视频和刻度线坐标;从所述待测视频中的各帧中,确定落地帧;基于所述落地帧中人员的脚部骨骼点的坐标,对所述落地帧进行脚部分割,得到所述落地帧中的多个...
  • 本申请公开了一种情感识别方法和相关装置、电子设备和存储介质,该方法包括:基于目标对象的视频数据,得到音频数据和与音频数据同步的图像数据;提取音频数据的第一音频特征,并提取图像数据的第一图像特征;基于第一音频特征和第一图像特征进行特征互补...
  • 本申请提供了一种自动答题方法、自动答题装置、电子设备及存储装置,所述自动答题方法包括:从题库中获得与待解答题目相似的相似题目以及所述相似题目的参考答案;基于门控注意力机制对所述待解答题目、所述相似题目和所述参考答案进行编码以获得多个编码...
  • 本发明公开了一种基于多任务的座舱内行为检测方法、装置以及设备,座舱内行为检测方法包括:接收座舱内的实时图像;识别所述实时图像中的人脸区域,扩大所述人脸区域形成的第一外轮廓,并提取扩大后的第一外轮廓所围区域的图像,作为输入图像;将所述输入...