科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本发明提供一种答题卡模板生成方法、答题卡识别方法、装置和电子设备,模板生成方法包括:对待建模的答题卡图像进行选框检测,得到各选框的选框位置;基于各选框的选框位置,确定各选框所属的选框阵列的第一分布参数;调整第一分布参数,得到多组第二分布...
  • 本发明提供一种音视频处理电路、控制方法、控制装置和电子设备,所述音视频处理电路具有第一工作模式,包括:放大模块;负载开关,所述负载开关包括第一输出引脚和第二输出引脚,所述负载开关的输入端与所述放大模块的输出端连接,所述第二输出引脚与所述...
  • 本申请公开了一种两轮车的车速控制方法、装置、存储介质及设备,该方法包括:首先获取目标两轮车的载重量、风阻系数和当前的车速等行驶数据;然后根据目标两轮车的载重量和风阻系数,利用动态载重测速算法,计算目标两轮车的合理车速范围;接着,判断目标...
  • 本发明提供一种车内活体检测方法、检测装置和电子设备,所述车内活体检测方法,包括:获取目标对象对座椅的作用力;基于所述作用力,生成目标曲线,其中,所述目标曲线用于表征所述座椅表面的输入加速度、车辆的输出加速度和所述座椅的振动传动率的主频率...
  • 本申请公开了一种知识图谱的构建方法、装置和计算机可读存储介质,该方法包括:获取待处理文档的目录标题与知识类别之间的类别映射表;基于待处理文档的正文数据与类别映射表,生成知识点类别,知识点类别为正文数据对应的知识类别;对正文数据进行解析处...
  • 本发明提供一种用户意图识别方法、识别装置和电子设备,所述用户意图识别方法,包括:对当前会话信息进行编码,生成当前会话编码;基于所述当前会话编码和历史会话编码,生成当前的第一用户意图信息;基于所述第一用户意图信息和第一意图预测信息,生成所...
  • 本申请公开了一种车辆断电保护方法、装置、存储介质及设备,该方法包括:首先获取当前时刻目标车辆所处的环境数据,然后从中提取出时间数据的特征向量、目标车辆的位置数据的特征向量及目标车辆的行驶数据的特征向量;接着分别计算这三个特征向量与时间标...
  • 本申请提供了一种语音处理方法、语音处理模型的训练方法、设备及介质,该语音处理方法包括:基于多路音频信号获取第一声学特征信息,其中,第一声学特征信息融合了多路音频信号的特征,多路音频信号是根据至少两个音频采集设备采集的原始音频信号获取的;...
  • 本发明提供了一种语音唤醒方法及装置、语音唤醒模块的训练方法及装置。该语音唤醒方法包括:获取待识别语音信号,其中,待识别语音信号包括唤醒词;利用声学模型对待识别语音信号进行唤醒词识别,获得唤醒词识别结果,其中,声学模型包括整词节点,整词节...
  • 本申请提供了一种语音识别方法及装置、语音识别模型的训练方法及装置,该方法应用于语音识别模型,包括:获取语音数据,语音数据包括待识别词语的信息;从语音数据中依次提取每个音频帧对应的语音特征:响应于语音特征累积到预设时长,确定预设时长内的每...
  • 本申请公开一种阅读理解方法、装置、存储介质及计算机设备。该方法包括:获取待处理的文本数据和图像数据,文本数据包括问题和问题对应的选项,图像数据包括场景图片;提取文本数据的文本向量表示,文本向量表示包含问题的文本信息和选项的文本信息;提取...
  • 本申请公开一种图文联合纠错方法、装置、存储介质及计算机设备。该方法包括:获取待处理的文本数据和图像数据,文本数据包括目标文本,图像数据包括场景图片;提取文本数据的文本向量表示,文本向量表示包含目标文本的文本信息;提取图像数据的图片向量表...
  • 本申请公开了一种语音评价方法,该方法包括:获取待评价的语音以及参考文本,从语音中提取声学特征,将声学特征输入声学模型的K个子声学模型,获得综合状态后验概率;根据综合状态后验概率以及通过所述参考文本构建的切分网络,将语音的音素与参考文本对...
  • 本申请公开了一种语音唤醒方法,包括:电子设备接收语音数据流,然后将语音数据流输入功耗较低的第一唤醒模型,获取第一识别结果,当第一识别结果表征语音数据流中包括唤醒词对应的片段时,将该语音数据流输入至功耗较高的第二唤醒模型,获得较为精确的第...
  • 本申请公开了一种文本图像识别方法、装置、设备以及存储介质,该方法包括:获取文本图像,文本图像包括M个文本框,根据预先训练的检测模型,获取M个文本框中每个文本框的属性信息,根据M个文本框的属性信息,确定M个文本框中每个文本框的关联信息,根...
  • 本申请提出一种书写显示方法、装置、设备、系统及存储介质,该方法包括:当书写应用完成当前同步信号周期内的书写笔迹渲染处理后,在当前同步信号周期内,启动对所述书写应用在当前同步信号周期内的书写笔迹渲染结果的合成处理,得到书写笔迹合成结果;将...
  • 本申请公开了一种一种事件抽取方法、相关设备及可读存储介质。该方案中,将待进行事件抽取的文本输入参数抽取模型,该参数抽取模型对该文本进行处理后,输出该文本对应的参数信息,基于该文本对应的参数信息,确定该文本中包含的至少一个事件。本方法中,...
  • 本发明公开了一种助听耳机的调试方法、装置以及设备,调试方法包括:提取真实场景采集的音频的信号包络特征;利用所述信号包络特征模拟真实场景的复合声信号,作为测试设备的场景模式;利用所述测试设备中的场景模式对所述助听耳机进行初步调试;通过主观...
  • 本发明实施例提供一种翻译模型训练方法和翻译方法及其装置。其中,模型训练方法包括:分别将平行双语句对中的源语言语句和加噪的源语言语句输入翻译模型,得到第一预测目标语言语句和第二预测目标语言语句,并分别获取翻译模型的第一预测概率分布、第二预...
  • 本发明提供一种话者分离方法、装置、电子设备和存储介质,所述方法包括:对视频帧进行人员检测,得到视频帧中人员的人员位置;对视频帧对应的音频段进行声源定位,得到声源位置;基于人员位置和声源位置之间的相对位置关系,对音频段进行话者分离。本发明...