科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本发明提供一种稿件生成方法、装置、电子设备和存储介质,其中方法包括:确定目标音频;基于目标音频进行要点提取,得到内容要点;基于内容要点进行稿件生成,得到带有图像的目标稿件;图像与内容要点关联,实现了图文并茂的稿件生成,不仅保证了出稿效率...
  • 一种注音方法、装置、语音合成系统、存储介质及电子设备。所述方法包括:当待注音词条为普通话非多音词词条时,查询目标方言引擎发音词典,得到与所述待注音词条匹配的第一词面;所述目标方言引擎发音词典包括:普通话词条及方言词条,至少部分普通话词条...
  • 本申请公开了一种行为识别方法、装置、设备及存储介质,本申请考虑到不同类型行为动作所需要时间信息是不同的,改进了现有单一的时序建模方式,同时配置了长时分支网络和短时分支网络,分别对拍摄的连续帧图像在时序维度上提取不同稀疏程度的图像特征,得...
  • 本申请公开了一种基于大语言模型的文章生成方法、装置、存储介质、电子设备及计算机程序产品,该方法包括:获取用户输入的写作指示信息;根据大语言模型和写作指示信息,确定至少一个写作要求;根据大语言模型和写作要求,确定至少一个关键撰写项以及每个...
  • 本发明提供一种语音识别模型的训练、语音识别方法、装置、设备及介质,其中方法包括:获取初始编码器;基于不同语种下语音的语种共享表征和/或语种特定表征,对初始编码器进行预训练,得到预训练编码器;基于预训练编码器,构建预训练识别模型;对预训练...
  • 本申请公开了一种语音识别模型的训练方法、语音识别方法和相关装置,该方法包括:获取若干样本音频段;利用语音识别模型分别对各样本音频段进行特征提取,得到各样本音频段的音频特征和至少一个场景特征,场景特征用于表征样本音频段的说话人、采集通道和...
  • 本发明提供一种问答方法、装置、电子设备和存储介质,其中方法包括:获取待查询问题;基于预设向量检索库,获取所述待查询问题相关的至少一个目标片段向量,所述预设向量检索库基于知识库中各文档的文本内容构建得到;基于所述知识库,获取各目标片段向量...
  • 本申请实施例公开了一种语音识别方法、装置、设备及存储介质,对语音进行特征提取,得到语音的各个语音帧的特征;通过端到端网络对各个语音帧的特征进行编码,得到各个语音帧的编码特征;通过端到端网络对各个语音帧的编码特征进行解码,得到多个字序列;...
  • 本申请提供一种关键点追踪方法及装置,包括:获取第一待处理图像的第一特征向量,第一待处理图像包括目标对象,第一特征向量包括目标对象中关键点的特征向量;根据第一待处理图像和第二待处理图像之间的时序关系以及关键点之间的空间关系,对第一特征向量...
  • 本发明提供一种目标检测方法、装置和设备,该方法包括:根据相机图像,获取监控视角图像和鹰眼视角图像;根据监控视角图像和鹰眼视角图像,生成鸟瞰视角BEV特征;将BEV特征输入至目标检测网络,得到目标检测结果;目标检测网络用于基于BEV特征进...
  • 本发明涉及智能语音交互技术领域,提供一种语音交互方法、系统、设备及存储介质,该方法通过确定当前识别结果在历史轮次中的重复次数,并将重复次数作为判断依据,不仅可以避免用户多次输入导致体验感降低的情况发生,还可以避免因系统超时设定导致脱离语...
  • 本发明提供一种控制方法、电子设备、遥控器和存储介质,其中方法包括:接收遥控器广播的控制指令,所述遥控器设置有射频标签;响应于所述控制指令,进行射频标签读取;将读取所得的标签信息,与所述控制指令中的遥控器信息进行匹配,在匹配成功的情况下,...
  • 本发明提供一种语音识别方法、装置、电子设备和存储介质,其中方法包括:获取待识别语音;基于语音识别模型,对所述待识别语音进行语音识别;所述语音识别模型是联合基于语音的音素识别任务和/或基于音素的文本生成任务,以及语音识别任务训练得到的。本...
  • 本申请公开了一种文档切分方法、电子设备及计算机可读存储介质。该文档切分方法包括:基于输入文档的段落对输入文档进行切分,以获取多个文档段落;分别获取每一个文档段落的字数和/或语义信息;基于字数和/或语义信息对每一个文档段落进行调整,以使调...
  • 本申请公开了一种合同处理方法、装置、电子设备和计算机可读存储介质,该方法包括:获取与用户之间的对话;对对话进行分析得到合同处理信息;其中,合同处理信息包括合同内容信息和合同处理指令;按照合同处理指令对合同内容信息进行处理,得到合同处理结...
  • 本申请公开了一种基于生成对抗网络的语音唤醒方法、装置、存储介质、电子设备及计算机程序产品,该方法包括:获取待识别的目标语音数据;对目标语音数据进行声学特征提取,得到目标声学特征;将目标声学特征输入语音识别模型中进行处理,语音识别模型包括...
  • 本发明提供一种车辆驾驶控制方法、系统、电子设备及存储介质,涉及车辆控制技术领域,该方法包括:获取目标车辆内的驾驶员的多项体征数据和驾驶员的多项医疗数据;根据各体征数据和各医疗数据,确定驾驶员在各驾驶能力类别标签下的概率值,根据概率值,获...
  • 本申请提供了一种暴力破解检测方法和相关装置,在预设的检测时间窗口内,每接收到网络流量捕获设备捕获的一个网络传输数据包时,检测网络传输数据包是否为登录失败的登录请求数据包,若是,则提取网络传输数据包中的预设字段,以相同预设字段为分组依据对...
  • 本申请提出一种文本处理方法、终端设备以及计算机存储介质。所述文本处理方法包括:获取输入问题信息;基于所述输入问题信息,提取问题关键文本;获取当前问答模式的检索参数和语义参数;根据所述检索参数获取所述问题关键文本对应的文档信息和/或文段信...
  • 本申请公开了一种标注信息的决策方法、系统以及相关装置,该方法包括:获取待标注数据对应的多个标注结果;其中,至少部分所述标注结果是利用分析模型进行标注得到的;从多个所述标注结果中获取多个相互区别的验证组合;其中,所述验证组合中包括相互区别...