科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本申请提出一种行人轨迹预测方法、装置、电子设备及存储介质,该方法包括:基于第一行人的历史轨迹对应的历史轨迹特征,预测历史轨迹对应的未来轨迹的终点,并确定未来轨迹的终点对应的轨迹终点特征;基于第一行人的历史轨迹特征和轨迹终点特征,预测第一...
  • 本申请公开了一种障碍物状态预测方法、机器人地图构建方法、装置、相关设备及计算机程序产品,本申请获取对障碍物拍摄的二维图像及点云数据,分别提取并融合图像模态特征和点云模态特征得到融合特征,进而可以基于融合特征端到端的预测障碍物的状态信息,...
  • 本发明提供一种教学资源的生成方法、装置、设备和存储介质,该方法包括:在接收到用户输入的第一提示信息的情况下,获取课堂视频;所述课堂视频包括课堂音频和课堂图像;所述第一提示信息用于请求生成教学资源;从所述课堂音频中提取与预设声纹匹配的目标...
  • 本申请提供了对话响应处理方法、装置、设备、存储介质及程序产品,具体实现方案为:根据第一对话内容以及目标提示文本,确定与所述第一对话内容相关的关联需求;其中,所述目标提示文本用于提示挖掘与所述第一对话内容相关的隐含需求;调用所述关联需求对...
  • 本发明提供一种录音方法、装置、电子设备和存储介质,涉及通信技术领域。其中方法包括:在接收到部署于目标录音区域的信号发射设备发射的激活信号后,将录音设备的位置信息发送至云端,以供云端基于位置信息确定录音设备是否处于目标录音区域内;若录音设...
  • 本发明提供一种意图确定方法、装置、设备和存储介质,应用于语音识别技术领域,该方法包括:将待识别音频输入音频识别模型,得到所述音频识别模型输出的识别结果;在实时检测到所述识别结果中包括第一意图节点的情况下,在所述识别结果中获取所述第一意图...
  • 本发明提供一种教学交互方法、装置、终端和存储介质,其中方法包括:获取课堂语音;基于大型语言模型对课堂语音对应的内容进行语义识别得到语义识别结果;在语义识别结果属于资源调度类的情况下,获取与语义识别结果相匹配的教学资源并展示。本发明提供的...
  • 本申请公开了一种音质检测方法及相关装置、设备和存储介质,其中,音质检测方法包括:基于待测音频中的语音段,提取得到目标频谱图;基于目标频谱图,生成代表语音段的第一音频特征;基于第一音频特征中各个元素位置的重要度,编码得到第二音频特征;其中...
  • 本申请公开了一种庭审笔录生成方法、装置、设备及可读存储介质,大语言模型通过预训练、微调、基于人类反馈的强化学习的方式,展现出了巨大的超强的语言理解能力、逻辑推理能力以及生成能力。利用大语言模型对样本庭审语音转写文本进行多轮次规整处理后得...
  • 本发明提供语音交流补偿方法、装置、汽车、电子设备及存储介质,涉及语音增强技术领域,该方法包括:将待处理语音信号输入至自适应反馈抑制模块,得到自适应反馈抑制模块输出的第一中间信号;自适应反馈抑制模块用于去除待处理语音信号中的扬声器信号;将...
  • 本发明提供一种文本位置匹配方法、装置、电子设备和存储介质,其中方法包括:获取待匹配文本的音频,对音频中当前时段的音频段进行发音识别,得到当前时段的识别发音;将当前时段的识别发音与发音图网络中的各节点进行匹配,得到识别发音在待匹配文本中所...
  • 本申请提出一种文本行识别方法、装置、设备、存储介质和产品,该方法包括:当扫描获取的待识别文本图像的长度大于设定长度阈值时,对获取的待识别文本图像进行文本行检测,得到文本行检测结果和单字符检测结果;所述单字符检测结果包括检测到的文本行中的...
  • 本发明提供一种教学交互方法、装置、终端和存储介质,其中方法包括:接收用于图谱生成的触发操作;响应于所述触发操作,获取与所述触发操作相关的教学信息;基于大型语言模型,生成所述教学信息对应的结构化图谱;展示所述结构化图谱。本发明提供的方法、...
  • 本申请公开了一种语音识别方法、装置、相关设备及计算机程序产品,在对目标场景下的待识别语音进行识别时,获取了该目标场景下与待识别语音对应的初始参考信息,示例如对于会议录音识别场景可以获取会议主题信息等作为初始参考信息。进一步,考虑到初始参...
  • 本申请公开了一种口语文本生成方法、语音合成方法及相关装置,该方法包括:获取目标书面文本和提示语,其中,提示语用于指示口语文本生成模型执行口语文本生成任务;利用口语文本生成模型按照提示语的第一指示内容,对目标书面文本执行口语文本生成任务,...
  • 本申请公开了一种语音识别方法、系统和相关装置,该方法包括:获取用户输入的语音数据,基于所述语音数据,获取对应的声学特征;基于历史识别文本对应的语种信息,获取当前识别轮次下与至少一个目标语种匹配的初始识别特征;其中,所述语种信息与历史识别...
  • 本申请公开了一种清洁机器人及其语音控制方法、装置,机器人顶部设置有定向麦克风阵列,不同定向麦克风的拾音方向不同。定向麦克风具有指向性会抑制麦克风轴向后方的噪声,也即能够抑制机器人底部的主要噪声源,提升了采集的原始语音信号的信噪比。由处理...
  • 本发明提供一种点云数据的融合方法、装置、设备和存储介质,该方法包括:获取第一采集车辆采集的第一点云数据和第二采集车辆采集的第二点云数据;第一采集车辆和第二采集车辆之间的距离在行驶方向上位于预设范围内;第一点云数据和第二点云数据的采集时刻...
  • 本发明提供一种教学资源的生成方法、装置、设备和存储介质,该方法包括:获取课堂视频;所述课堂视频包括课堂音频和课堂图像,所述课堂图像包括对教学交互终端的显示屏进行录制后得到的录制图像和基于所述教学交互终端的书写板采集的多个轨迹点序列确定的...
  • 本申请公开了一种个性化对话方法及相关装置、设备和存储介质,其中,个性化对话方法包括:获取第一会话;基于模拟目标对象的个性化对话模型对第一会话进行回复,得到第二会话;其中,个性化对话模型基于目标对象的样本个性化对话数据采用强化学习对第一对...