科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4665项专利

  • 本申请公开了一种流式语音同传方法、相关设备及计算机程序产品,本申请对于实时获取的流式文本,从中确定当前待合成文本,并确定待合成文本的语义情况,语义情况表示了文本的语义完整程度。当确定流式文本产生积压的情况下,可以根据流式文本的积压程度和...
  • 本申请公开了一种辅学交互方法及相关装置、学习机,其中辅学交互方法包括:响应于学习机检测到学习者的讲解请求指令,基于讲解请求指令具体请求的目标题目和讲解需求,从学习机对试题载体的拍摄图像中进行内容提取,得到待讲解的目标内容;在学习机的讲解...
  • 本申请公开了一种对话管理方法及相关装置,涉及人工智能技术领域,本申请通过构建对话线程池,将用户的每一个对话意图(任务、问答和闲聊)都抽象为一个“对话线程”,并持续维护各个对话线程的状态,在对话过程中,基于各个对话线程的状态,智能决策待处...
  • 本申请实施例提供了一种音频合成方法、装置、介质以及设备,涉及语音合成技术领域。该方法包括:获取待音频合成的目标文本;将上述目标文本拆解为多个语义完整的文本单元,得到任务序列;对于上述任务序列中第i个文本单元,在执行音频合成任务之前,获取...
  • 本发明提供一种语音唤醒方法、装置、电子设备及存储介质,属于数据处理技术领域,包括:根据唤醒语音确定头转向角度,头转向角度为唤醒语音的直面方向与待唤醒设备之间的位置夹角;将头转向角度发送至控制终端;接收并响应唤醒指令,唤醒指令是控制终端确...
  • 本申请公开了一种基于R5核实现车载音频DSP功能的相关方法、系统及程序产品,通过使用编辑文本的方式来实现车载DSP音频功能的开发定制,用户可以根据产品需求定制DSP软核文本文件,将定制的DSP软核文本文件编译为二进制文件,同时,将音效库...
  • 本申请公开了一种声音复刻方法及相关装置,涉及语音合成技术领域,包括:获取音频合成文本、目标参考音频和属性控制信息,获取属性控制信息中的至少一个属性对应的韵律特性信息,根据韵律特性信息和音频合成文本进行表征融合处理,得到韵律增强文本表征,...
  • 本申请公开了一种报告生成方法、相关设备及计算机程序产品,通过调用大模型将复杂的报告生成类用户问题分解为多个子任务,降低单个子任务复杂度。本申请预先配置了多智能体集合,可以指示大模型从智能体集合中选取与每个子任务适配的智能体,调用智能体分...
  • 本申请公开了一种写作辅助方法和装置、电子设备及存储介质,其中,写作辅助方法包括:在与目标对象的当前交互轮次下输出关于待写作要求的当前引导问题;接收目标对象对当前引导问题的当前回应内容;基于当前回应内容和当前交互轮次之前历史交互轮次下的历...
  • 本发明提供一种元音恢复方法、装置、电子设备和存储介质,属于自然语言处理技术领域,包括:获取第一待处理文本,第一待处理文本包括需要恢复元音的第一文本;将第一待处理文本输入至元音恢复模型进行多变音符标签同步预测,得到元音恢复模型输出的预测标...
  • 本申请公开了一种交流辅助方法及相关装置、系统和介质,其中交流辅助方法包括:获取由第一对象穿戴的交流辅助系统中若干器件各自的采集数据;基于运动数据,建模得到与第一对象的肢体动作语义一致的文字信息,并基于音频数据,建模得到第一对象与第二对象...
  • 本发明提供一种文本分类方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,其中方法包括:获取训练样本集,所述训练样本集包括样本文本及其对应的样本分类标签和样本推理理由;通过所述训练样本集,对第一预训练大语言模型进行微调,得到文本分...
  • 本发明提供一种作答内容归属、试卷批改方法和装置,其中方法包括:对试卷图像进行题框检测、作答区检测和文本行检测,得到试卷图像的实测题框、实测作答区、印刷行和手写行;将与试卷图像对应的模板图像的题框和作答区映射至试卷图像,得到试卷图像的映射...
  • 本申请提供了一种问答处理方法、装置、设备及程序产品,该方法包括:将目标问题输入问答模型,以使所述问答模型生成与所述目标问题对应的答题结果;其中,在所述问答模型的训练过程中,由评语模型为所述问答模型提供对应所述问答模型的推理步骤的评语反馈...
  • 本申请公开了一种声反馈消除方法、装置、设备和存储介质,该方法包括:获取麦克风阵列采集的至少一路目标麦克风信号;目标麦克风信号包括原始声源信号和扬声器的目标反馈信号;对于各目标麦克风信号,利用声反馈抑制模型对目标麦克风信号进行预测,得到目...
  • 本申请公开了一种输入方法及相关装置、电子设备和存储介质,其中输入方法包括:响应于输入过程中选词上屏的第一字符序列,获取若干映射规则;其中,映射规则包括第二字符序列和关联于第二字符序列的视觉图案;基于第一字符序列分别与各个映射规则中第二字...
  • 本申请公开了一种语音合成方法及相关装置、设备和介质,其中语音合成方法包括:基于待合成的第一子文本,提取得到第一子文本的第一文本词元特征,并获取第二子文本的第二文本词元特征和预测语音词元特征;基于各个第二子文本的第二文本词元特征和预测语音...
  • 本申请公开了一种文本分块方法、装置,该方法包括:获取目标文本对应的目标图像;其中,所述目标文本包括若干文本行;从所述目标图像中提取各所述文本行的第一图像特征,并利用所述目标图像的文本识别结果,获取各所述文本行的语义特征;其中,第一图像特...
  • 本发明提供一种动态策略选择方法、装置、系统、电子设备及存储介质,涉及智能决策技术领域,该方法借助于大语言模型的图像理解能力,对历史数据图像、历史时序数据以及历史趋势特征等多模态数据进行自动化与智能化分析,可以实现目标策略及其优先级的自动...
  • 本发明提供一种声源定位、语音唤醒方法和装置,声源定位方法包括:获取麦克风阵列采集到的声音信号;基于车辆的座舱开合状态,提取所述声音信号的语谱特征或空间特征作为所述声音信号的定位特征;基于所述定位特征对所述声音信号进行声源定位。本发明提供...