科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本发明提供一种车道线检测方法、装置、电子设备及存储介质,该方法包括:将待检测图像输入车道线检测模型中的特征提取器,得到特征提取器输出的待检测图像的图像特征;在图像特征中提取至少一个目标像素点对应的初始query特征,目标像素点为待检测图...
  • 本发明提供一种代码生成方法、装置、电子设备和存储介质,属于人工智能技术领域,代码生成方法包括:识别目标设计文件中的各个组件和模块,提取各个组件和模块对应的描述信息;根据描述信息,生成目标设计文件对应的代码提示语;将代码提示语输入至代码生...
  • 本申请公开了一种视频分析方法及相关装置、设备和存储介质,其中,视频分析方法包括:基于表征待分析目标的关键词,检索得到关于营销待分析目标的候选视频;其中,待分析目标包括目标产品、目标品牌中至少一者;响应于对候选视频的选择指令,确定被选择的...
  • 本申请公开了一种多意图识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标文本,并确定其所属的目标领域,然后对目标文本进行实体关键词提取,得到表征其关键信息的实体关键词,作为目标语义标签;接着将目标语义标签与预先构建的目标领...
  • 本发明提供一种作答方法、装置、电子设备和存储介质,其中方法包括:接收用户选取的初始试卷;基于初始试卷中各试题所属的知识点,和/或,用户的用户画像,对初始试卷中各试题进行试题分析,得到各试题的试题标签;基于各试题以及各试题的试题标签,生成...
  • 本申请实施例公开了一种语音识别方法、模型训练方法、装置、设备及存储介质,对语音识别模型的训练过程包括两轮自监督预训练和一轮有监督的微调,在第二轮自监督预训练过程中,利用对应不同语义粒度的第一类伪标签计算语音识别模型的不同层的自监督损失,...
  • 本申请公开了一种区块链使用方法、系统、设备及存储介质,本申请设计了一种通用的区块链资源路径标识符,至少包括链ID和操作值,进一步还可以根据用户的不同请求在资源路径标识符中增加参数列表,用户可以通过资料路径标识符来请求对应的区块资源,本申...
  • 本申请实施例公开了一种语音识别方法、模型训练方法、装置、设备及存储介质,对语音数据进行编码,得到语音数据的编码特征,对编码特征进行解码,得到解码特征;该解码特征用于确定语音数据的语音识别结果和语法分类结果,对解码特征进行处理,得到语音识...
  • 本申请提出一种机器人运动控制方法、装置、设备、机器人及存储介质,该方法包括:按照关节位置求解参数,对机器人运动控制指令、机器人自身状态信息和机器人所处环境信息进行关节位置求解运算,得到期望的关节位置;基于所述期望的关节位置,对机器人进行...
  • 本发明提供一种答题模型的训练方法、答题方法及装置,其中,训练方法包括:获取预训练数据、第三试题图像及其对应的第三试题文本和第三答案文本;预训练数据包括第一试题文本及其对应的第一答案文本,以及第二试题图像及其中各文本行的位置和文本内容,基...
  • 本申请公开了一种口语评测方法、装置、设备及存储介质,本申请配置了文本语音对齐模型,该模型的输入为目标音频的音频表征及参考文本,模型被配置为提取参考文本的嵌入表征,并将嵌入表征与音频表征进行拼接,基于拼接表征解码得到对齐结果,对齐结果包括...
  • 本申请公开了一种文图生成方法、装置、设备及存储介质,本申请从输入的描述文本中识别实体描述信息、待显示文本信息及其显示位置信息,其中实体描述信息可以理解为所要生成的图像包含的基础的实体信息,待显示文本信息可以理解为用户希望显示在生成的图像...
  • 本申请公开了一种视频合成方法、装置、设备及存储介质支持多模态条件信息控制下的视频合成,方法包括:获取指定的初始图像,及与待合成视频匹配的多模态条件信息,所述多模态条件信息包括与所述待合成视频匹配的音频信息和/或文本描述信息;提取所述初始...
  • 本申请实施例公开了一种朗读进度跟踪方法、装置、设备及存储介质,对朗读者朗读目标文本时的语音数据进行语音识别,得到语音识别结果及其对应的发音时长序列后,除了基于发音时长序列在目标文本中对语音识别结果进行标记外,还至少根据语音识别结果在目标...
  • 本申请公开了一种语音识别方法、装置、设备及可读存储介质。该方案中,在确定候选语音识别结果之后,针对每个候选语音识别结果,基于候选语音识别结果的实体相关性,以及,与预设实体库中实体的匹配结果,确定候选语音识别结果的最终得分,最后从各个候选...
  • 本申请公开了一种开放式问答方法、装置及相关设备,多模态大模型包括图像编码模块和大语言模型,在回答与目标图像相关的问题文本时,可以调用文本识别算法对目标图像进行文本识别,得到文本识别结果,可以通过大语言模型得到该文本识别结果的特征表示,进...
  • 本申请公开了一种口语复述题测评方法、装置、设备及存储介质,本申请设计的提示指令格式模板包含任务指令、作答文本槽和要点信息槽,任务指令用于指示模型按照各要点信息,对作答文本进行逐个要点的评分及内容诊断,整理成测评结果输出,通过调用大语言模...
  • 本申请提供一种信息处理方法、装置、电子设备及存储介质,该方法应用于多模态大模型,所述多模态大模型包括信息处理模块和多模态融合模块,该方法包括将获取的待检测信息输入至所述信息处理模块进行特征提取,以得到视觉特征和/或文本特征;若提取出的特...
  • 本发明提供一种语音识别模型的训练方法、语音识别方法、装置和设备,该语音识别模型的训练方法包括:获取语音信号和含噪语音信号,所述语音信号和所述含噪语音信号为对同一语音进行采集得到的;分别将所述语音信号和含噪语音信号输入至初始语音识别模型中...
  • 本发明公开了一种模型训练方法、文本识别方法及相关装置,包括:获取包含文本信息的样本图像及其对应的标签信息;将所述样本图像输入至第一模型,以获得上下文特征和文本序列;将所述上下文特征和所述文本序列输入第二模型中,以获取对应的文本预测结果,...