科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4665项专利

  • 本申请实施例提供了一种视频处理方法、装置、设备及存储介质。该方法包括:根据任一视频的内容摘要信息,生成所述视频的关键词标签、至少一个候选封面底图和每一候选封面底图的标题内容;根据所述关键词标签和每一候选封面底图的标题内容,对所述候选封面...
  • 本发明提供一种语音识别方法、装置、电子设备及存储介质,涉及自然语言处理技术领域,采用的目标自动语音识别模型通过当前文本前缀序列生成上下文语义表征,并将上下文语义表征与当前文本前缀序列以及声学特征结合,通过自回归方式逐步预测得到目标文本序...
  • 本申请公开了一种语音识别方法、设备及计算机程序产品,该方法包括:首先利用预训练的卷积层提取出目标语音的第一声学特征;然后将第一声学特征输入预训练的Dynamic Mask模块,自适应生成目标语音在其所属识别模式(如实时识别模式或非实时识...
  • 本发明提供一种多模态问答方法、装置、电子设备、存储介质和程序产品,涉及人工智能技术领域。该方法包括:获取多模态问题;基于文本的文本特征和图像的图像特征,确定多模态问题的问题类型;基于问题类型,确定文本特征的文本权重,以及图像特征的图像权...
  • 本发明提供一种角色分离方法、装置、设备及存储介质,涉及人工智能技术领域,其中方法包括:确定待分离的音频数据的音频转折点,并根据音频转折点对待分离的音频数据分割,得到至少两个音频段;对于每个音频段,获取音频段对应的第一声纹特征及第一转录文...
  • 本发明涉及语音处理技术领域,提供一种韵律迁移方法、装置、电子设备和存储介质,其中方法包括:获取基于源韵律语音的已解耦韵律特征,以及基于目标说话人语音的已解耦音色特征,其中,已解耦韵律特征表征源韵律语音的韵律,已解耦音色特征表征目标说话人...
  • 本申请公开一种三维场景生成方法及相关装置,涉及计算机技术领域,包括:获取场景描述数据,根据场景描述数据生成目标场景图,目标场景图的节点代表物体实例,边代表对应的两物体实例间的空间关系,通过预训练的布局优化模型基于目标场景图进行空间布局优...
  • 本发明涉及人工智能技术领域,提供了一种试题评分方法、模型训练方法、装置和电子设备,其中评分方法包括确定待评分的试题,以及试题的标准答案和学生答案;将试题及其标准答案和学生答案输入至第一评分模型,得到第一评分模型输出的学生答案的第一评分;...
  • 本发明提供一种语音解码方法、装置、电子设备及存储介质,其中方法包括:基于待解码语音中上一语音帧的解码路径及其路径分数,对当前语音帧进行解码,得到所述当前语音帧的当前解码路径及其路径分数;对所述当前解码路径中的目标路径的路径分数进行抑制调...
  • 本技术涉及双屏电子设备技术领域,提供一种电子设备,包括:铰链机构、限位机构、第一屏幕和第二屏幕。铰链机构包括基座和两个摇臂,两个摇臂可转动地设置于基座。限位机构分别与两个摇臂连接,限位机构用于在两个摇臂展开至预设展开角度时锁定两个摇臂。...
  • 本申请公开涉及电子设备技术领域,具体涉及一种电子设备,包括:第一穿戴装置,可穿戴在人体的第一部位上;第二穿戴装置,与第一穿戴装置通信连接,并可穿戴在人体的第二部位上,第二穿戴装置包括信息输入部件,信息输入部件用于输入信息,并将输入信息发...
  • 本技术涉及风机测试技术领域,提供一种风机性能测试设备,包括:箱体、风阀、风压传感器及流量传感器,箱体具有进风口、出风口以及风道,风道连接进风口和出风口,进风口被配置为安装待测风机;风阀设于风道的第一节段和第二节段之间,风阀被配置为能够进...
  • 本技术涉及智能学习设备技术领域,提供一种作业批改设备,包括:设备本体、处理器和广角摄像头。设备本体被配置为设于用于放置待批改作业的平台上。处理器和广角摄像头分别设置于设备本体,广角摄像头被配置倾斜向下朝向平台设置,并与处理器通讯连接。广...
  • 本技术涉及电子设备技术领域,提供一种摄像模组与电子设备。摄像模组包括底座、翻盖、摄像头、驱动件和阻尼结构;摄像头设于翻盖,翻盖可转动地设于底座,驱动件和翻盖连接,以驱使翻盖相对于底座翻转;阻尼结构设于翻盖和底座之间,在驱动件处于关机或待...
  • 本申请公开了一种策略网络优化方法及相关装置,涉及人工智能技术领域,本申请采用至少包括基础奖励和认知奖励的奖励函数对策略网络进行深度强化学习,是多目标协同的强化学习,能够同步提升推理链中评分准确性与可解释性,优化推理链的生成,为实现更智能...
  • 本申请公开一种口语评测方法、口语评测装置、电子设备及存储介质,该方法包括:获取到待识别语音数据;利用编码器对所述待识别语音数据进行编码,得到音频编码数据;基于指导数据构建指导数据库;其中,所述指导数据包括通用词典和试卷资源中的至少一种;...
  • 本申请公开了一种视线估计方法、相关装置及视线追踪系统,涉及计算机视觉技术领域,视线估计方法包括:获取目标面部图像;对目标面部图像提取表征目标面部图像中视线信息和头姿信息的第一目标特征;利用多个不同的混合专家模型分别处理第一目标特征,以得...
  • 本技术涉及手写笔测试技术领域,提供一种手写笔测试设备,包括机械手、上位机和测试装置。机械手和测试装置均与上位机通讯连接。测试装置具有触摸屏和配对模块,机械手用于抓握手写笔。上位机用于向机械手输出测试指令,机械手用于根据测试指令控制手写笔...
  • 本申请公开了车辆控制系统以及车辆,车辆控制系统包括:车机;汽车功放组件,与车机连接,用于接收车机发送的初始音频信号,并对初始音频信号进行放大,得到第一超声波信号;扬声器,设置于车辆外部,与汽车功放组件连接,用于接收第一超声波信号并进行输...
  • 本申请公开了一种降噪系统。降噪系统与发声设备连接,至少包括:主设备,与所述发声设备连接,靠近噪声源且远离所述发声设备;其中,所述主设备被配置为从所述噪声源采集噪声源信号,基于所述噪声源信号获取并发送目标降噪参数给所述发声设备;所述发声设...