科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本申请提供一种三维点云构建方法、装置、电子设备及存储介质,所述三维点云构建方法,通过对第一分辨率的三维点云进行点云区域划分,并在划分得到的点云区域的基础上,分别对各区域的点云进行第二分辨率的三维点云重建,上述的处理过程将高精度三维点云构...
  • 本申请提出一种虚拟人交互方法、装置、电子设备及存储介质,通过对目标对象的音视频数据进行视线追踪和情感分析,确定目标对象的视线轨迹特征和情感状态;根据目标对象的情感状态和虚拟形象的当前情感状态,预测虚拟形象的下一时刻情感状态;根据目标对象...
  • 本申请提供了一种脸部绑定方法、装置、设备及存储介质,涉及人工智能技术领域,具体实现方案为:利用获取到的目标对象的脸部图像,在目标对象对应的三维人脸模型中确定三维人脸模型的脸部特征区域;在脸部特征区域中确定对应的三维人脸模型顶点与脸部骨骼...
  • 本发明公开了一种视频字幕翻译方法、装置以及设备,视频字幕翻译方法包括:提取视频中的至少一个第一视频帧和/或第一视频帧序列;依据至少一个第一视频帧和/或第一视频帧序列确定视频所属的场景类型下的领域类型;依据场景类型下的领域类型对视频进行转...
  • 本申请实施例提供了一种语音识别方法、装置、设备及存储介质,所述方法包括:获取待识别语音数据和目标面部图像数据;其中,所述待识别语音数据包括目标用户的语音数据,所述目标面部图像数据至少包括所述目标用户的唇部区域之外的面部图像数据;至少根据...
  • 本申请公开了一种混合语种语音识别方法、装置、系统及存储介质,其中,该混合语种语音识别方法包括以下步骤:获取待识别语音信息;对所述待识别语音信息进行语种识别,以确定所述待识别语音信息的语种信息;当所述语种信息包括目标语种时,将所述待识别语...
  • 本申请提出一种基于语音的图像驱动方法、装置、电子设备及存储介质,方法包括:预测目标语音对应的口唇偏移数据和目标语音对应的头部运动数据;根据目标语音对应的口唇偏移数据和目标语音对应的头部运动数据,对待驱动面部图像的各个面部关键点进行位置变...
  • 本申请提供一种虚拟角色模型处理方法、装置、电子设备及存储介质,所述虚拟角色模型处理方法,在获得具有目标纹理的参考图像,以及虚拟角色三维模型的二维图像后,基于对参考图像的纹理编码和对二维图像的结构编码,获得参考图像的目标纹理特征编码和二维...
  • 本申请公开了一种清洁机器人及其控制方法、装置、设备及存储介质,通过设置视觉识别模块,能够采集清洁机器人周围环境的图像(包括地面),进一步能够识别环境图像中各地面区域的材质类型,并确定各地面区域的位置信息。本申请可以预先根据每种类型材质的...
  • 本申请提供了虚拟形象的生成方法、装置、设备及存储介质,具体实现方案为:基于获取到的表达信息确定情绪特征以及脸部特征;基于所述情绪特征对特定视频序列进行情绪编辑处理,得到具有所述情绪特征的视频序列;其中,所述特定视频序列,包括特定对象的包...
  • 本申请提供一种训练数据的处理方法、装置、设备以及可读介质,通过从分类模型可分类出的多个类别中,选取出多个重点优化类别。然后至少根据第一筛选条件,从候选样本集中筛选得到训练样本数据。其中,第一筛选条件为所要筛选出的候选样本数据的类别与任意...
  • 本申请提供了一种新词发现方法和装置、计算机设备、存储介质,解决了现有技术中新词发现过程数据查找速度较慢的问题。其中,新词发现方法包括:采用树形存储结构对获取到的多个n元词语进行存储,多个n元词语是对预定文本序列进行n
  • 本申请公开了一种语音交互方法及相关装置、语音交互设备和存储介质,其中,语音交互方法包括:获取待交互对象的人脸认证结果,并响应于人脸认证结果包括认证成功,将语音交互功能置为有效,且在语音交互功能的有效时段内,与待交互对象进行语音交互。上述...
  • 本申请公开了一种音频处理装置,包括主控电路、音频编解码模组,主控电路包括数据端;音频编解码模组包括音频总线电路,顺序连接的音频输入电路、音量调节电路和模数转换电路,及顺序连接的数模转换电路、混音电路和音频输出电路,且音频总线电路的外接端...
  • 本发明提供一种情绪识别方法、装置、电子设备和存储介质,其中方法包括:确定至少两个模态的待识别数据;基于各个模态的情绪识别模型,确定各个模态的待识别数据的情绪概率分布;基于各个模态的情绪概率分布,确定情绪识别结果;情绪识别模型用于对对应模...
  • 本申请涉及麦克风技术领域,具体提供了一种麦克风的防风罩及麦克风,防风罩包括有:罩壳,罩设于麦克风本体的咪头,并设有与咪头相对的收音孔;对接凸起,设在罩壳上并插紧于麦克风本体的对接孔;其中,用于被对接凸起插入的对接孔为非音频孔。本申请提供...
  • 本申请提供了一种扫描设备,包括有:壳体、扫描模组及显示屏;滚轮模组,包括转动设置在壳体上的滚轮键,并至少对显示屏、显示内容、音频信息中的任意一者或任意组合进行控制,与控制主板通信连接以使滚轮键的转动信号转化为操控指令。本申请提供的扫描设...
  • 本申请提供了一种壳体组件、电子设备,壳体组件包括:第一壳体,包括主体部以及一体成型于所述主体部一端的端头部;第二壳体,能与所述主体部和所述端头部拼合以形成安装内腔;其中,所述主体部和所述端头部围成用于供伸缩件进出的环形通道。上述结构的壳...
  • 本申请提供了一种扫描笔,包括:壳体;显示屏,设置在所述壳体上;触控式键组件,用于对所述显示屏和/或显示内容进行操控,并包括设置在所述壳体上的触控键。上述的扫描笔,在壳体上设置了触控式的功能键,使得扫描笔增加了对显示屏和/或显示内容的控制...
  • 本申请提供了一种触头和电子设备,触头包括有:主体,为筒状,一端形成有用于与载体接触的抵接端口;视窗,由主体上的透明区域形成,并延伸至抵接端口,以供查看载体上的内容。本申请提供的触头,视窗设在其主体上并与主体形成一个整体构件,简化与外壳的...