科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本发明公开了一种图像分类方法及系统,包括:获取待测图像;利用图像库中各类别的原始训练样本进行图像重构,得到表示所述待测图像对应每个类别的第一重构图像;根据预设标准,利用所述待测图像与各类别的所述原始训练样本构建相应的补充训练样本;利用各...
  • 本申请提供了一种信息提取方法及装置,依据在待处理图像中查找到的与参照区域相似的区域的位置信息,矫正模板信息,再使用矫正的模板信息从待处理图像中提取信息。因为参照字符为模板图像和待处理图像中的内容,而非为矫正设置的定标点,所以,与常见的定...
  • 本申请提供了一种文本区域划分方法、装置、设备及存储介质,方法包括:获取待划分文本区域的图像作为目标图像,划分文本区域包括多个标识和多个标识分别对应的文本区域,待划分文本区域中的每行文本对应至少一个标识;对目标图像进行粗分割处理,获得多个...
  • 本申请提供了一种数学公式识别方法、装置、设备及存储介质,方法包括:获取目标对象,目标对象包括多行文本,目标公式为多行文本中的一行;将目标对象基于输入轨迹进行分行处理,将目标公式所在行作为待识别对象;从待识别对象中识别出每个字符以及每个字...
  • 本申请公开了一种数据筛选方法及装置,该方法包括:基于对数据特征的学习需求,采用预设的筛选策略在待筛选的数据集合中进行数据筛选,得到筛选数据,其中,该筛选数据中携带了未学习到的数据特征。可见,基于对数据特征的学习需求,预先制定数据筛选策略...
  • 本申请公开了一种表情推荐方法及装置,该方法包括:在接收到用户通过输入法输入的数据后,识别出该输入数据中蕴含的用户情绪状态,接着,根据用户的情绪状态向用户推荐符合其情绪状态的表情序列,该表情序列中包括了至少一个表情表达结果。可见,本申请可...
  • 本发明提供了一种时间同步方法和装置,该方法包括:接收推荐定位信息GPRMC数据包;确定GPRMC数据包的接收时间;根据接收时间以及PPS信号的触发时间,计算第一时间戳;若接收到PPS信号,则控制摄像头曝光;接收摄像头拍摄的图像数据;将第...
  • 本申请公开了一种声纹信息提取模型生成、声纹信息提取的方法和装置,该方法包括:获得表征训练语音数据时域与频域特性的第一训练语谱序列;打乱第一训练语谱序列的时序获得第二训练语谱序列;基于训练用户标识利用卷积神经网络对第一训练语谱序列和对应的...
  • 本申请提供了一种基于声纹识别的身份认证方法、装置、设备及存储介质,方法包括:获取目标标识的关联标识信息,目标标识的关联标识信息至少包括:在预设时间段内,与目标标识直接或间接产生联系的标识组成的目标标识集合;基于目标标识的关联标识信息,确...
  • 本申请公开了一种交互式文本翻译方法及装置,该方法包括:先获取待修正的目标文本,该目标文本是对源文本进行翻译后的文本,然后检测用户是否对该目标文本进行了人工修正,若是,则在人工修正后的文本的基础上进行自动修正,得到修正后的翻译结果。可见,...
  • 本实用新型公开了一种带有桌板固定装置的麦克风阵列会议话筒及会议桌,会议话筒包括外壳和设置在外壳内的麦克风阵列;所述外壳包括用于与会议桌的桌板底部配合的上壳;桌板固定装置,设置在所述上壳远离所述桌板底部的一侧,用于将所述上壳固定在所述桌板...
  • 本实用新型提供一种智能设备的底座,属于支撑件技术领域。该底座包括壳体,壳体内部设置有两种充电装置,壳体上设置有充电端,充电端用于与智能设备连接并承载智能设备,充电端分别与两种充电装置连接,两种充电装置可通过充电端分别与智能设备充电及数据...
  • 本申请提供了一种音频系统,音频节点i与音频节点i‑1通过音频总线连接,音频总线包括信号线和电源线,信号线用于传输音频信号,电源线用于音频节点i‑1为音频节点i供电。基于上述供电结构,因为供电与信号传输分离,所以,在一个音频节点为另一个音...
  • 本申请提供了一种书写板装置及系统,在书写板的边框之上设置激光雷达,用来获取书写主体在书写板上的位置数据。驱动模块用于控制该激光雷达的工作状态,以及解析该位置数据得到书写轨迹图像并发送至图像识别模块。图像识别模块对多个书写轨迹图像进行图像...
  • 本发明提供了一种视频播放控制方法和装置,所述方法包括:获取用户类型与视频播放规则之间的映射关系;当接收用户操作指令时,和/或,基于预设间隔时长采集当前用户图像时,识别出当前用户类型,提取所映射的视频播放规则;采用所述视频播放规则进行视频...
  • 本发明公开了一种问询处理方法及系统,其中,所述处理方法包括:在对目标回答人进行问询时,实时将问答语音进行转写,得到以问答对为单位的问答文本;根据所述问答文本中问答对的单词数和句子数,实时计算当前问答对的复杂度;结合当前问答对的复杂度,获...
  • 本申请提供了一种面部动画生成方法、装置、设备及可读存储介质,其中,方法包括:获取目标音频数据;基于面部参数预测特征预测目标音频数据对应的面部动画参数,其中,面部参数预测特征从目标音频数据中提取,面部参数预测特征包括声学特征,以及,发音特...
  • 本申请公开了一种文档修正方法、装置、设备及可读存储介质,本申请获取修正版纸质文档的第一图像,所述修正版纸质文档为对原始纸质文档按照预设的修正规则添加修正标记后得到,识别所述第一图像中所述修正标记对应的图像区域,进一步参考所述修正规则,对...
  • 本申请公开了一种用于测量麦克风阵列声学响应的系统,该测量系统包括可旋转装置、滑轨、以及通过连接件与滑轨连接的一个扬声器设备,其中的可旋转装置用于带动麦克风设备进行旋转。可见,通过改变可旋转装置的旋转位置以及改变扬声器设备在滑轨上的位置,...
  • 本申请公开了一种婴儿啼哭原因的预测方法及装置,该方法包括:首先,通过对目标婴儿的音频和视频进行同步录制,获取目标婴儿在啼哭时段内的原始音频数据与原始视频数据,并分别作为目标音频数据与目标视频数据,其中,原始视频数据包括目标婴儿的面部特写...