科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本申请公开了一种文档版面要素检测方法、装置、存储介质及设备,该方法包括:首先获取待检测的目标文档所在的目标图像;然后根据预设版面要素类型,构建预设版面要素对应的编码向量;接着将目标图像和编码向量输入预先构建的文档版面要素检测模型,预测得...
  • 本发明提供了一种表格结构识别方法、装置、设备及存储介质,表格结构识别方法包括:获取目标表格图像;获取目标表格图像在列维度的全局视觉特征和在行维度的全局视觉特征;基于目标表格图像在列维度的全局视觉特征预测表格列线,并基于目标表格图像在行维...
  • 本发明提供了一种交互方法及相关设备和系统,其中,交互方法包括:获取交互区域的多模态信息,多模态信息包括基于多个终端设备中的部分或全部终端设备获取的相对应的图像信息和语音信息;基于多模态信息中的图像信息确定交互区域中是否存在目标用户;若是...
  • 本发明提供一种教学课程生成方法、装置、电子设备和存储介质,其中方法包括:构建中文教学的内容素材库,内容素材库下包括多种教学内容、每种教学内容对应的多个教学项目,以及各教学项目的内容素材;基于中文教材的课文文本内容和课文编排顺序,确定中文...
  • 本申请公开了一种摄像头数据处理方法及摄像头,其中摄像头包括协同模块及与之通信的图像传感器和两个处理器,对于协同模块而言,在启动后可以从正常状态的两个处理器中选择一个作为主处理器,另一个作为从处理器,协同模块可以按照设定检测周期,分别检测...
  • 本发明提供一种交互测试系统、方法和电子设备,该系统包括:多个扬声器;控制单元,所述控制单元用于控制所述多个扬声器中的第一扬声器和第二扬声器分别播放测试噪声和测试语料,所述第一扬声器和所述第二扬声器是基于被测终端的应用场景从所述多个扬声器...
  • 本申请提供了一种学习资源分发方法及装置、可读存储介质及电子设备,涉及数据处理领域。该学习资源分发方法应用于部署于目标教室的超脑,超脑用于提供学习资源分发服务,目标教室中的至少一个教师端、多个学生端以及超脑共同连接同一局域网,该方法包括:...
  • 本申请公开了一种问答推荐方法和装置、电子设备及存储介质。该方法包括获取用户问题文本,并获取知识图谱;基于用户问题文本,分析得到用户问题文本涉及的知识点;基于知识点遍历知识图谱,得到推荐知识点;基于推荐知识点,获得推荐问题文本,和/或,基...
  • 本申请提供了一种文字识别方法、装置、存储介质及电子设备,涉及文字处理技术领域。该文字识别方法包括:对待识别字进行拆解,得到待识别字的偏旁序列,偏旁序列包括至少一个偏旁元素,至少一个偏旁元素组合构成待识别字;若至少一个偏旁元素均各自对应有...
  • 本发明公开了基于web的连续帧点云数据标注方法及装置,方法包括:获取标注请求,响应于标注请求,下载待标注的连续帧点云数据和对应的2D图像数据并将其存储在本地数据库中;获取对连续帧点云数据中的一帧点云数据中对象的初始标注框,基于初始标注框...
  • 本发明提供一种信息显示方法、装置、设备和存储介质,该方法包括:确定并显示与采集的第一图像对应的目标参考图像,所述目标参考图像中包括的印刷体文字与所述第一图像中包括的印刷体文字相同,且所述目标参考图像中不包含手写信息;检测所述第一图像中的...
  • 本申请公开了一种提醒事件执行方法及相关装置、终端设备、存储介质,其中,提醒事件执行方法包括:获取提示事件的内容文本;对内容文本进行语义理解,得到第一理解结果;基于第一理解结果,检测内容文本语义是否可执行;响应于内容文本语义可执行,生成提...
  • 本发明提供一种环境控制方法、系统、装置、电子设备及存储介质,其中方法包括:获取包括当前时刻在内的至少一个时刻的实测环境数据;将所述实测环境数据输入至预测模型,得到所述预测模型输出的各个控制策略下的下一时刻的预测环境数据;所述预测模型是基...
  • 本申请公开了一种语音结束检测方法及相关装置、电子设备、存储介质,其中,语音结束检测方法包括:检测截至当前时刻空白语音的第一持续时长是否不短于第一预设时长;响应于第一持续时长不短于第一预设时长,获取说话人距当前时刻最近的嘴唇状态,且在录音...
  • 本申请公开了一种显示系统及车辆,所述显示系统包括:依次连接的摄像头、处理装置以及显示装置;所述处理装置包括第一子处理装置以及第二子处理装置;其中,所述第一子处理装置与所述第二子处理装置并列设置;所述摄像头、第一子处理装置以及显示装置依次...
  • 本申请提供了拼音输入法的请求方法、装置、设备及存储介质,具体实现方案为:基于输入拼音确定当前输入模式;其中,所述输入模式是由键盘类型、候选解码结果的字长和拼音类型中的至少一种确定的;基于所述当前输入模式确定全消耗候选解码结果的数量阈值;...
  • 本申请提供一种音频识别方法和音频识别模型的训练方法,所述音频识别方法,包括:获取待识别的音频数据;利用预先训练的音频识别模型,对所述待识别的音频数据进行音频识别处理,得到与所述音频数据对应的文本数据;其中,所述音频识别模型基于对第一音频...
  • 本申请提供了一种图像设计方法、装置、存储介质及电子设备,涉及计算机视觉领域。该图像设计方法包括:获取第一设计图像以及第一设计图像对应的修改描述文本;基于第一设计图像对应的修改描述文本,确定与修改描述文本匹配的参考图像;基于参考图像,确定...
  • 本发明提供一种音乐评测方法、装置、电子设备和存储介质,其中方法包括:确定待评测的演唱音频;对演唱音频进行音高提取,得到音高辅助信息,音高辅助信息用于反映演唱音频的音高在音级上的分布情况;对演唱音频的声学特征进行编码,得到音乐编码特征,音...
  • 本发明提供一种软件授权方法、装置、电子设备和存储介质,其中方法包括:获取所述终端所处场景的当前图像;对所述当前图像进行第一场景特征提取,得到当前场景特征;将授权密钥与所述当前场景特征进行匹配,并在匹配成功的情况下,确定软件授权成功;所述...