科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本申请公开了一种文档比对结果的优化方法、装置、设备以及存储介质,文档比对结果的优化方法包括:获取第一文档和第二文档的初始比对结果,初始比对结果中包括若干初始差异项;确定各初始差异项在目标文档中所处的目标片段,目标文档为第一文档或第二文档...
  • 本公开披露一种直播方法及装置、存储介质及电子设备,涉及计算机应用技术领域。该直播方法包括:在主播的直播过程中,获取观众问题;将观众问题与至少一个预设问题进行匹配,得到观众问题对应的预设问题;基于观众问题对应的预设问题、预设问题对应的预设...
  • 本申请提出一种基于语音的动作生成方法、装置、电子设备及存储介质,该方法包括:确定目标语音中包含的动作意图,并确定与所述动作意图相匹配的第一动作序列;以及,从所述目标语音中提取得到语音韵律特征,并基于所述语音韵律特征预测得到与所述语音韵律...
  • 本申请实施例公开了一种语音处理方法、装置、设备及存储介质,先判断语音数据是否属于噪声,在语音数据不属于噪声的情况下,再对语音数据进行语音识别,除了得到语音识别结果外,还得到语音识别结果的置信度,判断语音识别结果是否属于目标场景对应的指令...
  • 本申请提出一种语音解码处理方法、装置、电子设备和存储介质,在音频识别系统输出的当前音频声学输出所对应的所有解码候选中存在空白解码候选的情况下,判断当前音频声学输出是否为空白输出。在不能确定当前音频声学输出是空白输出的情况下,本申请不采用...
  • 本申请公开了一种语音合成方法、装置、设备及存储介质,本申请预先配置有声学信息生成模块,该声学信息生成模块能够基于从待合成文本中提取的音素,以生成能够用于预测待合成文本所属的情感类型的声学信息为方向,生成与所述音素匹配的声学信息,进而基于...
  • 本发明提供一种语音识别方法、装置、人机交互设备和存储介质,其中方法包括:确定待识别语音所处环境的环境视频;基于所述环境视频的视频描述文本,对所述视频描述文本进行实体抽取,并基于实体抽取结果更新关键词库,和/或,对所述视频描述文本进行实体...
  • 本申请公开了一种说话人表征向量分布空间创建、语音合成方法及相关设备,本申请获取指定说话人的声音特点描述文本;将声音特点描述文本输入至预训练的向量分布预测模型,得到模型输出的具有与声音特点描述文本对应声音特点的说话人表征向量的分布空间;其...
  • 本申请公开了一种目标检测方法及相关装置、电子设备、存储介质,其中,目标检测方法包括:在待检测图像检测主目标,得到主目标的第一候选框,并在待检测图像分别检测若干辅目标,得到各个辅目标的第二候选框;其中,若干辅目标属于主目标;并将主目标的任...
  • 本发明提供一种引体向上测评方法、装置、电子设备及存储介质,其中方法包括:获取待测视频流;基于所述待测视频流中当前帧的人员骨骼点位置信息,确定所述当前帧所处的状态,所述状态为准备状态、向上状态和向下状态中的任意一种;在所述当前帧所处的状态...
  • 本申请公开了一种推荐系统的排序方法、装置、设备及可读存储介质。该方案中,先确定用户的特征数据,以及与用户对应的多个待推荐对象的特征数据;再构建特征数据对,每个特征数据对中包括用户的特征数据和一个待推荐对象的特征数据;然后,针对每个特征数...
  • 本申请公开了一种向量检索方法、装置、设备及可读存储介质,预先构建被检索向量的索引信息,该索引信息包括被检索向量的均值向量、基底向量、被检索向量去除均值向量后在每个基底向量上的投影值,以及各个投影值对应的索引标识,在获取待检索向量之后,针...
  • 本申请涉及扫描技术领域,提供了一种扫描装置。该扫描装置包括:扫描口,开设在壳体上;扫描部件,包括摄像头和控制器;还包括:尺寸调节模块,能够调节扫描口的长度尺寸,和/或,标定调节模块,能够向待扫描对象投射标识,以使控制器根据标识从拍摄图片...
  • 本申请提供了一种翻译设备,包括:主体,具有第一安装面和第二安装面;第一处理系统,具有第一摄像头、第二摄像头、信息处理模块和扬声器,第一摄像头设置在第一安装面,第二摄像头设置在第二安装面,第一摄像头、第二摄像头、扬声器与信息处理模块通信连...
  • 本申请提供了一种支架、功放结构总成及音响设备,支架包括主架台和安装脚,主架台的边缘上设有若干个缺口,主架台的边缘内设有若干条应力分散条,安装脚设有若干个且均与主架台固定连接,安装脚与主架台的连接处两侧中至少其中一侧存在缺口,每个缺口与至...
  • 本发明公开了一种基于流式图像的手势识别模型训练方法、装置及电子设备,本发明的主要构思在于,一方面通对连续帧图像进行信息流式读取、特征流式提取、结果流式输出,使得训练过程接近真实的应用场景,消除了训练与推理不匹配问题,使得训练过程更接近实...
  • 本发明提供了一种文本识别方法、翻译方法及相关设备,其中,文本识别方法包括获取目标文本行图像;基于目标文本行图像和预先训练得到的识别模型,确定目标文本行图像对应的编码序列,其中,识别模型采用多个语种的标注有编码序列的训练文本行图像训练得到...
  • 本申请公开了一种数据同态加密推理系统及方法,由数据方生成同态加密的秘钥,采用公钥对待推理数据进行同态加密后发送给评估方,将公钥发送给模型方,模型方采用公钥对预训练的数据推理模型的模型参数进行同态加密,并将加密模型参数发送给评估方。由于数...
  • 本实用新型涉及一种车载USB集线器、智能座舱和车辆,其中,车载USB集线器包括:多个USB接口,多个USB接口中的至少一个为带有第一充电协议的第一USB接口;支持第一充电协议的USB扩展芯片,USB扩展芯片的输入端适于连接车载SOC芯片...
  • 本发明提供一种隐私求交方法、装置、电子设备和存储介质,其中方法包括:获取各方的隐私数据;基于各属性的局部阈值,对各属性在各方的隐私数据中的属性值进行匹配,得到各属性的初始匹配结果,局部阈值是基于对应属性的缺失错误率确定的;基于各属性之间...