科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本申请公开了一种多说话人语音识别方法、装置、相关设备及计算机程序产品,涉及语音识别领域,获取混合语音中每一说话人的说话时间戳信息以及配置的每一说话人的标识向量,生成每一说话人相对于混合语音的嵌入向量表示,融合混合语音的声学特征向量和每一...
  • 本申请实施例公开了一种测试方法、装置、设备、存储介质及程序产品,在利用预先在目标型号的车辆中采集的测试数据集对离线驾驶员监控系统进行测试时,不是直接将由上述车辆中的工装驾驶员监控系统的图像采集装置采集的测试数据输入离线驾驶员监控系统,而...
  • 本申请公开了一种图像生成方法及相关装置,涉及图像处理技术领域,图像生成方法包括:获取目标图像;对目标图像进行去背景处理;获取去背景图像对应的图像描述文本,图像描述文本至少包括去背景图像的内容描述文本;根据去背景图像和去背景图像对应的图像...
  • 本申请公开了一种人机交互方法、装置、相关设备及计算机程序产品,调用通用大模型针对用户提问生成启发式问题,在针对用户回答生成评价时,首先获取启发式问题对应的标准答案,进而调用通用大模型以结合该标准答案生成对用户回答内容的评价,确保了生成的...
  • 本申请公开了一种语音合成方法及相关装置、设备和存储介质,其中,语音合成方法包括:提取待合成篇章文本的篇章韵律特征;其中,待合成篇章文本包含若干句文本;基于篇章韵律特征,切分得到各个句文本的句韵律特征;基于句文本及其句韵律特征,生成得到句...
  • 本申请公开了一种教师画像构建方法及相关装置、设备、系统和存储介质。该方法包括:获取待评测对象参与目标教学活动的操作数据;其中,目标教学活动预设有各级维度评测指标;获取关于目标教学活动中最低级维度评测指标的第一评分,以及基于操作数据进行分...
  • 本申请实施例公开了一种文本识别方法、装置、设备、存储介质和计算机程序产品,对待识别图像进行编码,得到编码特征;对编码特征进行解码,得到待识别图像中的各文本片段;其中,任一文本片段是至少基于该任一文本片段在待识别图像中的位置信息对编码特征...
  • 本申请提出一种网络共享方法、装置、系统、设备及程序产品,该方法应用于共享端设备,包括:获取所述共享端设备的第一网卡和第二网卡的信息;基于所述第一网卡和所述第二网卡的信息,在虚拟机中创建对应所述第一网卡的第一虚拟网卡以及创建对应所述第二网...
  • 本申请提出一种模型训练、说话题评测方法、装置及计算机存储介质。所述模型训练方法包括:获取待评测语音,以及对应的评测内容;提取所述待评测语音的音频序列和文本序列;基于所述音频序列的语音预测特征和所述文本序列以及所述评测内容的语义预测特征,...
  • 本申请公开了一种屏幕盖板及其制造方法、屏幕模组和电子设备,其中,屏幕盖板包括:第一表面,用于盖合于屏幕;第二表面,与第一表面相背设置,并形成有与屏幕的像素点相对设置的凸起部,凸起部面向屏幕的正投影覆盖像素点,且正投影与像素点在至少部分轮...
  • 本申请公开了一种数据求交方法及相关装置、设备和存储介质,其中,数据求交方法包括:基于各个数据项的目标质量指标,选择数据项分别与未被选择的各个数据项合并,作为新的数据项;对于各个新的数据项,基于新的数据项分别在本端中第一数据内的数据内容和...
  • 本发明提供一种文档识别方法、装置、电子设备和存储介质,涉及人工智能技术领域,其中方法包括:获取用户输入的识别需求信息,所述识别需求信息包括至少一个第一待识别要素;针对各所述第一待识别要素,在确定识别模式为精细模式的情况下,基于所述第一待...
  • 本申请公开了一种语言评测方法及相关装置、设备和存储介质,其中,语言评测方法包括:获取目标对象朗读目标文本的音频信息,作为待测音频;获取目标文本的第一发音序列,以及获取待测音频中顺序排列的各个语音段的第二发音序列;基于第一发音序列与语音段...
  • 本申请实施例公开了一种文本识别方法、装置、设备、存储介质和计算机程序产品,对待识别图像进行缩放处理,得到第一图像和第二图像;第一图像小于第二图像;对第一图像进行编码,得到第一编码特征;对第二图像分块进行编码,得到各个图像块的编码特征;将...
  • 本发明提供一种音效调节方法、装置、电子设备和存储介质,涉及音频技术领域,其中方法包括:在目标空间下依次播放对目标音频基于预设时长进行切分后的各第一音频信号;在播放当前第一音频信号时,采集所述目标空间中的第二音频信号;基于所述第二音频信号...
  • 本发明涉及图像识别技术领域,提供一种文档版面分析方法、装置、电子设备及存储介质,该方法中引入了版面信息单元集合,并从中选取待分析文档图像对应的目标版面信息单元,将其对应的待分析文档图像的版面特征结合待分析文档图像的视觉特征,可以丰富待分...
  • 本申请提出一种语音识别方法及相关装置,涉及语音识别技术领域。该语音识别方法可以包括:获取历史信息的第一编码信息;其中,所述历史信息包括:历史语音;获取第二编码信息;其中,所述第二编码信息包括待识别语音段的编码信息;将所述第一编码信息作为...
  • 本申请公开了一种互动教学方法、装置、相关设备及计算机程序产品,响应于进入互动教学场景的指令,展示虚拟人形象选取界面;响应于在虚拟人形象选取界面选中目标虚拟人形象的操作,跳转至互动教学界面,该界面显示有目标虚拟人形象及背景环境;接收在互动...
  • 本申请提出一种模型构建方法、装置、系统、电子设备及程序产品,该方法包括:获取模型构建任务数据,所述模型构建任务数据包括待构建的目标模型所需执行的任务信息以及用于训练所述目标模型的训练数据信息;基于所述模型构建任务数据,通过执行模型推荐算...
  • 本技术涉及电子产品技术领域,提供一种转动支架与电子设备组件。转动支架包括第一架体、第二架体和接口组件;第一架体用于设置第一电子设备,第二架体用于设置第二电子设备;第一架体和第二架体可转动设置;接口组件包括第一接口、第二接口和第三接口;第...