科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本发明提供一种语音处理方法、装置、电子设备和可读存储介质,涉及语音处理技术领域,所述方法包括:将待检测语音信号对应的原始语音特征输入至不带后视野的语音端点检测模型中,得到原始语音特征中的人声语音特征对应的目标起始端点;将待检测语音信号对...
  • 本申请提供语音合成方法、设备及存储介质,包括:接收云端的待合成文本以及所述待合成文本对应的第一音频流、音素信息,其中所述待合成文本包括若干字符,所述音素信息包括音素;基于第一音频流进行音频播放,并在接收异常时,确定当前播放的音素以及中断...
  • 本发明涉及标签分析技术领域,提供一种影视标签权重确定方法、装置、电子设备及存储介质,该方法结合影视资源库的关系网络,并借助于演职人员的受欢迎程度以及辅助标签权重,可以为每个影视资源的各个标签的权重进行调整,使不同影视资源的相同标签赋予不...
  • 本发明提供一种联邦聚类方法、装置、中心服务器、系统和电子设备,涉及聚类分析技术领域,该方法包括:将联邦聚类模型中目标主聚类网络对应的目标主网络参数发送至每个参与方设备,并接收每个参与方设备传输的目标样本聚类类别,针对每个参与方设备,基于...
  • 本申请公开了一种机器人及其寻桩方法、装置及存储介质,在机器人寻桩过程中,确定待搜索区域内各个房间的第一搜索顺序,按照第一搜索顺序依次对各个房间执行快速搜索动作,包括:控制机器人导航至每一房间内预设的观察点位置进行充电桩的搜索,若在观察点...
  • 本发明提供一种语音合成方法、装置、电子设备和存储介质,其中方法包括:获取待合成的文本,以及控制语音合成的目标情感强度;基于各预设情感档位的档位情感特征,确定所述目标情感强度下的全局情感特征;基于所述文本以及所述全局情感特征进行语音合成,...
  • 本申请实施例公开了一种分布式语音交互方法、系统及分布式中心。其中,该方法包括:接收唤醒设备上传的唤醒词段音频特征和唤醒词时间范围;其中,唤醒设备为多个智能语音设备中被唤醒词唤醒的智能语音设备,唤醒词段音频特征包括第一达到时间差tdoa特...
  • 本发明提供一种语音合成模型的训练、语音合成方法、装置、设备及介质,其中方法包括:获取样本文本,以及所述样本文本对应的样本语音的音素标签;基于初始合成模型,对所述样本文本进行语音合成,得到所述样本文本的预测声学特征;对所述预测声学特征进行...
  • 本发明提供一种语音合成方法、装置、电子设备和存储介质,其中方法包括:对用户语音进行情绪特征提取,得到语音情绪特征;基于语音情绪特征进行情绪浓度表征,得到情绪浓度特征;基于语音情绪特征、情绪浓度特征,以及回复文本,进行语音合成,得到情感合...
  • 本发明提供一种广告投放方法、装置、电子设备和存储介质,通过获取历史轮次下,投放至各媒体的投放成本和点击事件数量;由各媒体的剩余分配数和投放成本确定待消耗成本,以广告投放的剩余成本和待消耗成本之间的关系为约束,以各媒体的剩余分配数的总量最...
  • 本发明涉及在线教育技术领域,提供一种在线答疑方法、系统、电子设备及存储介质,首先获取交互数据,并识别交互数据对应的交互意图;然后在交互意图属于答疑类意图的情况下,从交互数据中抽取待答疑试题,从试题库中确定待答疑试题的相关试题,并基于相关...
  • 本发明提供一种重题检测方法、装置、电子设备及存储介质,该方法包括:获取待检测题;从多个候选题中确定所述待检测题的相似题;基于第一相似度、所述待检测题的题目特征和所述相似题的题目特征,确定所述待检测题与所述相似题是否为重题;所述第一相似度...
  • 本申请公开了封面图片配置方法、装置、电子设备以及存储介质,包括:利用语音合成技术与自然语言处理技术获取到待配置封面的音频文件的高频词汇;基于每个高频词汇在预设图片库中进行查询;其中,预设图片库中的每张图片为经过目标检测模型检测并分类的图...
  • 本发明提供一种试题批改方法、装置、电子设备和存储介质,其中方法包括:获取待批改的作答图像,以及作答图像对应试题的标准答案;对作答图像进行图像编码,得到作答图像特征;基于作答图像特征,以及标准答案的答案特征,进行字符解码,得到作答图像的作...
  • 本发明涉及音频处理技术领域,提供一种音频优化方法、装置、电子设备和存储介质,其中方法包括:对获取到的待优化音频进行语音转写,得到所述待优化音频的转写文本;基于所述转写文本的语义特征,对所述转写文本进行目标优化点检测,得到目标文本对应的目...
  • 本申请公开了一种机器人及其寻桩方法、装置及存储介质,本申请在确定机器人需要返回充电桩后,考虑了待搜索区域内各房间的功能属性信息,并基于不同功能属性的房间存在充电桩的概率不同这一先验信息,确定了各个房间的优先级及遍历顺序,按照该遍历顺序搜...
  • 本申请公开了一种语音识别方法、装置、存储介质及设备,该方法包括:首先生成目标语音的音频特征,然后将其输入至预先构建的语音识别模型,识别得到目标语音的音素识别结果和初始文本识别结果中的第一实体词汇及其位置信息;接着利用预先构建的领域专业实...
  • 本申请涉及一种存储系统及存储集群的配置方法,存储系统包括:多个存储集群,其中,不同存储集群用于存储不同类型的集群数据;述存储集群包括配额管理模块和自动治理模块;配额管理模块,用于对存储集群的存储空间进行配额管理;自动治理模块,用于按照预...
  • 本发明提供一种语音处理方法、装置、电子设备和存储介质,其中方法包括:确定待处理语音的识别文本;基于所述待处理语音中各字符的停顿信息,以及所述识别文本中各字符之间的相关度,对所述识别文本中的各字符进行编码,得到所述识别文本中各字符的停顿上...
  • 本申请公开了一种控件查找方法、控件测试方法及相关装置,该控件查找方法包括:获取初始查找方法;其中,初始查找方法包括至少一个链式条件,初始查找方法用于在目标设备的当前显示界面上查找到至少两个候选控件;利用至少两个候选控件的候选参数信息,修...