科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 一种语音降噪方法、装置、服务器及存储介质
    本申请提供了一种语音降噪方法、装置、服务器及存储介质,语音降噪方法包括:获取声学麦克风和非声学麦克风同步采集的语音信号;根据非声学麦克风采集的语音信号进行语音活动性检测,得到语音活动性检测结果;根据语音活动性检测结果,对声学麦克风采集的...
  • 语音翻译处理方法及装置
    本发明实施例提供一种语音翻译处理方法及装置,属于语言处理技术领域。该方法包括:在对第一合成语音信号进行播报的过程中,若接收到包含有部分第一合成语音信号的混合语音信号,则停止播报第一合成语音信号。从混合语音信号过滤掉部分第一合成语音信号,...
  • 人脸图像的增强方法及系统
    本发明提供了一种人脸图像的增强方法及系统,该方法包括:获取当前的人脸图像;对所述当前的人脸图像进行五官分片处理,以获得五官分片图像;将所述五官分片图像分别输入到各自预先构建的第一图像增强模型,得到增强的五官分片图像;将所述增强的五官分片...
  • 一种内容推荐方法及装置
    本发明实施例提供一种内容推荐方法及装置,所述方法包括:获取目标用户的语音请求数据,提取所述语音请求数据中对应的交互推荐特征;根据所述交互推荐特征,在预先构建的与所述目标用户对应的推荐知识库中获取相应的推荐内容并发送给所述目标用户;其中,...
  • 语音翻译处理方法及装置
    本发明实施例提供一种语音翻译处理方法及装置,属于语言处理技术领域。该方法包括:若判断获知上一轮次的第一语音信号与当前轮次待翻译的第二语音信号均对应相同的语种类型,则基于第一语音信号对应的文本数据对第二语音信号对应的文本数据进行调整,得到...
  • 智能排序方法及装置、存储介质、电子设备
    本公开提供一种智能排序方法及装置、存储介质、电子设备。该方法包括:获取交互指令以及交互指令对应的响应结果;提取排序特征信息,所述排序特征信息包括:用于表示所述交互指令的指令特征,以及用于表示所述响应结果的响应特征;将所述排序特征信息作为...
  • 辅助泊车系统和方法
    本发明公开了一种辅助泊车系统及方法,该系统包括:监测模块,包括设置在车辆上的一个或多个摄像头,所述摄像头用于采集车身周围图像;人机交互触摸屏,用于显示所述摄像头采集的图像;目标车位确定模块,用于确定在车辆坐标系中的目标车位;路径规划模块...
  • 单通检测方法及装置
    本发明实施例提供一种单通检测方法及装置,属于移动通信领域。该方法包括:获取进行语音通话的第一终端和第二终端,所分别对应的第一通话记录和第二通话记录;基于语音通话参数分别对第一通话记录及第二通话记录进行检测,根据检测结果确定第二终端是否发...
  • 将书面文本转换为口语文本的方法及系统
    本发明公开了一种将书面文本转换为口语文本的方法,所述方法包括:接收待转换的源文本数据;对所述源文本数据进行分词及向量化处理,得到每句源文本数据的词向量序列;依次将每句源文本数据的词向量序列输入预先构建的文本转换模型,根据所述文本转换模型...
  • 一种文本描写类型识别方法及装置
    本发明提供了一种文本描写类型识别方法及装置,其中方法包括:获取目标描写类型及所述目标描写类型的描写搭配种子集合,其中每个描写搭配由描写对象及描写词组成;根据第一预设规则及预先构建的无类型描写搭配集合对所述描写搭配种子集合进行增长,以得到...
  • 多人参与的人机交互方法及装置
    本发明公开了一种多人参与的人机交互方法及装置,该方法包括:接收用户当前交互指令;对所述当前交互指令进行分析,得到用户交互意图;确定交互响应的优先度;根据所述交互响应的优先度及所述用户交互意图,对用户交互进行响应。利用本发明,可以提高多人...
  • 多轮交互并行语义理解方法和装置
    本申请提出一种多轮交互并行语义理解方法和装置,该多轮交互并行语义理解方法包括:接收语音数据;对所述语音数据进行切分,得到语音数据片断,以及,对所述语音数据片断进行语音识别,得到当前切分文本数据;对当前切分文本数据进行独立语义理解,得到第...
  • 一种目标文本识别方法及装置
    本发明实施例提供了一种目标文本识别方法及装置,其中方法包括:获取待处理的文本,所述文本包含一条或多条自然语言语句;获取每条语句的特征值,其中所述特征值为所述语句是目标语句的概率;根据每条语句的特征值获取所述文本的预设指标值;根据所述预设...
  • 目标语音检测方法及装置
    本发明公开了一种目标语音检测方法及装置,该方法包括:接收基于麦克风阵列采集的声音信号;对所述声音信号进行波束成形处理,得到不同方向波束;分别基于所述声音信号和所述不同方向波束逐帧提取检测特征;将提取的当前帧的检测特征输入预先构建的目标语...
  • 多轮交互语义理解方法和装置
    本申请提出一种多轮交互语义理解方法和装置,该多轮交互语义理解方法包括:接收语音数据;对所述语音数据进行切分,得到语音数据片断,以及,对所述语音数据片断进行语音识别,得到当前切分文本数据;根据用户交互的历史数据对当前切分文本数据进行语义理...
  • 一种目标语句识别方法及装置
    本发明实施例提供了一种目标语句识别方法及装置,其中方法包括:获取待处理的文本,其中所述文本包含一条或多条自然语言语句;提取每条所述语句的识别特征,其中所述识别特征包括第一特征和\或第二特征,所述第一特征用于指示所述语句在语义方面的特征,...
  • 游戏语音交互方法及装置
    本发明实施例提供一种游戏语音交互方法及装置,属于语音识别领域。该方法包括:获取对语音数据进行语音识别后得到的文本数据,将文本数据拆分为文本元素,并将每一文本元素转化为文本向量;基于每一文本向量,生成特征矩阵,并将特征矩阵输入至指令识别模...
  • 语音唤醒方法、系统及智能终端
    本发明公开了一种语音唤醒方法及系统,该方法包括:接收语音数据;获取所述语音数据的第一声学特征;利用所述第一声学特征、第一声学模型及第一解码网络进行唤醒词识别,得到初次唤醒词识别结果;如果所述初次唤醒词识别结果为唤醒词,则判断所述初次唤醒...
  • 语音唤醒方法、系统及智能终端
    本发明公开了一种语音唤醒方法及系统,该方法包括:接收语音数据;提取所述语音数据的声学特征;利用所述声学特征及预先构建的声学模型进行唤醒词识别,得到唤醒词识别结果;如果所述唤醒词识别结果为唤醒词,则从所述语音数据及唤醒词识别过程的中间结果...
  • 发音词典生成方法及装置、存储介质、电子设备
    本公开提供一种发音词典生成方法及装置、存储介质、电子设备。该方法包括:获取待确定发音词语对应的语音片段,并针对所述待确定发音词语构建发音识别网络,所述发音识别网络中包括所述待确定发音词语的正确发音单元以及音变发音单元;利用所述发音识别网...