科大讯飞股份有限公司专利技术

科大讯飞股份有限公司共有4602项专利

  • 本发明公开了一种通知栏合并的方法及系统,该方法包括:接收通知消息;获取所述通知消息的属性特征,所述属性特征包括:终端信息、系统信息和应用信息;根据所述通知消息的属性特征判断该通知消息是否为可合并通知消息;如果是,则将所述可合并通知消息在...
  • 本发明公开了一种语音播放方法及装置,该方法包括:接收待播放语音数据;对所述待播放语音数据进行端点检测,得到各语音段;确定各语音是否为关键信息段;在播放所述待播放语音数据时,根据所述关键信息段对所述待播放语音数据的语速进行调整。利用本发明...
  • 一种音效处理方法及装置
    本发明公开了一种音效处理方法及装置,该方法包括:采集声音信号;确定所述声音信号对应的声音类型;选择与所述声音类型对应的音效处理方法对所述声音信号进行音效处理。利用本发明,能够有效改善音效处理的效果。
  • 本发明提出一种声音转换方法和装置,该声音转换方法包括预先构建声音转换模型;接收源发音人的语音信号,并提取语音信号的频谱特征;确定源发音人对应的声音转换模型;根据频谱特征和源发音人对应的声音转换模型,进行声音转换,以得到目标发音人的语音信...
  • 本发明提供的数据资源处理方法、系统及所应用的电子设备,制定多种资源多场景共用处理策略,各资源多场景共用处理策略按功能不同归类形成多个资源多场景共用处理策略群组,获取并解析有资源请求的外部设备的请求类型信息以提取至少一个元特征,根据所提取...
  • 本发明公开了一种语音识别结果评价方法及系统,该方法包括:对语音数据进行端点检测,得到各有效语音段;对各有效语音段进行语音识别,得到各有效语音段对应的识别文本段;提取各识别文本段的评价特征;利用预先构建的识别结果评价模型及所述评价特征对各...
  • 本发明公开了一种语音合成装置及方法,该装置包括:模型构建模块,用于预先根据收集的大量发音人语音数据构建语音合成模型;接收模块,用于接收用户的待合成文本;风格确定模块,用于确定合成语音风格;模型修正模块,用于根据合成语音风格对所述语音合成...
  • 本发明公开了一种副歌检测方法及系统,该方法包括:接收待检测的音频数据;提取所述音频数据的检测特征,所述检测特征包括所述音频数据不同频段的频域能量包络的极值点的频率值及能量值;利用提取的检测特征进行副歌检测,得到检测结果。利用本发明,可以...
  • 本实用新型提供一种适用于听力障碍人士的辅助装置,包括:拾音器、CODEC芯片、CPU芯片、功率放大器以及扬声器;所述拾音器与所述CODEC芯片连接;所述CODEC芯片分别与所述CPU芯片及所述功率放大器连接;所述功率放大器与所述扬声器连...
  • 滑行输入方法、装置及终端设备
    本发明公开了一种滑行输入方法、装置及终端设备,该方法包括:采集用户在虚拟键盘上输入的滑行轨迹;分别确定所述滑行轨迹上的激活按键、所述滑行轨迹上及滑行轨迹之外的容错激活按键及其惩罚值,所述激活按键包括:滑行轨迹中的关键点和非关键点对应的按...
  • 本发明公开了一种提示可连接无线局域网络的方法及系统,该方法包括:判断移动终端是否消耗大于设定阈值的移动数据网络流量,若是,则获取所述移动终端当前地理位置;判断所述移动终端当前地理位置是否处于预先存储的可用无线局域网络覆盖区域,若是,则执...
  • 本发明公开了一种通话语音监测方法及系统,该方法包括:分别实时采集服务端和客户端通话的语音数据;对所述服务端和客户端的语音数据进行语音识别,分别得到服务端识别文本和客户端识别文本;根据所述服务端通话语音数据和对应的识别文本、以及所述客户端...
  • 一种预测音乐对驾驶员行为影响的系统和方法
    本发明提供一种预测音乐对驾驶员行为影响的系统和方法,包括在播放音乐驾驶过程中,记录驾驶员驾驶时的前方路况、驾驶控制操作和驾驶员的生理特征;确定所播放的音乐的音乐特征以及驾控制操作是否危险;建立音乐对驾驶员行为影响的预测模型;利用音乐对驾...
  • 本发明公开了一种音视频字幕生成方法及装置,该方法包括:接收待生成字幕的语音数据及文本数据;根据发音人韵律对所述语音数据进行切分,得到符合说话人习惯的各语音数据段;根据所述语音数据段对所述文本数据进行切分,得到与所述语音数据段对应的文本数...
  • 本发明公开了一种语音识别后处理方法及系统,该方法包括:预先利用语音识别容易出错的词对构建错词检测模型;在接收到待识别语音数据后,对所述语音数据进行语音识别,得到识别结果;依次将所述识别结果中的各词与通用词典中的每个词组成词对,并提取词对...
  • 本发明公开了一种声音转换方法及装置,该方法包括:接收待转换语音数据;对所述待转换语音数据进行语音识别,得到识别结果及所述识别结果的时长信息;获取目标发音人的语音合成模型;利用所述语音合成模型及所述时长信息生成语音合成参数;利用所述语音合...
  • 本发明公开了一种判断说话人数目的方法及系统,包括:接收语音信号;提取所述语音信号的语音信号特征;根据所述语音信号的语音信号特征对所述语音信号进行分割,得到分割信号段;将所述分割信号段聚类成指定个数的语音信号类;根据所述语音信号类中各分割...
  • 本发明提供人机交互操作引导方法、系统、和相关的人机交互装置及服务端,通过获取人机交互时的用户操作信息;从所采集的用户操作信息提取操作参数,根据所述操作参数计算操作熟练度;将所计算的操作熟练度同预设熟练度相匹配,其中,所述预设熟练度按高低...
  • 本发明公开一种个性化视频生成方法及系统,该方法包括:获取包含人脸的用户图像;提取所述用户图像中的人脸图像;获取目标视频;将所述人脸图像替换掉所述目标视频中待匹配人物的人脸,并根据视频场景的变化动态调整替换后的人脸图像,得到个性化视频。利...
  • 本发明提出一种复调乐器音符定位方法和装置,该复调乐器音符定位方法包括接收用户演奏数据;提取用户演奏音符以得到用户演奏音符序列;检测并标记所述用户演奏音符序列中的和声音符以得到所述用户演奏数据对应的和声信息;根据得到的所述用户演奏音符序列...