北京搜狗科技发展有限公司专利技术

北京搜狗科技发展有限公司共有1988项专利

  • 本发明实施例提供了一种模型训练方法、装置和用于模型训练的装置。所述方法包括:获取语音训练样本,所述语音训练样本包括带噪语音样本以及所述带噪语音样本对应的干净语音样本;基于所述语音训练样本,对串联的语音增强模型和语音识别模型进行迭代联合训...
  • 本发明实施例提供了一种输入方法、装置和用于输入的装置。所述方法包括:根据用户连续输入的至少两个分词构建候选词库,所述候选词库中的候选词条包括所述至少两个分词组成的多元关系词条;将所述候选词库中满足预设条件的候选词条作为用户词条加入用户词...
  • 本发明实施例提供了一种语音合成模型的构建方法、装置和用于语音合成模型的构建装置。其中的方法包括:从多人语音数据中选取音素覆盖完全的数据子集;将目标说话人的单人语音数据和所述数据子集组成的混合数据作为训练数据,利用所述训练数据对多人语音合...
  • 本发明实施例提供了一种文章大纲生成方法、装置和用于生成文章大纲的装置。所述方法包括:获取符合预设主题的至少两篇参考文章并确定每篇参考文章的段落;确定每篇参考文章的每个段落对应的候选标题;对所述至少两篇参考文章的每个段落对应的候选标题进行...
  • 本发明公开了一种视频展示方法、装置、电子设备及可读存储介质,所述方法包括:响应于用户的搜索请求,获得与所述搜索请求对应的搜索视频,所述搜索请求中包含有目标搜索信息;在所述搜索视频中确定出与所述目标搜索信息相关联的目标视频片段;将所述目标...
  • 本发明公开了一种摘要的生成方法、装置及存储介质,涉及文本处理技术领域,其中,上述摘要的生成方法,可以包括:获取目标段落的文本内容,其中,所述目标段落为文章分段后得到的第一段落之后的某一个段落;基于所述目标段落的文本内容和所述目标段落之前...
  • 本发明实施例提供了一种搜索方法、装置和电子设备,其中,所述方法包括:接收用户输入的查询图片;从图片库中召回与所述查询图片相似的多张候选图片,获取各候选图片对应的美学特征信息;依据各候选图片的美学特征信息,确定多张候选图片中满足低质量条件...
  • 本申请实施例公开了一种输入方法、装置和用于输入的装置。该方法的实施例包括:从用户的历史输入内容中选取满足预设条件的句子;将所选取的句子存入第一词库;在检测到用户具有对第一词库中的任一句子的输入意图时,将具有输入意图的句子作为目标句子,将...
  • 本申请公开了一种基于结构化数据的工具展示方法,该方法可以由第一设备执行。在一个示例中,当用户具备编辑结构化数据的需求时,第一设备可以响应于所述需求,获取结构化数据对应的第一工具集合,其中,第一工具集合中可以包括编辑结构化数据可能需要使用...
  • 本申请公开了一种要素点编码的方法及相关装置,该方法包括:将采集设备所采集到的各个要素点中的任一个要素点作为目标要素点,获得目标要素点的三维要素图,该三维要素图中其他要素点与目标要素点之间距离小于等于第一预设距离,以边连接的两个其他要素点...
  • 本申请公开了一种电路板锁紧器和电子设备,所述电路板锁紧器包括:固定件、推动件和挤压件,所述固定件包括支撑部;推动件可移动地设置于所述固定件上;挤压件可移动地设置于所述推动件和所述支撑部之间。通过设置支撑部、可移动的推动件、可移动地设置于...
  • 本说明书实施例公开了一种实时驱动虚拟人的方法,获取用于驱动虚拟人的待处理数据,所述待处理数据包括文本数据和语音数据中的至少一种;使用端到端模型对所述待处理数据进行处理,确定出所述待处理数据对应的声学特征序列、面部特征序列和肢体特征序列;...
  • 本说明书实施例公开了一种实时驱动虚拟人的方法,获取用于驱动虚拟人的待处理数据,所述待处理数据包括文本数据和语音数据中的至少一种;使用端到端模型对所述待处理数据进行处理,确定出所述待处理数据对应的手势特征序列;将所述手势特征序列输入到已训...
  • 本发明实施例公开了一种虚拟主播换脸方法、装置、电子设备及存储介质,通过端对端的序列学习模型处理目标虚拟主播的历史视频素材,得到目标虚拟主播的人脸特征参数;使用候选虚拟人脸对所述目标虚拟主播进行换脸,得到对应换脸虚拟主播的图像素材;通过端...
  • 本发明公开了一种驱动数字人的方法、装置及电子设备,该方法包括获取目标文本对应的目标动作;获得基于所述目标文本驱动数字人输出语音时,所述数字人在执行所述目标动作之前所要执行的参考动作;根据所述参考动作的参考动作参数修改所述目标动作的目标动...
  • 本发明实施例提供了一种搜索结果展示方法、装置和用于搜索结果展示的装置。其中的方法包括:识别查询信息对应的实体;获取所述实体对应的结构化数据,所述结构化数据中包含的属性以及属性顺序为根据排序因子进行加权计算所确定;显示所述查询信息对应的搜...
  • 本申请公开了一种数据处理方法,具体地:当用户触发多音字查看操作之后,可以确定查看范围,并进一步确定所述查看范围中包括的至少一个多音字中每个多音字分别对应的至少一种读音,并显示所述每个多音字分别对应的至少一种读音。由此可见,在本申请中,用...
  • 本申请公开了一种要素点匹配的方法及相关装置,该方法包括:获取同一区域内不同采集设备所采集到的各个要素点的坐标。将采集设备所采集到的各个要素点中的任一个要素点作为目标要素点,通过采集目标要素点的采集设备所采集到的各个要素点的坐标、并利用表...
  • 本申请的实施例提供了一种媒体信息编辑方法、装置、计算机可读介质及电子设备。该方法包括:获取用于媒体信息编辑的参考数据,并在所述参考数据中提取参考媒体信息;获取媒体信息编辑区域中已经编辑的基础媒体信息,并确定所述参考媒体信息与所述基础媒体...
  • 本申请实施例涉及数据处理技术领域,具体涉及一种虚拟说话人肢体手势生成方法、装置、设备及存储介质,旨在增加虚拟说话人肢体手势合成结果的自然度,提升虚拟形象的信息传达效果。所述方法包括:将说话音频、说话文本以及初始化手势序列输入自注意力肢体...