广州酷狗计算机科技有限公司专利技术

广州酷狗计算机科技有限公司共有1236项专利

  • 本申请实施例提供一种音频播放方法、装置、设备及可读存储介质。该方法包括:获取第一文本,第一文本是多媒体文件的相关文本;通过第一大型语言模型,对第一文本进行摘要提取,得到第二文本;通过第二大型语言模型,对第二文本进行口语化生成,得到第三文...
  • 本申请公开了一种音频信息的处理方法、装置、设备及存储介质,属于直播技术领域。该方法包括:获取直播音频,直播音频携带有主播方在直播间中的播放曲目的音频信息;基于直播音频,识别得到直播音频对应的第一曲目;根据第一曲目关联的版权信息,确定直播...
  • 本申请实施例提供了一种直播流的标签确定方法、装置、设备及存储介质,涉及直播技术领域。所述方法包括:获取多种待审核的直播流,多种待审核的直播流是指通过多种方式初步自动筛选出来的、待审核画面清晰度的直播流,待审核直播流包括由人工智能AI评分...
  • 本申请公开了一种乐曲伴奏的生成方法、装置、设备、存储介质及程序产品,涉及计算机技术领域。该方法包括:获取乐曲数据;对乐曲数据进行乐曲信息提取,得到节拍数据信息、和弦数据信息以及旋律数据信息;以旋律数据信息为乐曲伴奏的生成限制条件,通过节...
  • 本申请实施例提供了一种重叠人声检测模型的训练方法、重叠人声检测方法及装置,涉及音频检测和音频处理技术领域。所述重叠人声检测模型的训练方法包括:获取重叠人声检测模型的训练样本集,训练样本集中包括至少一个训练样本,每个训练样本包括一段歌曲音...
  • 本申请公开了一种虚拟资源的生成方法、装置、设备、介质及程序产品,涉及直播技术领域。该方法包括:接收虚拟资源生成操作;响应于虚拟资源生成操作,基于第一图像和第二图像获取目标图像,目标图像是基于第一图像中的主播脸部区域对第二图像中的预设对象...
  • 本申请实施例公开一种直播间中虚拟礼物的生成方法、装置、服务器及存储介质,属于人工智能技术领域,该方法包括:响应于虚拟礼物生成指令,获取礼物需求文本,礼物需求文本用于描述虚拟礼物的生成需求;基于礼物需求文本,通过生成式模型生成礼物素材,礼...
  • 本申请公开了一种基于大语言模型的测试用例生成方法、装置及设备,属于软件测试领域。该方法包括:获取N个业务版块分别对应的介绍信息;对于N个业务板块中的每一个业务板块,获取业务版块的M个业务功能分别对应的介绍信息;获取需求信息;通过大语言模...
  • 本申请实施例公开了一种音画同步检测方法、装置、设备及存储介质,属于音视频测试技术领域,该方法包括:基于对视频帧的唇部识别结果,确定视频帧中唇部的唇部纵横比,唇部纵横比为纵向唇边距与横向唇部宽度的比值;基于唇部纵横比确定视频帧对应的嘴部开...
  • 本申请公开了一种应用于直播场景中的搜索方法、装置、设备及存储介质,属于直播领域。该方法包括:在直播过程中,获取第一搜索输入文本;基于第一搜索输入文本,从知识库中检索得到第一搜索输入文本的相关知识;结合第一搜索输入文本和相关知识,生成第二...
  • 本申请公开了一种窗口渲染方法、装置、设备、存储介质及程序产品,涉及计算机技术领域。该方法包括:获取原生窗口和浏览器窗口;在浏览器窗口与原生窗口之间创建覆盖绑定关系,得到渲染窗口;获取渲染数据,渲染数据对应窗口数据标识,窗口数据标识用于表...
  • 本申请公开了一种网页内容处理方法、装置、设备、存储介质及程序产品,涉及计算机技术领域。该方法包括:在浏览器窗口中获取目标网页;从所述预设离屏缓冲区域中获取所述第一画面内容对应的第一渲染数据;对所述第一渲染数据进行纹理转换处理,得到所述第...
  • 本申请实施例公开了一种音频生成方法、装置、终端及存储介质,涉及音频技术领域。包括:获取原始音频和录制音频,录制音频中包含录制人声,原始音频中包含原始人声和原始伴奏;确定原始人声对应的原始人声时间戳,以及,录制人声对应的录制人声时间戳,其...
  • 本申请公开了一种音频数据集的生成方法、装置、设备、存储介质及产品,属于数据处理技术领域。该方法包括:获取源音频数据集和指定音色对应的音色特征;提取源音频数据对应的音频内容特征和音频发音特征,所述音频内容特征用于表征所述源音频数据的音频内...
  • 本申请实施例公开了一种文学作品插图生成方法、装置、设备及存储介质,属于人工智能技术领域。该方法包括:将目标文学作品片段以及所述目标文学作品片段的片段上文输入角色场景提取模型,得到所述角色场景提取模型输出的目标角色以及目标场景;将所述目标...
  • 本申请公开了一种有声读物的音频存储方法、装置、设备及存储介质,属于有声读物领域。所述方法包括:获取有声读物的第i个章节的音频、第i个章节的标题以及第i个章节的分类,i为正整数;根据第i个章节的标题以及第i个章节的分类,生成第i个章节的封...
  • 本申请公开了一种文本分析模型的训练方法、装置、设备及存储介质,涉及人工智能技术领域。该方法包括:获取多个不同的文本分析任务各自的训练数据,将上述多个不同的文本分析任务各自的训练数据进行混合,得到多任务训练数据,采用该多任务训练数据对预训...
  • 本申请实施例提供了一种音频和文本的对齐匹配方法、装置、设备及存储介质,涉及音频合成和处理技术领域。所述方法包括:获取目标文本和待对齐匹配的人声录音,人声录音是采用人声对目标文本的部分文本内容进行录音得到的音频;将人声录音按照录制的时间顺...
  • 本申请公开了一种音频处理方法、装置、设备、介质和程序产品,涉及人工智能领域。该方法包括如下步骤:获取第一文本数据,第一文本数据中包括第一文本内容和基于第一文本内容识别得到的第一音效标签,第一音效标签用于指示与第一文本内容关联的音效类型;...
  • 本申请公开了一种文本信息的处理方法、装置、设备及存储介质,属于自然语言技术领域。该方法包括:获取文学作品,文学作品是包括多个字符的自然语言信息;在文学作品中确定出对话文本和旁白文本,对话文本是至少一个角色发起交流的文本,旁白文本是文学作...
1 2 3 4 5 6 7 8 尾页