北京字跳网络技术有限公司专利技术

北京字跳网络技术有限公司共有10144项专利

  • 本申请公开了一种视频文字任务的处理方法、装置、设备、介质及程序产品,涉及视频处理技术、人工智能技术、大模型技术、大语言模型技术领域,该方法包括:获取第一视频,并对第一视频进行帧采样得到第一图像帧;对第一图像帧进行文字识别,得到第一图像帧...
  • 本公开的实施例涉及一种界面交互方法、装置、设备和存储介质。该方法包括:呈现与虚拟对象相关联的互动界面,虚拟对象关联于第一用户,虚拟对象是基于第一用户的配置操作所创建的;经由互动界面,接收第二用户的第一输入消息;以及提供基于第一输入消息所...
  • 本公开实施例提供了一种对象识别方法、装置、电子设备、存储介质和程序产品。该方法包括:响应于基于第一信号列表的对象识别请求,获取至少一个第一历史对象的第二信号列表;根据所述第一信号列表中的第一信号与所述第二信号列表中不同第二信号之间的相关...
  • 本发明公开了一种查询语句的生成方法、装置、设备介质及产品。该方法包括:获取与查询服务场景对应的关键词提示语模板;根据第一查询语句集和所述关键词提示语模板,生成关键词提示语;其中,所述关键词提示语用于指示预训练语言模型根据所述第一查询语句...
  • 根据本公开的实施例,提供了增强大模型应用数据安全的方法、装置、设备和存储介质。该方法包括:数据管理服务接收来自大模型应用的密文用户数据,密文用户数据包括用户的第一数据;数据管理服务对密文用户数据进行解密得到第一数据,并将加密的第一数据存...
  • 本公开的实施例涉及界面交互的方法、装置、设备和存储介质。在此提出的方法包括:呈现兴趣点的第一查看界面;以及在第一查看界面中,呈现媒体查看组件,媒体查看组件被配置为呈现与兴趣点相关联的一组媒体资源,一组媒体资源包括与至少一个拍摄位置相关联...
  • 本公开的实施例提供了处理语音内容的方法、装置、设备和存储介质。该方法包括:从目标语音内容中确定与目标对象相关联的第一语音内容,第一语音内容对应于第一文本;生成与第一文本对应的第二文本,第一文本对应于第一语言,第二文本对应于第二语言;基于...
  • 本公开的实施例涉及消息交互的方法、装置、设备和存储介质。在此提出的方法包括:获取由与目标互动场景相关联的第一处理实体生成的控制消息,目标互动场景关联于多个互动对象,控制消息至少指示由多个互动对象中的一组目标互动对象生成针对目标消息内容的...
  • 本公开的实施例涉及音频编码方法、装置、设备和存储介质。在此提出的方法包括:利用编码模块,将目标音频编码为第一向量表示;基于对与第一向量表示对应的第一分布的采样,确定第二向量表示,第二向量表示满足第一分布;以及通过将第二向量表示转换为满足...
  • 根据本公开的实施例,提供了一种用于训练工作流创建模型的方法、装置、设备、存储介质和程序产品。该方法包括:获取针对数据对象来创建工作流的创建请求;获取与创建请求对应的工作流的数据,工作流是基于创建请求和数据对象的信息所创建的;基于工作流的...
  • 本公开的实施例提供基于音色融合的语音合成方法、装置、设备和可读介质。该方法包括:利用第一模型生成与目标文本对应的语音令牌序列;通过融合与多个音色对应的多个音色特征表示,确定融合音色特征表示;利用第二模型处理语音令牌序列和融合音色特征表示...
  • 本公开的实施例涉及语音合成方法、装置、设备和存储介质。在此提出的方法包括:基于目标文本和提示语音内容,构建与序列模板对应的输入序列,序列模板包括占位符,输入序列中与占位符对应的序列片段为:独立于提示语音内容的预设内容,或,基于提示语音内...
  • 本公开的实施例提供了生成语音内容的方法、装置、设备和存储介质。该方法包括:确定与目标文本对应的第一音素序列;在第一音素序列的第一目标位置处插入与目标声音表达对应的目标特征表示,以获得第二音素序列;以及基于第二音素序列,生成与目标文本对应...
  • 本公开的实施例涉及语音合成方法、装置、设备和存储介质。在此提出的方法包括:获取与提示语音内容对应的参考描述特征,参考描述特征包括利用对比学习模块处理语音内容所确定的文本编码表示,文本编码表示用于描述提示语音内容的第一表达状态;基于参考描...
  • 本申请公开了一种智能体通信方法、装置、电子设备、存储介质及程序产品,涉及通信技术领域,该方法应用于智能体服务器,智能体服务器部署有智能体服务总线,该方法包括:通过智能体服务总线的身份认证接口,接收第一智能体的第一身份认证请求,第一身份认...
  • 本公开的实施例涉及一种内容生成的方法、装置、设备和存储介质。在此提出的方法包括:呈现与智能体相关联的第一互动界面,第一互动界面包括内容展示区域和输入组件;在内容展示区域中,呈现媒体生成历史,媒体生成历史关联于多种媒体生成模式,多种媒体生...
  • 本公开的实施例涉及联合训练方法、装置、设备和存储介质。在此提出的方法包括:获取第一序列和第二序列,其中第一序列基于文本内容生成,第二序列基于与文本内容相匹配的语音内容生成,第一序列包括多个文本令牌,第二序列包括多个语音令牌;基于文本令牌...
  • 本公开的实施例涉及音频编码的方法、装置、设备和存储介质。该方法包括:利用第一编码模型,将目标音频的编码为第一向量表示,所述第一向量表示对应于第一采样率;将所述第一向量表示转换为满足目标分布的第二向量表示,所述第二向量表示对应于所述第一采...
  • 本公开的实施例提供了一种信息输出方法、设备、存储介质和计算机程序产品。该方法包括获取原始代码格式的原始输入。该方法还包括将原始输入转换为目标代码格式的目标输入。目标输入中包含的词元的数量小于原始输入中包含的词元的数量。该方法还包括向目标...
  • 本公开的实施例涉及交互方法、装置、设备和存储介质。在此提出的方法包括:呈现目标应用的会话界面,会话界面关联于参与到目标互动场景的多个互动对象,多个互动对象对应于目标互动场景中的一组预设角色,多个互动对象包括处理实体或用户对象;以及在会话...