开域数科信息技术北京有限公司专利技术

开域数科信息技术北京有限公司共有4项专利

  • 本发明涉及计算机视觉技术领域,尤其为一种增强多角色图像个性化定制生成的方法,其方法包括如下步骤:构建训练数据集,数据包括图片和使用公开的多模态大模型,用LLaVa标注的文本提示;构建多角色个性化定制形象数据集,要求定制角色为半身到全身之...
  • 本发明涉及计算机科学技术领域,尤其为一种无需微调的多角色定制生成方法,包括图像编解码器、文本编码器、降噪模型、角色编码器、多角色适配器5个模块,选用开源的Stable Diffusion作为基础模型,图像编解码器、文本编码器和降噪模型直...
  • 本发明涉及视频混剪技术领域,尤其为一种基于生成式模型的自动混剪视频的方法,其方法包括如下步骤:建立视频库,首先收集大量的原始视频,对原始视频解码后,计算图片相似度,使用图片特征作为视频代表特征,训练模型,包括开端模型和续写模型,使用序列...
  • 本发明公开了一种基于多标签学习的多源素材混合剪辑视频的方法及系统,包括步骤一:最大化近义模糊匹配学习;最大化近义模糊匹配学习旨在将多标签分类问题映射为模糊匹配任务;步骤二:分阶段视频token化;步骤三:视频片段排序策略。本发明提出的学...
1