【技术实现步骤摘要】
本专利技术涉及视频处理技术,尤其涉及一种知识库构建方法、视频自动化生产方法和软件产品。
技术介绍
1、短视频的自动化生产技术,可以快速地完成视频的剪辑、特效、配音等传统需要大量人力的制作工作,大大提高生产效率同时极大的降低人力投入成本。从ugc跨越到pgc或者aigc一定是未来内容生产的一种全新模式。目前市面上较为常见的短视频自动化内容生产的技术方法有:
2、方法1.基于素材标签的关键词检索匹配。主要通过对素材内容(图片、视频)进行人工或者ai打标的方式完成素材归类、定义。用户使用时通过输入文本内容或者上传文本文档进行文本内容的解析及分析,此处可能涉及到文本的摘要内容提取及关键字提取,通过关键字搜索打标的素材,选择搜索置信度较高的素材进行内容选择。此时文本摘要+素材内容提取完毕,套用视频模板进行内容填充即可完成内容的自动化视频生产。该方法无法进行文本内容生成,只能通过输入的文本或者解析的文档去识别关键字然后匹配素材库,对于有价值的文档如研报、财报等无法形成有效内容沉淀。且对于数据部分无法进行相应场景化感知,生产形式过于单一,
...【技术保护点】
1.一种知识库构建方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的知识库构建方法,其特征在于,所述将大切片、小切片以及图片解析结果、元数与图片存储路径转化为向量数据储存在不同索引中的方法,还包括:先存储大切片索引得到对应的大切片的向量ID,再执行小切片索引的存储,存储小切片索引时向量结构中保存大切片的向量ID。
3.根据权利要求1所述的知识库构建方法,其特征在于,所述采用图文多模态大模型解析图片得到图片解析结果的方法,包括采用LLaVa模型解析图片得到图片解析结果。
4.根据权利要求1所述的知识库构建方法,其特征在于,所述
...【技术特征摘要】
1.一种知识库构建方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的知识库构建方法,其特征在于,所述将大切片、小切片以及图片解析结果、元数与图片存储路径转化为向量数据储存在不同索引中的方法,还包括:先存储大切片索引得到对应的大切片的向量id,再执行小切片索引的存储,存储小切片索引时向量结构中保存大切片的向量id。
3.根据权利要求1所述的知识库构建方法,其特征在于,所述采用图文多模态大模型解析图片得到图片解析结果的方法,包括采用llava模型解析图片得到图片解析结果。
4.根据权利要求1所述的知识库构建方法,其特征在于,所述读取文档并解析的方法,包括:采用unstructured文档解析工具对读取的文档进行解析。
5.根据权利要求1所述的知识库构建方法,其特征在于,所述分区文本内容和图片与源文档关联。
...
【专利技术属性】
技术研发人员:滕思敏,梁双春,张莉莎,
申请(专利权)人:新华智云科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。