一种知识库构建方法、视频自动化生产方法和软件产品技术

技术编号：41199946 阅读：30 留言：0更新日期：2024-05-07 22:27

本发明专利技术公开一种知识库构建方法、视频自动化生产方法和软件产品，涉及视频处理技术领域，视频方法包括如下步骤：接收文本输入，基于输入文本匹配向量数据库，检索获得文字文本、表格文本和语义关联的图片，其中图片从对象存储单元中获取；采用大语言模型基于文字文本输出文本提取内容，采用大预言模型基于表格文本输出数据结构提取内容；将文本提取内容结构化处理得到结构化文本，将数据结构提取内容转化为可视化内容；将结构化文本、可视化内容和图片进行拼接生成视频输出。本发明专利技术基于知识库进行内容提取，搭配模板及可视化协议匹配完成样式定义，实现依据知识库内容的文本内容生成，图片和表格元素提取，满足更加智能的视频生产体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及视频处理技术，尤其涉及一种知识库构建方法、视频自动化生产方法和软件产品。

技术介绍

1、短视频的自动化生产技术，可以快速地完成视频的剪辑、特效、配音等传统需要大量人力的制作工作，大大提高生产效率同时极大的降低人力投入成本。从ugc跨越到pgc或者aigc一定是未来内容生产的一种全新模式。目前市面上较为常见的短视频自动化内容生产的技术方法有：

2、方法1.基于素材标签的关键词检索匹配。主要通过对素材内容(图片、视频)进行人工或者ai打标的方式完成素材归类、定义。用户使用时通过输入文本内容或者上传文本文档进行文本内容的解析及分析，此处可能涉及到文本的摘要内容提取及关键字提取，通过关键字搜索打标的素材，选择搜索置信度较高的素材进行内容选择。此时文本摘要+素材内容提取完毕，套用视频模板进行内容填充即可完成内容的自动化视频生产。该方法无法进行文本内容生成，只能通过输入的文本或者解析的文档去识别关键字然后匹配素材库，对于有价值的文档如研报、财报等无法形成有效内容沉淀。且对于数据部分无法进行相应场景化感知，生产形式过于单一，...

【技术保护点】

1.一种知识库构建方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的知识库构建方法，其特征在于，所述将大切片、小切片以及图片解析结果、元数与图片存储路径转化为向量数据储存在不同索引中的方法，还包括：先存储大切片索引得到对应的大切片的向量ID，再执行小切片索引的存储，存储小切片索引时向量结构中保存大切片的向量ID。

3.根据权利要求1所述的知识库构建方法，其特征在于，所述采用图文多模态大模型解析图片得到图片解析结果的方法，包括采用LLaVa模型解析图片得到图片解析结果。

4.根据权利要求1所述的知识库构建方法，其特征在于，所述读取文档并解析的方法...

【技术特征摘要】

1.一种知识库构建方法，其特征在于，包括如下步骤：

2.根据权利要求1所述的知识库构建方法，其特征在于，所述将大切片、小切片以及图片解析结果、元数与图片存储路径转化为向量数据储存在不同索引中的方法，还包括：先存储大切片索引得到对应的大切片的向量id，再执行小切片索引的存储，存储小切片索引时向量结构中保存大切片的向量id。

3.根据权利要求1所述的知识库构建方法，其特征在于，所述采用图文多模态大模型解析图片得到图片解析结果的方法，包括采用llava模型解析图片得到图片解析结果。

4.根据权利要求1所述的知识库构建方法，其特征在于，所述读取文档并解析的方法，包括：采用unstructured文档解析工具对读取的文档进行解析。

5.根据权利要求1所述的知识库构建方法，其特征在于，所述分区文本内容和图片与源文档关联。

...

【专利技术属性】
技术研发人员：滕思敏，梁双春，张莉莎，
申请(专利权)人：新华智云科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人