视频分类模型的训练方法和视频分类方法技术

技术编号：13638384 阅读：52 留言：0更新日期：2016-09-03 03:27

本发明专利技术公开了一种视频分类模型的训练方法以及基于训练好的视频分类模型对视频进行分类的方法。其中，视频分类模型的训练方法，包括获取某领域视频集合中每个视频的文本内容和已有类别标签；对每个视频的文本内容进行分词，得到每个视频的属性词集合；建立贝叶斯模型，将该领域视频集合中每个视频的属性词集合和已有类别标签输入至贝叶斯模型以对所述贝叶斯模型进行训练，得到视频分类模型。对视频进行分类的方法包括对待分类视频的文本内容进行分词，得到待分类视频的属性词集合，将属性词集合中的每个属性词输入视频分类模型，从而确定所述待分类视频在所述类别目录中的类别标签。本公开能够高效、简便和高准确率的实现对视频的分类。

全部详细技术资料下载

【技术实现步骤摘要】

本公开属于互联网
，尤其涉及一种视频分类模型的训练方法和视频分类方法。
技术介绍
在大数据的环境下，视频的分类存储对于实现视频的管理以及兴趣推荐具有十分重要的作用。现有技术中，对于一些专业性的类别视频播放网站(例如播放教学视频的教育平台)，具有自己的一套视频管理系统，对网站上的视频进行分类存储。但由于类别视频播放网站自身能力有限，不具备长程转码能力，当其想上传一个视频时，需要利用视频服务提供商(例如乐视云平台)提供的长程转码功能生成该视频的ID，再将该ID分发至视频服务提供商的CDN平台上，当其需要播放该视频时，只需要从视频服务提供商的CDN平台上取到该视频的网络地址即可实现播放。由于ID一般由一串无意义的字母、数字构成(每个视频的ID是唯一的)，因此对于视频服务提供商来讲，存储于其云平台中的该视频的内容标签仅仅为一串无意义的字母、数字。因此，若视频服务提供商想对其云平台中这种类型的视频进行分类十分困难。
技术实现思路
本公开的目的是为了实现视频服务提供商(例如乐视云平台)对存储于其所搭建的云平台服务器群集中的视频的准确分类。为了实现本公开的目的，本公开提供一种视频分类模型的训练方法，包括以下步骤：获取某领域视频集合中每个视频的文本内容和已有类别标签；对每个视频的文本内容进行分词，得到每个视频的属性词集合；建立贝叶斯模型，将该领域视频集合中每个视频的属性词集合和已有类别标签输入至贝叶斯模型以对所述贝叶斯模型进行训练，得到视频分类模型。进一步，所述的视频分类模型的训练方法，其中，在获取某领域视频集合中每个视频的文本内容和已有类别标签的步骤之后，还包括：根...

【技术保护点】
一种视频分类模型的训练方法，包括：获取某领域视频集合中每个视频的文本内容和已有类别标签；对每个视频的文本内容进行分词，得到每个视频的属性词集合；建立贝叶斯模型，将该领域视频集合中每个视频的属性词集合和已有类别标签输入至贝叶斯模型以对所述贝叶斯模型进行训练，得到视频分类模型。

【技术特征摘要】
1.一种视频分类模型的训练方法，包括：获取某领域视频集合中每个视频的文本内容和已有类别标签；对每个视频的文本内容进行分词，得到每个视频的属性词集合；建立贝叶斯模型，将该领域视频集合中每个视频的属性词集合和已有类别标签输入至贝叶斯模型以对所述贝叶斯模型进行训练，得到视频分类模型。2.根据权利要求1所述的方法，其中，在获取某领域视频集合中每个视频的文本内容和已有类别标签之后，还包括：根据所述已有类别标签，建立该领域视频集合的类别目录。3.根据权利要求2所述的方法，其中，所述视频分类模型的输入参数为属性词，输出参数为：多个类别概率值；其中，每个类别概率值表示该属性词属于所述类别目录中某个类别的概率。4.根据权利要求1-3任一项所述的方法，其中，所述获取某领域的视频集合中每个视频的文本内容和类别标签包括：获取存储于云服务器中的某领域的视频集合中每个视频的网络地址；根据所述视频的网络地址，获取每个视频的播放网页；从每个视频播放页网中提取当前视频的文本内容和类别标签。5.根据权利要求1-3任一项所述的方法，其中，所述对每个视频的文本内容进行分词，得到每个视频的属性词集合包括：对所述文本内容进行分词，得到分词结果；根据词性标注算法对所述分词结果中的每个词语进行词...

【专利技术属性】
技术研发人员：张立宁，余婧，
申请(专利权)人：乐视控股北京有限公司，乐视云计算有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人