文件分类方法、装置、计算设备及计算机存储介质制造方法及图纸

技术编号：17389953 阅读：39 留言：0更新日期：2018-03-04 14:40

本发明专利技术公开了一种文件分类方法、装置、计算设备及计算机存储介质。其中方法基于经过训练的特征抽取网络、以及经过训练的文件分类模型执行，方法包括：获取待分类文件；将待分类文件输入至特征抽取网络，得到与待分类文件对应的预设维度的文件特征；基于预设维度的文件特征利用文件分类模型进行分类预测，得到文件对应的分类结果。基于本发明专利技术实施例的方案，利用经过训练的特征抽取网络抽取待分类文件的文件特征，极大地节省了时间，提高了特征抽取的效率和准确率，而且能够避免虚假视频元信息的影响，利用经过训练的文件分类模型对待分类文件进行分类预测，实现了文件自动分类，避免了人工干预而导致的分类结果不准确的问题，同时还降低了人工成本。

File classification methods, devices, computing equipment and computer storage media

全部详细技术资料下载

【技术实现步骤摘要】
文件分类方法、装置、计算设备及计算机存储介质
本专利技术涉及互联网
，具体涉及一种文件分类方法、装置、计算设备及计算机存储介质。
技术介绍
随着网络技术飞速发展，互联网中存在各种文件。为了帮助用户有效地检索相关的文件或迅速获取用户感兴趣的文件，就需要一些分类工具对大量的文件进行有效的分类，以某明星的粉丝为例，粉丝仅关注有该明星的文件，若能对文件进行分类，确定文件中是否包含粉丝关注的明星，则可以节省粉丝的时间，无需粉丝阅读全部的文件来确定文件是否包含相应的明星。现有技术中，采用了人工对文件进行分类的方法，采用人工分类方法需要投入大量的人力，增加了分类成本，而且分类效率低；虽然现有一些文件元信息进行分类的方法，但是由于很多文件的元信息存在虚假成分，导致分类的准确率低下。
技术实现思路
鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的文件分类方法、文件分类装置、计算设备及计算机存储介质。根据本专利技术的一个方面，提供了一种文件分类方法，该方法基于经过训练的特征抽取网络、以及经过训练的文件分类模型执行，该方法包括：获取待分类文件；将待分...
文件分类方法、装置、计算设备及计算机存储介质

【技术保护点】
一种文件分类方法，所述方法基于经过训练的特征抽取网络、以及经过训练的文件分类模型执行，所述方法包括：获取待分类文件；将所述待分类文件输入至特征抽取网络，得到与所述待分类文件对应的预设维度的文件特征；基于所述预设维度的文件特征利用文件分类模型进行分类预测，得到文件对应的分类结果。

【技术特征摘要】
1.一种文件分类方法，所述方法基于经过训练的特征抽取网络、以及经过训练的文件分类模型执行，所述方法包括：获取待分类文件；将所述待分类文件输入至特征抽取网络，得到与所述待分类文件对应的预设维度的文件特征；基于所述预设维度的文件特征利用文件分类模型进行分类预测，得到文件对应的分类结果。2.根据权利要求1所述的方法，其中，所述待分类文件为视频文件和/或音频文件；所述将待分类文件输入至特征抽取网络，得到与所述待分类文件对应的预设维度的文件特征进一步包括：对所述待分类视频文件和/或音频文件进行解码处理，得到多个文件帧，其中，所述文件帧为视频帧和/或音频帧；针对多个文件帧的每一文件帧，将文件帧输入至特征抽取网络，得到与该文件帧对应的预设维度的帧特征；利用预设算法对多个文件帧的帧特征进行运算处理，得到与所述待分类视频文件和/或音频文件对应的预设维度的文件特征。3.根据权利要求1或2所述的方法，其中，所述利用预设算法对多个文件帧的帧特征进行运算处理，得到与所述待分类视频文件和/或音频文件对应的预设维度的文件特征进一步包括：计算多个文件帧的帧特征的特征值的平均值，得到与所述待分类视频文件和/或音频文件对应的预设维度的文件特征。4.根据权利要求1-3任一项所述的方法，其中，在对所述待分类视频文件和/或音频文件进行解码处理，得到多个文件帧之后，所述方法还包括：利用预设抽帧策略从所述多个文件帧中抽取至少一个文件帧。5.根据权利要求1-4任一项所述的方法，其中，所述文件分类模型训练所用的样本包含：样本库存储的多个类别的文件样...

【专利技术属性】
技术研发人员：张康，陈强，
申请(专利权)人：北京奇虎科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人