【技术实现步骤摘要】
文件分类方法、装置、计算设备及计算机存储介质
本专利技术涉及互联网
,具体涉及一种文件分类方法、装置、计算设备及计算机存储介质。
技术介绍
随着网络技术飞速发展,互联网中存在各种文件。为了帮助用户有效地检索相关的文件或迅速获取用户感兴趣的文件,就需要一些分类工具对大量的文件进行有效的分类,以某明星的粉丝为例,粉丝仅关注有该明星的文件,若能对文件进行分类,确定文件中是否包含粉丝关注的明星,则可以节省粉丝的时间,无需粉丝阅读全部的文件来确定文件是否包含相应的明星。现有技术中,采用了人工对文件进行分类的方法,采用人工分类方法需要投入大量的人力,增加了分类成本,而且分类效率低;虽然现有一些文件元信息进行分类的方法,但是由于很多文件的元信息存在虚假成分,导致分类的准确率低下。
技术实现思路
鉴于上述问题,提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的文件分类方法、文件分类装置、计算设备及计算机存储介质。根据本专利技术的一个方面,提供了一种文件分类方法,该方法基于经过训练的特征抽取网络、以及经过训练的文件分类模型执行,该方法包括:获取待分类文件;将待分 ...
【技术保护点】
一种文件分类方法,所述方法基于经过训练的特征抽取网络、以及经过训练的文件分类模型执行,所述方法包括:获取待分类文件;将所述待分类文件输入至特征抽取网络,得到与所述待分类文件对应的预设维度的文件特征;基于所述预设维度的文件特征利用文件分类模型进行分类预测,得到文件对应的分类结果。
【技术特征摘要】
1.一种文件分类方法,所述方法基于经过训练的特征抽取网络、以及经过训练的文件分类模型执行,所述方法包括:获取待分类文件;将所述待分类文件输入至特征抽取网络,得到与所述待分类文件对应的预设维度的文件特征;基于所述预设维度的文件特征利用文件分类模型进行分类预测,得到文件对应的分类结果。2.根据权利要求1所述的方法,其中,所述待分类文件为视频文件和/或音频文件;所述将待分类文件输入至特征抽取网络,得到与所述待分类文件对应的预设维度的文件特征进一步包括:对所述待分类视频文件和/或音频文件进行解码处理,得到多个文件帧,其中,所述文件帧为视频帧和/或音频帧;针对多个文件帧的每一文件帧,将文件帧输入至特征抽取网络,得到与该文件帧对应的预设维度的帧特征;利用预设算法对多个文件帧的帧特征进行运算处理,得到与所述待分类视频文件和/或音频文件对应的预设维度的文件特征。3.根据权利要求1或2所述的方法,其中,所述利用预设算法对多个文件帧的帧特征进行运算处理,得到与所述待分类视频文件和/或音频文件对应的预设维度的文件特征进一步包括:计算多个文件帧的帧特征的特征值的平均值,得到与所述待分类视频文件和/或音频文件对应的预设维度的文件特征。4.根据权利要求1-3任一项所述的方法,其中,在对所述待分类视频文件和/或音频文件进行解码处理,得到多个文件帧之后,所述方法还包括:利用预设抽帧策略从所述多个文件帧中抽取至少一个文件帧。5.根据权利要求1-4任一项所述的方法,其中,所述文件分类模型训练所用的样本包含:样本库存储的多个类别的文件样...
【专利技术属性】
技术研发人员:张康,陈强,
申请(专利权)人:北京奇虎科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。