内容分类方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:23212811 阅读:18 留言:0更新日期:2020-01-31 21:53
本申请涉及一种内容分类方法、装置、计算机设备和存储介质,方法包括:获取待分类的目标内容对应的目标特征向量;获取已训练得到的目标分类模型,目标分类模型包括第一分类模型以及第二分类模型;将目标特征向量输入到第一分类模型中,得到目标内容对应的第一内容类别,第一内容类别为第一分类层级对应的内容类别;获取第一分类层级对应的第一类别特征信息;将第一类别特征信息以及目标特征向量输入到第二分类模型中,得到目标内容对应的第二内容类别,第二内容类别为第二分类层级对应的内容类别,第二分类层级的级别低于第一分类层级的级别;将第一内容类别以及第二内容类别作为目标内容对应的分类结果。上述方法可以提高内容分类准确度。

Content classification methods, devices, computer equipment and storage media

【技术实现步骤摘要】
内容分类方法、装置、计算机设备和存储介质
本申请涉及信息处理领域,特别是涉及内容分类方法、装置、计算机设备和存储介质。
技术介绍
随着互联网技术的发展,互联网上的内容越来越多,在许多场景下都会存在对内容分类的需求。例如需要根据内容的类型对内容进行管理,根据用户选择的内容类别推送对应类别的内容。如对视频进行分类,以得到视频的类别,视频的类别例如可以是喜剧类或者剧情类。可以通过人工智能模型对内容进行分类,但目前分类得到的内容类别精细度以及准确度差。
技术实现思路
基于此,有必要针对上述分类得到的内容类别精细度以及准确度差的问题,提供一种内容分类方法、装置、计算机设备和存储介质。一种内容分类方法,所述方法包括:获取待分类的目标内容对应的目标特征向量;获取已训练得到的目标分类模型,所述目标分类模型包括第一分类模型以及第二分类模型;将所述目标特征向量输入到所述第一分类模型中,得到所述目标内容对应的第一内容类别,所述第一内容类别为第一分类层级对应的内容类别;获取所述第一分类层级对应的第一类别特征信息;将所述第一类别特征信息以及所述目标特征向量输入到所述第二分类模型中,得到所述目标内容对应的第二内容类别,所述第二内容类别为第二分类层级对应的内容类别,所述第二分类层级的级别低于所述第一分类层级的级别;将所述第一内容类别以及所述第二内容类别作为所述目标内容对应的分类结果。一种内容分类装置,所述装置包括:目标特征向量获取模块,用于获取待分类的目标内容对应的目标特征向量;分类模型获取模块,用于获取已训练得到的目标分类模型,所述目标分类模型包括第一分类模型以及第二分类模型;第一内容类别得到模块,用于将所述目标特征向量输入到所述第一分类模型中,得到所述目标内容对应的第一内容类别,所述第一内容类别为第一分类层级对应的内容类别;第一类别特征信息获取模块,用于获取所述第一分类层级对应的第一类别特征信息;第二内容类别得到模块,用于将所述第一类别特征信息以及所述目标特征向量输入到所述第二分类模型中,得到所述目标内容对应的第二内容类别,所述第二内容类别为第二分类层级对应的内容类别,所述第二分类层级的级别低于所述第一分类层级的级别;分类结果得到模块,用于将所述第一内容类别以及所述第二内容类别作为所述目标内容对应的分类结果。在一些实施例中,所述第一类别特征信息获取模块包括:类别向量得到单元,用于获取所述第一分类层级中各个候选内容类别对应的类别向量;类别权重系数获取单元,用于获取各个所述候选内容类别对应的类别权重系数;第一类别特征信息得到单元,用于根据所述候选内容类别对应的类别向量以及对应的类别权重系数计算得到所述第一分类层级对应的第一类别特征信息。在一些实施例中,所述第一内容类别得到模块用于:将所述目标特征向量输入到所述第一分类模型中,得到各个所述候选内容类别对应的被选中率;根据各个所述候选内容类别对应的被选中率确定所述目标内容对应的第一内容类别;所述类别权重系数获取单元用于:根据所述第一分类模型输出的所述候选内容类别对应的被选中率,得到所述候选内容类别对应的类别权重系数。在一些实施例中,所述类别权重系数获取单元用于:计算所述候选内容类别对应的类别向量与所述目标内容的第一特征向量的相关度;根据所述相关度得到所述候选内容类别对应的类别权重系数。在一些实施例中,所述目标内容为视频,所述类别权重系数获取单元用于:获取所述视频对应的第一特征向量,所述第一特征向量包括所述视频对应的图像特征向量或者所述视频对应的音频特征向量的至少一种;计算所述候选内容类别对应的类别向量与所述第一特征向量的相关度。在一些实施例中,所述第一类别特征信息获取模块用于:获取所述第一内容类别对应的类别向量,根据所述第一内容类别对应的类别向量得到所述第一分类层级对应的第一类别特征信息。在一些实施例中,所述第一类别特征信息获取模块用于:获取所述第一分类模型的隐藏层输出的隐层输出向量,根据所述隐层输出向量得到所述第一分类层级对应的第一类别特征信息。在一些实施例中,所述目标分类模型还包括多个特征提取模型以及特征向量融合层,所述目标特征向量获取模块用于:获取各个所述特征提取模型输出的特征向量;将各个所述特征提取模型输出的特征向量输入到所述特征向量融合层中进行融合,得到待分类的目标内容对应的目标特征向量。在一些实施例中,所述目标特征向量获取模块用于:获取对所述目标内容对应的内容语句进行分词得到的词序列,将所述词序列输入到文本特征提取模型中,输出所述词序列中各个词语对应的编码向量;计算各个所述词语对应的编码向量与参考特征向量的相关度,根据所述相关度得到所述词语对应的编码向量的编码权重系数,所述参考特征向量为所述目标内容对应的音频特征向量或者图像特征向量中的至少一个;根据各个所述词语对应的编码向量以及对应的编码权重系数得到文本特征向量。在一些实施例中,所述装置还包括:内容向量得到模块,用于获取所述第一分类模型的隐藏层输出的第一隐层输出向量或者所述第二分类模型的隐藏层输出的第二隐层输出向量中的至少一个,作为所述目标内容对应的内容向量。一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行上述内容分类方法的步骤。一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行上述内容分类方法的步骤。上述内容分类方法、装置、计算机设备和存储介质,通过获取待分类的目标内容对应的目标特征向量,将目标特征向量输入到第一分类模型中,得到第一层级对应的内容类别。并将第一分类层级对应的类别特征信息输入到第二分类模型中,得到第二层级对应的内容类别,第二分类层级的级别低于第一分类层级的级别。由于对内容进行了多个层级的分类,因此内容类别更加精细,而且利用第二分类模型进行分类时,还参考了第一分类层级对应的第一类别特征信息,即利用了粗分类对应的特征信息进行更细致的分类,因此得到的第二内容类别的准确度高。附图说明图1为一些实施例中提供的内容分类方法的应用环境图;图2为一些实施例中内容分类方法的流程图;图3为一些实施例中第一分类模型的结构示意图;图4为一些实施例中将视频输入到目标分类模型,得到分类结果的示意图;图5为一些实施例中获取第一分类层级对应的第一类别特征信息的流程图;图6为一些实施例中目标分类模型的结构示意图;图7为一些实施例中目标分类模型的结构示意图;图8为一些实施例中目标分类模型的结构示意图;图9为一些实施例中目标分类模型的结构示意图;图10为一些实施例中目标分类模型的结构示意图;图11为一些实施例中在视频播放界面展示分类结果的示意图;图12为一些实施例中内容分类装置的结构框图;图13为一些实施例中计算机设备的内部结构框图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明本文档来自技高网...

【技术保护点】
1.一种内容分类方法,所述方法包括:/n获取待分类的目标内容对应的目标特征向量;/n获取已训练得到的目标分类模型,所述目标分类模型包括第一分类模型以及第二分类模型;/n将所述目标特征向量输入到所述第一分类模型中,得到所述目标内容对应的第一内容类别,所述第一内容类别为第一分类层级对应的内容类别;/n获取所述第一分类层级对应的第一类别特征信息;/n将所述第一类别特征信息以及所述目标特征向量输入到所述第二分类模型中,得到所述目标内容对应的第二内容类别,所述第二内容类别为第二分类层级对应的内容类别,所述第二分类层级的级别低于所述第一分类层级的级别;/n将所述第一内容类别以及所述第二内容类别作为所述目标内容对应的分类结果。/n

【技术特征摘要】
1.一种内容分类方法,所述方法包括:
获取待分类的目标内容对应的目标特征向量;
获取已训练得到的目标分类模型,所述目标分类模型包括第一分类模型以及第二分类模型;
将所述目标特征向量输入到所述第一分类模型中,得到所述目标内容对应的第一内容类别,所述第一内容类别为第一分类层级对应的内容类别;
获取所述第一分类层级对应的第一类别特征信息;
将所述第一类别特征信息以及所述目标特征向量输入到所述第二分类模型中,得到所述目标内容对应的第二内容类别,所述第二内容类别为第二分类层级对应的内容类别,所述第二分类层级的级别低于所述第一分类层级的级别;
将所述第一内容类别以及所述第二内容类别作为所述目标内容对应的分类结果。


2.根据权利要求1所述的方法,其特征在于,所述获取所述第一分类层级对应的第一类别特征信息包括:
获取所述第一分类层级中各个候选内容类别对应的类别向量;
获取各个所述候选内容类别对应的类别权重系数;
根据所述候选内容类别对应的类别向量以及对应的类别权重系数计算得到所述第一分类层级对应的第一类别特征信息。


3.根据权利要求2所述的方法,其特征在于,所述将所述目标特征向量输入到所述第一分类模型中,得到所述目标内容对应的第一内容类别包括:
将所述目标特征向量输入到所述第一分类模型中,得到各个所述候选内容类别对应的被选中率;
根据各个所述候选内容类别对应的被选中率确定所述目标内容对应的第一内容类别;
所述获取各个所述候选内容类别对应的类别权重系数包括:
根据所述第一分类模型输出的所述候选内容类别对应的被选中率,得到所述候选内容类别对应的类别权重系数。


4.根据权利要求2所述的方法,其特征在于,所述获取各个所述候选内容类别对应的类别权重系数包括:
计算所述候选内容类别对应的类别向量与所述目标内容的第一特征向量的相关度;
根据所述相关度得到所述候选内容类别对应的类别权重系数。


5.根据权利要求4所述的方法,其特征在于,所述目标内容为视频,所述计算所述候选内容类别对应的类别向量与所述目标内容的第一特征向量的相关度包括:
获取所述视频对应的第一特征向量,所述第一特征向量包括所述视频对应的图像特征向量或者所述视频对应的音频特征向量的至少一种;
计算所述候选内容类别对应的类别向量与所述第一特征向量的相关度。


6.根据权利要求1所述的方法,其特征在于,所述获取所述第一分类层级对应的第一类别特征信息包括:
获取所述第一内容类别对应的类别向量,根据所述第一内容类别对应的类别向量得到所述第一分类层级对应的第一类别特征信息。


7.根据权利要求1所述的方法,其特征在于,所述获取所述第一分类层级对应的第一类别特征信息包括:
获取所述第一分类模型的隐藏层输出的隐层输出向量,根据所述隐层输出向量得到所述第一分类层级对应的第一类别特征信息。


8.根据权利要求1所述的方法,其特征在于,所述目标分类模型还包括多个特征提取模型以及特征向量融合层,所述获取待分类的目标内容对应的目标特征向量包括:
获取各个所述特征提取模型输出的特征向量;
将各个所述特征提取模型输出的特征向量输入到所述特征向量融合层中进行融合...

【专利技术属性】
技术研发人员:叶振旭杨伟东车翔管琰平
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1