一种资源筛选方法、装置、电子设备及存储介质制造方法及图纸

技术编号:26650731 阅读:28 留言:0更新日期:2020-12-09 00:51
本申请公开了资源筛选方法、装置、电子设备及存储介质,涉及智能推荐、智能检索、深度学习等领域。具体实现方案为:对资源库中的资源进行分类;针对任意类别,确定所述类别的至少一个优质作者;确定与至少一个优质作者相似的作者;从资源库中获取相似的作者提供的资源,并将获取的资源扩充入该类别中;从扩充后的类别中筛选优质资源。本申请实施例能够提高资源筛选效率,并提高资源的相关度。

【技术实现步骤摘要】
一种资源筛选方法、装置、电子设备及存储介质
本申请涉及计算机
,尤其涉及智能推荐、智能检索、深度学习等领域。
技术介绍
随着互联网技术的发展,资源生产商为用户提供大量视频资源或文本资源等内容。如果能够筛选出优质资源,就能够实现将优质资源分发给用户,或者通过拆解分析优质资源指导资源生产商(资源的作者)生产出更优质的资源。目前一般采用人工方式挖掘资源库中的优质资源,这种方式效率低下,并且资源的相关度较差。
技术实现思路
本申请提供了一种资源筛选方法、装置、电子设备及存储介质。根据本申请的一方面,提供了一种资源筛选方法,包括:对资源库中的资源进行分类;针对任意类别,确定所述类别的至少一个优质作者;确定与所述至少一个优质作者相似的作者;从资源库中获取所述相似的作者提供的资源,并将获取的资源扩充入所述类别中;从扩充后的类别中筛选优质资源。根据本申请的另一方面,提供了一种资源筛选装置,包括:分类模块,用于对资源库中的资源进行分类;优质作者确定模块,用于针对任意类别,确定所述类别的至少一个优质作者;相似作者确定模块,用于确定与所述至少一个优质作者相似的作者;扩充模块,用于从资源库中获取所述相似的作者提供的资源,并将获取的资源扩充入所述类别中;筛选模块,用于从扩充后的类别中筛选优质资源。根据本申请的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任一项所述的方法。根据本申请的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行上述任一项所述的方法。本申请实施例提出的资源筛选方法,通过对资源库中的任意类别中的资源进行扩充,并从扩充后的类别中筛选优质资源,能够提高资源筛选的效率,并且提高资源的相关度。应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。附图说明附图用于更好地理解本方案,不构成对本申请的限定。其中:图1是本申请实施例的一种资源筛选方法实现流程图;图2是本申请实施例的一种资源筛选方法实现框图;图3是本申请实施例的一种资源筛选方法中,对资源库中的资源进行分类的实现流程图;图4是本申请实施例的分类模型的结构示意图;图5是本申请实施例的一种资源筛选方法中,确定优质作者的实现流程图;图6是本申请实施例的一种资源筛选装置600的结构示意图;图7是本申请实施例的一种资源筛选装置700的结构示意图;图8是用来实现本申请实施例的资源筛选方法的电子设备的框图。具体实施方式以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。本申请实施例提出一种资源筛选方法,图1是本申请实施例的一种资源筛选方法实现流程图,包括:步骤S101:对资源库中的资源进行分类;步骤S102:针对任意类别,确定该类别的至少一个优质作者;步骤S103:确定与该至少一个优质作者相似的作者;步骤S104:从资源库中获取该相似的作者提供的资源,并将获取的资源扩充入该类别中;步骤S105:从扩充后的类别中筛选优质资源。可选地,在上述步骤S101中,可以对资源库中的资源进行一级行业分类,得到多个一级类别。或者,进一步对各个一级类别进行二级行业分类,得到各个一级类别下的二级类别。相应的,在上述步骤S102至S105中,可以针对一级类别或二级类别进行优质资源筛选。图2是本申请实施例的一种资源筛选方法实现框图,图2以对资源库中的资源进行两次行业分类为例。图2的示例中,资源库中的资源包括视频资源;本申请实施例也适用于其他类型的资源,如文本资源等。如图2所示,首先对资源全集进行一级行业分类。其中,资源全集包括站内的短视频、小视频、长视频等。一级行业分类如划分为家装、教育、医美等一级类别。之后,针对各个一级类别进行二级行业分类,例如,将教育类别划分为成人教育、学生教育、职场提升、留学等二级类别。之后,针对任意一个二级类别,可以首先确定该类别中的优质作者(或称为行业头部作者);之后确定与优质作者相似的作者,获取这些相似作者的作品,将获取的作品填充入该二级类别中,从而实现作者维度的资源扩充。最后,从扩充之后的类别筛选出优质资源。本申请实施例提出的资源筛选方式相对于现有的人工筛选方式而言,能够显著提高资源筛选效率。并且,由于在作者维度对类别中的资源进行扩充,因此筛选出的资源的相关度较高。以下详细介绍上述各个步骤的实现方式示例。图3是本申请实施例的一种资源筛选方法中,对资源库中的资源进行分类的实现流程图,包括:步骤S301:获取资源库中各个资源的标题和标签;步骤S302:将各个资源的标题和标签分别输入预先训练的分类模型,得到各个资源对应的一级行业分类。可选地,本申请实施例还可以对各个一级行业分类(或称一级类别)中的资源再次进行分类,即进行二级行业分类,从而得到每个一级行业分类下的至少一个二级行业分类(或称二级类别)。如图3包括,上述分类过程还可以包括:步骤S303:针对任意一级行业分类,获取该一级行业分类中的各个资源,并确定各个资源的标题和标签;步骤S304:将所述各个资源的标题和标签分别输入预先训练的分类模型,得到各个资源对应的二级行业分类。后续还可以对二级行业分类再次进行分类,以此类推。这种逐层划分类别的方式能够实现对资源类别的精细划分。在一些实施方式中,预先训练的分类模型可以包括来自变换器的双向编码器表征量(BERT,BidirectionalEncoderRepresentationsfromTransformers)层、向量叠加层和归一化层;其中,BERT层被配置为接收资源的标题和标签,确定资源的标题对应的标题向量和资源的标签对应的标签向量,并将标题向量和标签向量发送至向量叠加层;向量叠加层被配置为接收该标题向量和标签向量,将该标题向量和标签向量进行叠加,将叠加后的向量发送至归一化(Softmax)层;归一化层被配置为接收该叠加后的向量,根据叠加后的向量确定资源对应的行业分类。其中,该行业分类可以为一级行业分类或二级行业分类等。如果输入该分类模型的是资源库中的各个资源的标题和标签,则该分类模型输出的内容为资源的一级行业分类;本文档来自技高网...

【技术保护点】
1.一种资源筛选方法,包括:/n对资源库中的资源进行分类;/n针对任意类别,确定所述类别的至少一个优质作者;/n确定与所述至少一个优质作者相似的作者;/n从资源库中获取所述相似的作者提供的资源,并将获取的资源扩充入所述类别中;/n从扩充后的类别中筛选优质资源。/n

【技术特征摘要】
1.一种资源筛选方法,包括:
对资源库中的资源进行分类;
针对任意类别,确定所述类别的至少一个优质作者;
确定与所述至少一个优质作者相似的作者;
从资源库中获取所述相似的作者提供的资源,并将获取的资源扩充入所述类别中;
从扩充后的类别中筛选优质资源。


2.根据权利要求1所述的方法,其中,所述对资源库中的资源进行分类,包括:
获取资源库中各个资源的标题和标签;
将所述各个资源的标题和标签分别输入预先训练的分类模型,得到各个资源对应的一级行业分类。


3.根据权利要求2所述的方法,其中,所述对资源库中的资源进行分类,还包括:
针对任意所述一级行业分类,获取所述一级行业分类中的各个资源,并确定各个资源的标题和标签;
将所述各个资源的标题和标签分别输入预先训练的分类模型,得到各个资源对应的二级行业分类。


4.根据权利要求2或3所述的方法,其中,所述分类模型包括来自变换器的双向编码器表征量BERT层、向量叠加层和归一化层;
所述BERT层被配置为接收所述资源的标题和标签,确定所述资源的标题对应的标题向量和所述资源的标签对应的标签向量,并将所述标题向量和标签向量发送至所述向量叠加层;
所述向量叠加层被配置为接收所述标题向量和所述标签向量,将所述标题向量和所述标签向量进行叠加,将叠加后的向量发送至所述归一化层;
所述归一化层被配置为接收所述叠加后的向量,根据叠加后的向量确定所述资源对应的行业分类;所述行业分类包括一级行业分类或二级行业分类。


5.根据权利要求4所述的方法,其中,所述BERT层包括第一BERT模块和第二BERT模块;
所述第一BERT模块被配置为接收所述资源的标题,确定所述资源的标题对应的标题向量,并将所述标题向量发送至所述向量叠加层;
所述第二BERT模块被配置为接收所述资源的标签,确定所述资源的标签对应的标签向量,并将所述标签向量发送至所述向量叠加层。


6.根据权利要求1至3任一所述的方法,其中,所述针对任意类别,确定所述类别的至少一个优质作者,包括:
确定提供所述类别中的视频资源的作者;
针对各个作者,根据所述作者提供的视频资源的点播数量、展现数量、播放完成率及互动率中的至少一项,确定所述作者是否为优质作者。


7.根据权利要求1至3任一所述的方法,其中,所述确定与所述至少一个优质作者相似的作者,包括:
根据各个作者提供的资源类别、各个作者提供的资源的用户类型及预先确定的相似作者信息中的至少一项,确定与所述至少一个优质作者相似的作者。


8.根据权利要求1至3任一所述的方法,其中,所述从扩充后的类别中筛选优质资源,包括:
针对扩充后的类别中的各个资源,根据所述资源的点播数量、展现数量、播放完成率及互动率中的至少一项,确定所述资源是否为优质资源。


9.一种资源筛选装置,包括:
分类模块,用于对资源库中的资源进行分类;
优质作者确定模块,用于针对任意类别,确定所述类别的至少一个优质作者;
相似作者确定模块,用于确定与所述至少一个优质作者相似的作者;
扩充模块,用于从资源库...

【专利技术属性】
技术研发人员:刘少杰黄华章巍巍石瑾
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1