【技术实现步骤摘要】
一种资源筛选方法、装置、电子设备及存储介质
本申请涉及计算机
,尤其涉及智能推荐、智能检索、深度学习等领域。
技术介绍
随着互联网技术的发展,资源生产商为用户提供大量视频资源或文本资源等内容。如果能够筛选出优质资源,就能够实现将优质资源分发给用户,或者通过拆解分析优质资源指导资源生产商(资源的作者)生产出更优质的资源。目前一般采用人工方式挖掘资源库中的优质资源,这种方式效率低下,并且资源的相关度较差。
技术实现思路
本申请提供了一种资源筛选方法、装置、电子设备及存储介质。根据本申请的一方面,提供了一种资源筛选方法,包括:对资源库中的资源进行分类;针对任意类别,确定所述类别的至少一个优质作者;确定与所述至少一个优质作者相似的作者;从资源库中获取所述相似的作者提供的资源,并将获取的资源扩充入所述类别中;从扩充后的类别中筛选优质资源。根据本申请的另一方面,提供了一种资源筛选装置,包括:分类模块,用于对资源库中的资源进行分类;优质作者确定模块,用于针对任意类别,确定所述类别的至少一个优质作者;相似作者确定模块,用于确定与所述至少一个优质作者相似的作者;扩充模块,用于从资源库中获取所述相似的作者提供的资源,并将获取的资源扩充入所述类别中;筛选模块,用于从扩充后的类别中筛选优质资源。根据本申请的另一方面,提供了一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器 ...
【技术保护点】
1.一种资源筛选方法,包括:/n对资源库中的资源进行分类;/n针对任意类别,确定所述类别的至少一个优质作者;/n确定与所述至少一个优质作者相似的作者;/n从资源库中获取所述相似的作者提供的资源,并将获取的资源扩充入所述类别中;/n从扩充后的类别中筛选优质资源。/n
【技术特征摘要】
1.一种资源筛选方法,包括:
对资源库中的资源进行分类;
针对任意类别,确定所述类别的至少一个优质作者;
确定与所述至少一个优质作者相似的作者;
从资源库中获取所述相似的作者提供的资源,并将获取的资源扩充入所述类别中;
从扩充后的类别中筛选优质资源。
2.根据权利要求1所述的方法,其中,所述对资源库中的资源进行分类,包括:
获取资源库中各个资源的标题和标签;
将所述各个资源的标题和标签分别输入预先训练的分类模型,得到各个资源对应的一级行业分类。
3.根据权利要求2所述的方法,其中,所述对资源库中的资源进行分类,还包括:
针对任意所述一级行业分类,获取所述一级行业分类中的各个资源,并确定各个资源的标题和标签;
将所述各个资源的标题和标签分别输入预先训练的分类模型,得到各个资源对应的二级行业分类。
4.根据权利要求2或3所述的方法,其中,所述分类模型包括来自变换器的双向编码器表征量BERT层、向量叠加层和归一化层;
所述BERT层被配置为接收所述资源的标题和标签,确定所述资源的标题对应的标题向量和所述资源的标签对应的标签向量,并将所述标题向量和标签向量发送至所述向量叠加层;
所述向量叠加层被配置为接收所述标题向量和所述标签向量,将所述标题向量和所述标签向量进行叠加,将叠加后的向量发送至所述归一化层;
所述归一化层被配置为接收所述叠加后的向量,根据叠加后的向量确定所述资源对应的行业分类;所述行业分类包括一级行业分类或二级行业分类。
5.根据权利要求4所述的方法,其中,所述BERT层包括第一BERT模块和第二BERT模块;
所述第一BERT模块被配置为接收所述资源的标题,确定所述资源的标题对应的标题向量,并将所述标题向量发送至所述向量叠加层;
所述第二BERT模块被配置为接收所述资源的标签,确定所述资源的标签对应的标签向量,并将所述标签向量发送至所述向量叠加层。
6.根据权利要求1至3任一所述的方法,其中,所述针对任意类别,确定所述类别的至少一个优质作者,包括:
确定提供所述类别中的视频资源的作者;
针对各个作者,根据所述作者提供的视频资源的点播数量、展现数量、播放完成率及互动率中的至少一项,确定所述作者是否为优质作者。
7.根据权利要求1至3任一所述的方法,其中,所述确定与所述至少一个优质作者相似的作者,包括:
根据各个作者提供的资源类别、各个作者提供的资源的用户类型及预先确定的相似作者信息中的至少一项,确定与所述至少一个优质作者相似的作者。
8.根据权利要求1至3任一所述的方法,其中,所述从扩充后的类别中筛选优质资源,包括:
针对扩充后的类别中的各个资源,根据所述资源的点播数量、展现数量、播放完成率及互动率中的至少一项,确定所述资源是否为优质资源。
9.一种资源筛选装置,包括:
分类模块,用于对资源库中的资源进行分类;
优质作者确定模块,用于针对任意类别,确定所述类别的至少一个优质作者;
相似作者确定模块,用于确定与所述至少一个优质作者相似的作者;
扩充模块,用于从资源库...
【专利技术属性】
技术研发人员:刘少杰,黄华,章巍巍,石瑾,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。