【技术实现步骤摘要】
一种信息流分类方法、装置、设备及存储介质
[0001]本申请涉及互联网通信
,尤其涉及一种信息流分类方法、装置、设备及存储介质。
技术介绍
[0002]随着互联网技术的发展,大量社交平台也在不断的升级,除了可以发布一些图文信息之外,也提供了供个人用户随时分享日常的短视频等。为了加强对用户发布信息流的过滤管控,改善信息环境以及对信息流进行分组导航、同类推荐等应用,需要对信息流进行分类。
[0003]现有技术中对信息流分类,往往采用基于人工标注训练样本的有监督分类模型,即需要人工指定一套信息流分类体系(如美食,体育,军事等),然后标注一批覆盖各分类的训练样本,进而通过信息流的相关文本信息,有监督深度学习分类算法训练出信息流分类模型。但上述现有这种基于人工标注训练样本的有监督分类模型的方案存在人工标注需求量大,且实际中由于短视频等信息流的文本信息较少,导致得到的信息流分类模型召回率和分类准确率低。因此,需要提供更可靠或更有效的方案。
技术实现思路
[0004]本申请提供了一种信息流分类方法、装置、设备 ...
【技术保护点】
【技术特征摘要】
1.一种信息流分类方法,其特征在于,所述方法包括:获取多个类别信息和目标信息流的文本信息;根据所述文本信息确定所述目标信息流的目标词向量;确定所述多个类别信息各自的关联类别信息;基于所述多个类别信息与各自的关联类别信息间的相关度,确定所述多个类别信息各自的目标关联类别信息;根据所述多个类别信息各自的目标关联类别信息确定所述多个类别信息各自的类别词向量;基于所述多个类别信息的类别词向量和所述目标词向量间的相似度,确定所述目标信息流的目标类别信息。2.根据权利要求1所述的方法,其特征在于,所述获取多个类别信息包括:获取多个信息流的文本信息;提取所述多个信息流的文本信息中的类别信息;将所述多个信息流的文本信息中的类别信息,作为所述多个类别信息。3.根据权利要求2所述的方法,其特征在于,所述确定所述多个类别信息各自的关联类别信息包括:基于所述多个信息流的文本信息对所述多个类别信息进行共现分析,得到多个类别信息各自的关联类别信息。4.根据权利要求1至3任一所述的方法,其特征在于,所述根据所述多个类别信息各自的目标关联类别信息确定所述多个类别信息各自的类别词向量包括:对所述多个类别信息各自的目标关联类别信息分别进行分词处理,得到所述多个类别信息各自对应的分词信息;基于目标词向量模型确定所述多个类别信息各自对应的分词信息的词向量;根据所述多个类别信息各自对应的分词信息的词向量,确定所述多个类别信息各自的类别词向量。5.根据权利要求1至3任一所述的方法,其特征在于,所述基于所述多个类别信息与各自的关联类别信息间的相关度,确定所述多个类别信息各自的目标关联类别信息包括:计算所述多个类别信息与各自的关联类别信息间的相关度;将相关度满足第一预设条件的关联类别信息作为所述多个类别信息各自的目标关联类别信息。6.根据权利要求1至3任一所述的方法,其特征在于,所述根据所述文本信息确定所...
【专利技术属性】
技术研发人员:康战辉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。