一种提升多标签分类正确率的方法及系统技术方案

技术编号:30102051 阅读:10 留言:0更新日期:2021-09-18 09:07
本发明专利技术提供一种提升多标签分类正确率的方法及系统,包括以下步骤:S1.获取需分类的社交媒体用户中每一个需分类的用户对多个监控自媒体运营平台的在线信息;S2.根据每一个需分类的用户对多个监控自媒体运营平台的在线信息,获取每个所述的需分类的用户的自媒体运行数据;S3.基于各个所述的需分类的用户的自媒体运行数据,将所述的需分类的社交媒体用户划分成多个标签分类。本发明专利技术够根据需分类的用户对自媒体运营平台的使用情况以及每个自媒体运营平台的主题标签,确定需分类的用户的在线信息,更加全面的在线信息来对用户群体特征进行挖掘,能够得到更全面完整的挖掘结果。能够得到更全面完整的挖掘结果。

【技术实现步骤摘要】
一种提升多标签分类正确率的方法及系统


[0001]本申请涉及数据分析
,具体而言,涉及一种提升多标签分类正确率的方法及系统。

技术介绍

[0002]社交媒体作为互联网时代的产物,已经成为人们生活中不可或缺的一部分,用户账号作为信息的发布者和传播者,蕴藏着大量有价值的数据信息。因此对海量账号进行有针对性地识别和分类,有利于减少传统账号管理系统构建所需的人力资源和时间成本,同时也能更全面有效地获取某个领域的实时信息和动态。
[0003]现有技术一般通过获取注册用于在线信息来确定其自媒体运行数据。但是注册用于在使用的时候,可能会同时使用多个自媒体,所以是很难全面获取其完整自媒体运行数据的。因而这种自媒体运行数据的获取方法存在全面性差的技术问题。

技术实现思路

[0004]针对上述技术问题,本申请提供一种提升多标签分类正确率的方法及系统,能够基于用户对自媒体运营平台的使用情况来确定用户的自媒体运行数据,并基于自媒体运行数据对社交媒体用户进行标签分类,基于这种标签分类结果对社交媒体用户特征进行挖掘,能够提高挖掘信息的全面性。
[0005]一种提升多标签分类正确率的方法,包括以下步骤:
[0006]S1.获取需分类的社交媒体用户中每一个需分类的用户对多个监控自媒体运营平台的在线信息;
[0007]S2.根据每一个需分类的用户对多个监控自媒体运营平台的在线信息,获取每个所述的需分类的用户的自媒体运行数据;
[0008]S3.基于各个所述的需分类的用户的自媒体运行数据,将所述的需分类的社交媒体用户划分成多个标签分类。
[0009]优选的,S1之前,还包括以下步骤:
[0010]S0.确定主题领域;
[0011]将主题标签归属于所述的主题领域的多个自媒体运营平台确定为监控自媒体运营平台;
[0012]以及,将使用所述的监控自媒体运营平台的数量达到监控数量阈值的个体,确定为所述的需分类的用户。
[0013]进一步的,S1中所述的在线信息包括:在线时间;
[0014]S1的具体包括以下步骤:
[0015]针对每个需分类的用户,获取监控历史时间段内,所述的需分类的用户与各个监控自媒体运营平台的在线时间;
[0016]S2具体包括以下步骤:
[0017]针对每个需分类的用户,按照所述的需分类的用户与各个监控自媒体运营平台之间在线时间的先后顺序,以及每个监控自媒体运营平台的位置信息,生成所述的需分类的用户的自媒体运行数据。
[0018]优选的,S3具体包括以下步骤:
[0019]基于所述的各个需分类的用户的自媒体运行数据,对所述的需分类的社交媒体用户中的各个所述的需分类的用户进行聚类,获得多个所述的标签分类。
[0020]进一步的,S3后,还包括以下步骤:
[0021]S4.针对每个标签分类,基于所述的标签分类中所包括的各个需分类的用户对各个监控自媒体运营平台的在线次数信息,对所述的标签分类中所包括的多个需分类的用户进行分类,获得与所述的标签分类对应的至少一个子分类;
[0022]所述的在线次数信息包括:在线频次或者在线次数。
[0023]进一步的,S4具体包括以下步骤:
[0024]S41.针对每个需分类的用户,获取所述的需分类的用户与各个监控自媒体运营平台之间的在线时间;
[0025]S42.针对每个监控自媒体运营平台,统计所述的需分类的用户与所述的监控自媒体运营平台之间的在线时间落入监控历史时间段内的在线次数信息;
[0026]S43.基于所述的标签分类中所包括的各个需分类的用户与各个监控自媒体运营平台的在线次数,对所述的标签分类中所包括的多个需分类的用户进行聚类,获得多个子分类。
[0027]优选的,S43具体包括以下步骤:
[0028]S431.基于所述的标签分类中所包括的各个需分类的用户与各个监控自媒体运营平台的在线次数信息,建立所述的标签分类中所包括的各个需分类的用户对应的次数特征向量;
[0029]S432.使用监控的聚类算法,并基于所述的标签分类中包括的各个需分类的用户对应的次数特征向量,对所述的标签分类中所包括的所有需分类的用户进行聚类。
[0030]优选的,S431之前,还包括以下步骤:
[0031]S430.对所述的标签分类中所包括的各个需分类的用户与各个监控自媒体运营平台的在线次数进行去干扰处理;
[0032]S431具体包括以下步骤:
[0033]基于去干扰处理的结果,建立所述的标签分类中所包括的各个需分类的用户对应的次数特征向量。
[0034]进一步的,S430具体包括以下步骤:
[0035]将所述的标签分类中所包括的各个需分类的用户与各个监控自媒体运营平台的在线次数对数化;
[0036]所述的在线次数对数化后,小于监控阈值的监控自媒体运营平台的在线次数归零。
[0037]本专利技术还提供一种提升多标签分类正确率的系统,包括:
[0038]获取单元,用于获取需分类的社交媒体用户中每一个需分类的用户对多个监控自媒体运营平台的在线时间信息;
[0039]自媒体运行计算单元,用于根据每一个需分类的用户对多个监控自媒体运营平台的在线时间信息,获取每个所述的需分类的用户的自媒体运行数据;
[0040]分类单元,用于基于各个所述的需分类的用户的自媒体运行数据,将所述的需分类的社交媒体用户划分成多个标签分类。
[0041]本专利技术通过获取带分类社交媒体用户中每一个需分类的用户对多个监控自媒体运营平台的在线信息,来确定需分类的用户的自媒体运行数据,自媒体运营平台能够持续获得用户的在线信息,从而能够根据需分类的用户对自媒体运营平台的使用情况以及每个自媒体运营平台的主题标签,确定需分类的用户的在线信息,更加全面的在线信息来对用户群体特征进行挖掘,能够得到更全面完整的挖掘结果。
具体实施方式
[0042]为了使本申请的目的、技术方案及优点更加清楚明白,以下结合实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0043]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请。
[0044]实施例1
[0045]一种提升多标签分类正确率的方法,包括以下步骤:
[0046]S1.获取需分类的社交媒体用户中每一个需分类的用户对多个监控自媒体运营平台的在线信息;
[0047]S2.根据每一个需分类的用户对多个监控自媒体运营平台的在线信息,获取每个所述的需分类的用户的自媒体运行数据;
[0048]S3.基于各个所述的需分类的用户的自媒体运行数据,将所述的需分类的社交媒体用户划分成多个标签分类。
[0049]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提升多标签分类正确率的方法,其特征在于,包括以下步骤:S1.获取需分类的社交媒体用户中每一个需分类的用户对多个监控自媒体运营平台的在线信息;S2.根据每一个需分类的用户对多个监控自媒体运营平台的在线信息,获取每个所述的需分类的用户的自媒体运行数据;S3.基于各个所述的需分类的用户的自媒体运行数据,将所述的需分类的社交媒体用户划分成多个标签分类。2.根据权利要求1所述的一种提升多标签分类正确率的方法,其特征在于,S1之前,还包括以下步骤:S0.确定主题领域;将主题标签归属于所述的主题领域的多个自媒体运营平台确定为监控自媒体运营平台;以及,将使用所述的监控自媒体运营平台的数量达到监控数量阈值的个体,确定为所述的需分类的用户。3.根据权利要求1所述的一种提升多标签分类正确率的方法,其特征在于,S1中所述的在线信息包括:在线时间;S1的具体包括以下步骤:针对每个需分类的用户,获取监控历史时间段内,所述的需分类的用户与各个监控自媒体运营平台的在线时间;S2具体包括以下步骤:针对每个需分类的用户,按照所述的需分类的用户与各个监控自媒体运营平台之间在线时间的先后顺序,以及每个监控自媒体运营平台的位置信息,生成所述的需分类的用户的自媒体运行数据。4.根据权利要求1所述的一种提升多标签分类正确率的方法,其特征在于,S3具体包括以下步骤:基于所述的各个需分类的用户的自媒体运行数据,对所述的需分类的社交媒体用户中的各个所述的需分类的用户进行聚类,获得多个所述的标签分类。5.根据权利要求1所述的一种提升多标签分类正确率的方法,其特征在于,S3后,还包括以下步骤:S4.针对每个标签分类,基于所述的标签分类中所包括的各个需分类的用户对各个监控自媒体运营平台的在线次数信息,对所述的标签分类中所包括的多个需分类的用户进行分类,获得与所述的标签分类对应的至少一个子分类;所述的在线次数信息包括:在线频次或者在线次数。6.根据权利要求5所述的一种提升多标签分类正确率的方法,其特征在于,S4具体包括以下步骤:S41.针对每个需分类的用...

【专利技术属性】
技术研发人员:邹时新
申请(专利权)人:无锡路途网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1