标签的填充方法及终端设备技术

技术编号：20363268 阅读：28 留言：0更新日期：2019-02-16 16:42

本发明专利技术适用于数据分析技术领域，提供了一种标签的填充方法及终端设备，通过从用户集合中各个用户对应的用户标签所属的标签类型中，确定出被选标签类型以及普通标签类型，依次根据每个普通标签类型对用户集合中的各个用户进行分类，在进行多次分类后，生成用户集合对应的分类树模型；将分类树模型中最底层的各个叶子节点对应的含有被选标签类型的用户标签的用户作为参考用户，并根据叶子节点中各个参考用户的被选标签类型的标签，为该叶子节点对应的参考用户以外的用户填充属于所述被选标签类型的标签，以在无需用户补录标签的情况下，自动为相关用户填充准确的各类标签，保障依赖标签的相关后续分析工作顺利进行。

全部详细技术资料下载

【技术实现步骤摘要】
标签的填充方法及终端设备
本专利技术属于数据分析
，尤其涉及一种标签的填充方法及终端设备。
技术介绍
当前，大量的业务是依靠用户的标签才能完成的，例如一个保险业务，金融机构需要知道一个用户的性别、年龄、健康状况、城市以及职业等标签，只有综合了各个标签，才能计算出一个合理的保险产品的价格，以及对未来风险进行更加准确的评估。然而，在用户数据收集的阶段，一个用户的标签有时是不完整的，例如，一个金融产品后续的相关计算过程需要结合用户的10类标签，但是在用户数据收集的阶段，只收集到8类标签，则可能还有2类标签是不清楚的。可以理解地，在现有技术中，从用户角度看，一个用户存在标签不完整的情况，从标签的角度看，一类标签难以覆盖全部的用户，存在标签覆盖率不高的情况。正是由于上述情况，在现有技术中，用户经常需要补录标签，若在不补录标签的情况下，后续的金融分析便难以进行。因此，当前在数据分析领域存在由于用户标签不完整，导致的数据分析不准确的或难以进行的问题。
技术实现思路
有鉴于此，本专利技术实施例提供了一种标签的填充方法及终端设备，以解决现有技术存在的标签覆盖率低的问题。本专利技术实施例的第一方面提供了一种标签的填充方法，包括：获取预设的用户集合中各个用户的用户信息，所述用户信息中包含一个以上的用户标签；从所述用户集合中各个用户对应的用户标签所属的标签类型中，确定一个标签类型作为被选标签类型，并将所述被选标签类型以外的标签类型作为普通标签类型；依次根据每个所述普通标签类型对所述用户集合中的各个用户进行分类，在进行多次分类后，生成所述用户集合对应的分类树模型，所述分类树模型的...

【技术保护点】
1.一种标签的填充方法，其特征在于，包括：获取预设的用户集合中各个用户的用户信息，所述用户信息中包含一个以上的用户标签；从所述用户集合中各个用户对应的用户标签所属的标签类型中，确定一个标签类型作为被选标签类型，并将所述被选标签类型以外的标签类型作为普通标签类型；依次根据每个所述普通标签类型对所述用户集合中的各个用户进行分类，在进行多次分类后，生成所述用户集合对应的分类树模型，所述分类树模型的每一个子节点对应一个以上的用户；将所述分类树模型中最底层的各个叶子节点对应的含有所述被选标签类型的用户标签的用户作为参考用户，并根据所述叶子节点中各个所述参考用户的被选标签类型的标签，为该叶子节点对应的所述参考用户以外的用户填充属于所述被选标签类型的标签。

【技术特征摘要】
1.一种标签的填充方法，其特征在于，包括：获取预设的用户集合中各个用户的用户信息，所述用户信息中包含一个以上的用户标签；从所述用户集合中各个用户对应的用户标签所属的标签类型中，确定一个标签类型作为被选标签类型，并将所述被选标签类型以外的标签类型作为普通标签类型；依次根据每个所述普通标签类型对所述用户集合中的各个用户进行分类，在进行多次分类后，生成所述用户集合对应的分类树模型，所述分类树模型的每一个子节点对应一个以上的用户；将所述分类树模型中最底层的各个叶子节点对应的含有所述被选标签类型的用户标签的用户作为参考用户，并根据所述叶子节点中各个所述参考用户的被选标签类型的标签，为该叶子节点对应的所述参考用户以外的用户填充属于所述被选标签类型的标签。2.如权利要求1所述的标签的填充方法，其特征在于，所述依次根据每个所述普通标签类型对所述用户集合中的各个用户进行分类，在进行多次分类后，生成所述用户集合对应的分类树模型，包括：根据预设规则从所述普通标签类型中选取一个初始标签类型，通过所述初始标签类型对所述用户集合中的各个用户进行分类，生成根节点下的第一层子节点，以得到初始的分类树模型，所述根节点对应所述用户集合中的全部用户；重复执行下列操作，直至更新后的分类树模型满足预设的截止条件，则输出更新后的所述分类树模型：根据预设规则选取一个未被选取过的所述普通标签类型作为当前的分类标签类型，通过所述当前的分类标签类型对当前的分类树模型最下层的各个子节点对应的用户进行分类，生成下一层的子节点，以更新当前的分类树模型。3.如权利要求2所述的标签的填充方法，其特征在于，所述根据预设规则选取一个未被选取过的普通标签类型作为当前的分类标签类型，包括；根据所述用户集合中各个用户的用户标签所属的标签类型，生成所述用户与所述标签类型的对应关系，并统计各个所述未被选取过的普通标签类型对应的用户的用户数量；在所述未被选取过的普通标签类型中，选取所述用户数量最大的所述普通标签类型作为当前的分类标签类型。4.如权利要求2所述的标签的填充方法，其特征在于，还包括：若更新后的分类树模型最下层的各个叶子节点对应的用户的数量的平均值小于数量阈值，则判定所述更新后的分类树模型满足预设的截止条件。5.如权利要求1所述的标签的填充方法，其特征在于，所述根据所述叶子节点中各个所述参考用户的被选标签类型的标签，为该叶子节点对应的所述参考用户以外的用户填充属于所述被选标签类型的标签，包括：计算所述叶子节点中所述参考用户对应的属于所述被选标签类型的各个标签的比例，作为标签比例；将所述标签比例最高的标签填充为该叶子节点对应的所述参考用户以外的用户的标签。6.一种终端设备，包括存储器以及处理器，所...

【专利技术属性】
技术研发人员：裴阳，
申请(专利权)人：平安科技深圳有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人