当前位置: 首页 > 专利查询>中国移动浙江创新研究院有限公司中国移动通信集团有限公司专利>正文

网址分类模型的生成方法、装置、计算设备及存储介质制造方法及图纸

技术编号：39275279 阅读：11 留言：0更新日期：2023-11-07 10:52

本发明专利技术公开了一种网址分类模型的生成方法、装置、计算设备及存储介质。方法包括：获取多个第一时间窗口的网址数据，根据该第一时间窗口的网址数据生成第一时间窗口的源域样本及训练好的第一网址分类模型；获取第二时间窗口的网址数据，根据第二时间窗口的网址数据生成第二时间窗口的目标域样本；计算第一时间窗口的源域样本与目标域样本的数据分布关联度，根据数据分布关联度确定第一时间窗口对应的权重；根据权重及训练好的第一网址分类模型，生成第二时间窗口对应的第二网址分类模型。采用本方案，能够提升第二网址分类模型的生成效率以及分类精度，并且生成的第二网址分类模型能够适配不同的数据分布，具有较高的稳定性及泛化性。泛化性。泛化性。

全部详细技术资料下载

【技术实现步骤摘要】
网址分类模型的生成方法、装置、计算设备及存储介质

[0001]本专利技术涉及网络
，具体涉及一种网址分类模型的生成方法、装置、计算设备及存储介质。

技术介绍

[0002]随着网络技术的飞速发展，对网址分类的需求也日益增加。其中，基于机器学习的网址分类模型能够有效地实现网址分类，从而被广泛地应用于网址分类场景中。
[0003]然而，专利技术人在实施过程中发现，现有技术中存在如下缺陷：现有技术通常是通过统一的网址分类模型来对不同时段采集的网址进行分类，该种方式对网址的分类精度低，无法对不同数据分布的网址进行精准分类。

技术实现思路

[0004]鉴于上述问题，提出了本专利技术以便提供一种克服上述问题或者至少部分地解决上述问题的网址分类模型的生成方法、装置、计算设备及存储介质。
[0005]根据本专利技术的一个方面，提供了一种网址分类模型的生成方法，包括：
[0006]针对于多个第一时间窗口中的任一第一时间窗口，获取该第一时间窗口的网址数据，并根据该第一时间窗口的网址数据生成该第一时间窗口的源域样本以及获得该第一时间窗口对应的训练好的第一网址分类模型；
[0007]获取第二时间窗口的网址数据，并根据第二时间窗口的网址数据生成第二时间窗口的目标域样本；
[0008]分别计算各个第一时间窗口的源域样本与目标域样本的数据分布关联度，并根据所述数据分布关联度确定各个第一时间窗口对应的权重；
[0009]根据所述权重以及各个训练好的第一网址分类模型，生成第二时间窗口

【技术保护点】

【技术特征摘要】
1.一种网址分类模型的生成方法，其特征在于，包括：针对于多个第一时间窗口中的任一第一时间窗口，获取该第一时间窗口的网址数据，并根据该第一时间窗口的网址数据生成该第一时间窗口的源域样本以及获得该第一时间窗口对应的训练好的第一网址分类模型；获取第二时间窗口的网址数据，并根据第二时间窗口的网址数据生成第二时间窗口的目标域样本；分别计算各个第一时间窗口的源域样本与目标域样本的数据分布关联度，并根据所述数据分布关联度确定各个第一时间窗口对应的权重；根据所述权重以及各个训练好的第一网址分类模型，生成第二时间窗口对应的第二网址分类模型。2.根据权利要求1所述的方法，其特征在于，所述获得该第一时间窗口对应的训练好的第一网址分类模型进一步包括：构建第一网址分类模型的多个基分类器；对所述多个基分类器进行训练，并获得训练好的基分类器；对多个训练好的基分类器进行融合训练，以确定出各个训练好的基分类器的权重；根据各个训练好的基分类器以及所述基分类器的权重，获得所述训练好的第一网址分类模型。3.根据权利要求2所述的方法，其特征在于，所述根据该第一时间窗口的网址数据生成该第一时间窗口的源域样本进一步包括：根据该第一时间窗口的网址数据生成该第一时间窗口的候选源域样本，并将候选源域样本放置于源域样本集合中；从源域样本集合中取出任一候选源域样本，利用该候选源域样本对所述多个基分类器进行训练，并获得多个基分类器针对该候选源域样本的分类结果；根据多个基分类器针对该候选源域样本的分类结果，计算该候选源域样本的置信度；判断该候选源域样本的置信度是否大于预设置信度阈值；若是，则将该候选源域样本放回源域样本集合中；若否，则剔除该候选源域样本；将多个基分类器训练结束后源域样本集合中的候选源域样本作为该第一时间窗口的源域样本。4.根据权利要求3所述的方法，其特征在于，所述根据多个基分类器针对该候选源域样本的分类结果，计算该候选源域样本的置信度进一步包括：计算多个基分类器针对该候选源域样本的分类结果的相似度，根据所述相似度确定该候选源域样本的置信度。5.根据权利要求2
‑
4中任一项所述的方法，其特征在于...

【专利技术属性】
技术研发人员：胡泽远，罗琼，李海传，蒋健，
申请(专利权)人：中国移动浙江创新研究院有限公司中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人