应用程序分类方法、装置、电子设备及计算机程序产品制造方法及图纸

技术编号:37321742 阅读:20 留言:0更新日期:2023-04-21 23:01
本申请涉及应用程序处理技术领域,提供一种应用程序分类方法、装置、电子设备及计算机程序产品,该方法包括:通过预设使用统计指标对各个目标应用程序进行排序,创建各个目标应用程序之间的上下文关系;基于预设编码方式对各个目标应用程序进行编码,并根据上下文关系将各个编码后的目标应用程序进行训练,得到各个目标应用程序对应的词向量;根据各个词向量对各个目标应用程序进行分类,得到各个应用程序类,并根据预设去重方法对各个应用程序类进行聚合,得到各个最终应用程序类。本申请实施例提供的应用程序分类方法实现了应用程序分类的全自动化,有效降低了人工参与引入的客观误差,提高了应用程序分类准确性。提高了应用程序分类准确性。提高了应用程序分类准确性。

【技术实现步骤摘要】
应用程序分类方法、装置、电子设备及计算机程序产品


[0001]本申请涉及应用程序处理
,尤其涉及一种应用程序分类方法、装置、电子设备及计算机程序产品。

技术介绍

[0002]现阶段应用程序分类主要依赖于应用程序的产品定位和相关外部数据,根据产品定位和相关外部数据将各个应用程序归属为某一大类中,建立大类应用程序名称的字典映射表。在大类应用程序名称的映射中,大类应用程序的个数、实际种类名称以及包含哪些应用程序等都需要人工方式进行确定。在实际应用场景中,某个应用程序可能属于多个大类,并且其在各个大类中的比重各不相同。对于各个应用程序的分类详细归属和权重值分配,往往需要巨大的人工分析,并且过程中会引入巨大的客观误差。除此之外,随着应用程序的新增、功能变化等,应用程序分类随着时间推移往往不够准确。

技术实现思路

[0003]本申请提供一种应用程序分类方法、装置、电子设备及计算机程序产品,旨在提高应用程序分类准确性。
[0004]第一方面,本申请提供一种应用程序分类方法,包括:
[0005]通过预设使用统计指标对各个目标应用程序进行排序,创建各个所述目标应用程序之间的上下文关系;
[0006]基于预设编码方式对各个所述目标应用程序进行编码,并根据所述上下文关系将各个编码后的目标应用程序进行训练,得到各个所述目标应用程序对应的词向量;
[0007]根据各个所述词向量对各个所述目标应用程序进行分类,得到各个应用程序类,并根据预设去重方法对各个所述应用程序类进行聚合,得到各个最终应用程序类。
[0008]在一实施例中,所述根据各个所述词向量对各个所述目标应用程序进行分类,得到各个应用程序类,并根据预设去重方法对各个所述应用程序类进行聚合,得到各个最终应用程序类的步骤之后,还包括:
[0009]根据各个所述最终应用程序类的第一中心编码向量,及其对应的各个目标应用程序的编码向量,确定各个所述最终应用程序类中各个目标应用程序的权重值;
[0010]将各个所述最终应用程序类中,各个目标应用程序的权重值及其对应的使用数据进行加权求和,得到各个所述最终应用程序类的汇总数据;
[0011]根据各个所述最终应用程序类的汇总数据,分析各个所述最终应用程序类的使用数据。
[0012]所述根据各个所述词向量对各个所述目标应用程序进行分类,得到各个应用程序类,并根据预设去重方法对各个所述应用程序类进行聚合,得到各个最终应用程序类的步骤之后,还包括:
[0013]根据各个所述最终应用程序类的第一中心编码向量和空应用程序类的第二中心
编码向量,确定各个余弦相似度值;
[0014]根据各个所述余弦相似度值和预设相似度值,确定目标应用程序类;
[0015]将所述目标应用程序类中各个目标应用程序的使用数据,及其对应的目标余弦相似度值进行加权求和,得到所述空应用程序类的使用数据;
[0016]根据所述目标应用程序类的实际使用数据和所述空应用程序类的使用数据,确定用户画像数据。
[0017]所述根据所述目标应用程序类的实际使用数据和所述空应用程序类的使用数据,确定用户画像数据的步骤包括:
[0018]以所述目标应用程序类的实际使用数据作为第一离散指标,以所述空应用程序类的使用数据作为第二离散指标,并以用户名称作为关键字进行汇总,得到用户行为数据表;
[0019]根据所述用户行为数据表和各个最终应用程序类的使用数据,确定所述用户画像数据。
[0020]所述根据各个所述词向量对各个所述目标应用程序进行分类,得到各个应用程序类,并根据预设去重方法对各个所述应用程序类进行聚合,得到各个最终应用程序类的步骤包括:
[0021]计算任意两个目标应用程序的词向量对应的余弦值,并确定在各个所述余弦值中是否存在大于预设阈值的目标余弦值;
[0022]若存在所述目标余弦值,则将所述目标余弦值对应的两个目标应用程序进行归类,得到各个所述应用程序类;
[0023]确定任意两个应用程序类中相同应用程序的个数占比,并确定在各个所述个数占比中是否存在大于预设占比的目标个数占比;
[0024]若存在所述目标个数占比,则将所述目标个数占比对应的两个应用程序类进行聚合,得到各个所述最终应用程序类。
[0025]所述通过预设使用统计指标对各个目标应用程序进行排序,创建各个所述目标应用程序之间的上下文关系的步骤包括:
[0026]按照流量使用数据从高到低的顺序对各个目标应用程序进行排序,得到排序后的目标应用程序;
[0027]根据所述排序后的目标应用程序之间的输入数据和输出数据,创建所述上下文关系。
[0028]所述通过预设使用统计指标对各个目标应用程序进行排序,创建各个所述目标应用程序之间的上下文关系的步骤之前,还包括:
[0029]根据使用次数对各个预设待处理应用程序进行第一次过滤,得到各个有效应用程序;
[0030]根据安装普及程度对各个所述有效应用程序进行第二次过滤,得到各个目标应用程序。
[0031]第二方面,本申请还提供一种应用程序分类装置,包括:
[0032]创建模块,用于通过预设使用统计指标对各个目标应用程序进行排序,创建各个所述目标应用程序之间的上下文关系;
[0033]确定模块,用于基于预设编码方式对各个所述目标应用程序进行编码,并根据所
述上下文关系将各个编码后的目标应用程序进行训练,得到各个所述目标应用程序对应的词向量;
[0034]分类模块,用于根据各个所述词向量对各个所述目标应用程序进行分类,得到各个应用程序类,并根据预设去重方法对各个所述应用程序类进行聚合,得到各个最终应用程序类。
[0035]第三方面,本申请还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面所述应用程序分类方法的步骤。
[0036]第四方面,本申请还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被所述处理器执行时实现第一方面所述应用程序分类方法的步骤。
[0037]本申请提供的应用程序分类方法、装置、电子设备及计算机程序产品,在应用程序分类的过程中,自动创建目标应用程序的上下文关系,自动对目标应用程序进行编码和确定词向量,自动根据词向量对目标应用程序进行分类,实现了应用程序分类的全自动化,有效降低了人工参与引入的客观误差,提高了应用程序分类准确性。
附图说明
[0038]为了更清楚地说明本申请或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0039]图1是本申请提供的应用程序分类方法的流程示意图之一;
[0040]图2是本申请提供的应本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种应用程序分类方法,其特征在于,包括:通过预设使用统计指标对各个目标应用程序进行排序,创建各个所述目标应用程序之间的上下文关系;基于预设编码方式对各个所述目标应用程序进行编码,并根据所述上下文关系将各个编码后的目标应用程序进行训练,得到各个所述目标应用程序对应的词向量;根据各个所述词向量对各个所述目标应用程序进行分类,得到各个应用程序类,并根据预设去重方法对各个所述应用程序类进行聚合,得到各个最终应用程序类。2.根据权利要求1所述的应用程序分类方法,其特征在于,所述根据各个所述词向量对各个所述目标应用程序进行分类,得到各个应用程序类,并根据预设去重方法对各个所述应用程序类进行聚合,得到各个最终应用程序类的步骤之后,还包括:根据各个所述最终应用程序类的第一中心编码向量,及其对应的各个目标应用程序的编码向量,确定各个所述最终应用程序类中各个目标应用程序的权重值;将各个所述最终应用程序类中,各个目标应用程序的权重值及其对应的使用数据进行加权求和,得到各个所述最终应用程序类的汇总数据;根据各个所述最终应用程序类的汇总数据,分析各个所述最终应用程序类的使用数据。3.根据权利要求1所述的应用程序分类方法,其特征在于,所述根据各个所述词向量对各个所述目标应用程序进行分类,得到各个应用程序类,并根据预设去重方法对各个所述应用程序类进行聚合,得到各个最终应用程序类的步骤之后,还包括:根据各个所述最终应用程序类的第一中心编码向量和空应用程序类的第二中心编码向量,确定各个余弦相似度值;根据各个所述余弦相似度值和预设相似度值,确定目标应用程序类;将所述目标应用程序类中各个目标应用程序的使用数据,及其对应的目标余弦相似度值进行加权求和,得到所述空应用程序类的使用数据;根据所述目标应用程序类的实际使用数据和所述空应用程序类的使用数据,确定用户画像数据。4.根据权利要求3所述的应用程序分类方法,其特征在于,所述根据所述目标应用程序类的实际使用数据和所述空应用程序类的使用数据,确定用户画像数据的步骤包括:以所述目标应用程序类的实际使用数据作为第一离散指标,以所述空应用程序类的使用数据作为第二离散指标,并以用户名称作为关键字进行汇总,得到用户行为数据表;根据所述用户行为数据表和各个最终应用程序类的使用数据,确定所述用户画像数据。5.根据权利要求1所述的应用程序分类方法,其特征在于,所述根据各个所述词向量对各个...

【专利技术属性】
技术研发人员:樊巧云赵雨陆天珺方海贝谷建泽孙苑苑李树春
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1