一种分类方法及计算机设备技术

技术编号:31707887 阅读:20 留言:0更新日期:2022-01-01 11:10
本申请公开了一种分类方法及计算机设备,应用于计算机应用技术领域,该方法包括:计算机设备首先获取第一软件对应的第一特征向量,第一软件为计算机设备上的软件,第一特征向量基于至少一个表示第一软件的属性的第一特征得到;然后获取n个第二软件对应的分类,第二软件为所属的分类确定的软件;还获取n个第二软件对应的第二特征向量,第二特征向量基于至少一个表示第二软件的属性的第二特征得到;然后基于第一特征向量以及n个第二软件对应的第二特征向量以及分类通过人工智能方法确定第一分类,第一分类为第一软件的分类。本申请实施例能在任意操作系统或领域内对软件进行分类,适应范围较广,应用场景增多,且提高了对软件分类的准确率。分类的准确率。分类的准确率。

【技术实现步骤摘要】
一种分类方法及计算机设备


[0001]本申请涉及计算机应用
,尤其涉及一种分类方法及计算机设备。

技术介绍

[0002]伴随着互联网时代的飞速发展,软件的研发速度也越来越快,因此越来越多的软件出现在人们的工作以及生活中的方方面面,为用户的工作和生活带来了极大的便利。同时计算机设备上的软件数量也大幅度增加,为了提高计算机设备的管理效率,对计算机设备上的软件采取分类管理和检索是一个重要途径,因此需要将计算机设备上的软件进行分类。而从不同的角度和出发点,软件的分类可以有不同的划分方式,例如操作系统、数据库、办公环境、集成开发环境以及应用环境等类别。目前对软件进行分类可以采用人工分类以及自动分类等方式,人工分类的方式效率较低的同时对人员专业素质要求较高,且现今社会软件的研发速度已经超出了目前人工分类的速度,因此对于利用自动分类方式将软件进行分类有极大的需求。
[0003]当前的自动分类方法是以某个操作系统内的软件为目标,例如linux系统软件、安卓系统软件、windows系统软件等,然后根据软件内的控制信息确定所属分类,控制信息是各个操作系统独有的,所以对于不同的操作系统不能共有同一个自动分类方法,例如linux系统的自动分类方法不能扩展到对windows系统内的软件进分类。因此当前的自动分类方法只能在特定的领域内使用,适用范围较窄,应用场景较少。

技术实现思路

[0004]本申请实施例提供了一种分类方法及计算机设备,用于通过获取到的第一软件对应的第一特征向量,以及n个第二软件对应的第二特征向量以及分类,然后基于第一特征向量以及n个第二软件对应的第二特征向量以及分类通过人工智能算法确定第一软件的第一分类,基于此能在任意操作系统或领域内对软件进行分类,适用范围较广,适用多种应用场景。
[0005]基于此,本申请第一方面提供了一种分类方法,包括:
[0006]计算机设备获取第一软件对应的第一特征向量,第一软件为计算机设备上的软件,第一特征向量基于至少一个第一特征得到,第一特征为表示第一软件的属性的词语;
[0007]计算机设备获取n个第二软件对应的分类,其中,该第二软件为所属的分类确定的软件,n大于或等于1;
[0008]计算机设备获取n个第二软件对应的第二特征向量,其中,该第二特征向量基于至少一个第二特征得到,该第二特征为表示第二软件的属性的词语;
[0009]计算机设备基于第一特征向量以及n个第二软件对应的第二特征向量以及分类通过人工智能方法确定第一分类,该第一分类为第一软件的分类。
[0010]在第一方面的一个可能的实施方式中,计算机设备获取第一软件的第一描述文本,第一描述文本为描述第一软件的属性的文本;
[0011]计算机设备基于第一描述文本获取至少一个第一特征;
[0012]计算机设备基于至少一个第一特征获取第一特征向量。
[0013]在第一方面的一种可能的实施方式中,计算机设备从描述第一软件的文献资料和/或网络信息中获取第一描述文本。
[0014]在第一方面的一种可能的实施方式中,计算机设备根据n个第二软件的元数据以及代码依赖数据获取n个第二软件对应的分类;
[0015]和/或,
[0016]计算机设备根据第一预设表项获取n个第二软件对应的分类,第一预设表项包括n个所述第二软件对应的分类情况。
[0017]在第一方面的一种可能的实施方式中,计算机设备根据n个第二描述文本获取n个第二软件对应的第二特征向量,该第二描述文本为描述第二软件的属性的文本;
[0018]和/或,
[0019]计算机设备根据第二预设表项获取n个第二软件对应的第二特征向量,第二预设表项包括预设的n个第二软件对应的第二特征向量。
[0020]在第一方面的一种可能的实施方式中,计算机设备获取n个第二软件分别对应的n个第二描述文本;
[0021]计算机设备基于n个第二描述文本获取n个第二软件分别对应的第二特征,该第二特征的数量大于或等于1;
[0022]计算机设备基于n个第二软件分别对应的第二特征获取第二特征向量。
[0023]在第一方面的一种可能的实施方式中,计算机设备从分别描述n个第二软件的文献资料和/或网络信息中获取n个第二描述文本。
[0024]在第一方面的一种可能的实施方式中,人工智能方法包括以下至少任意一种:
[0025]邻近算法或聚类算法。
[0026]在第一方面的一种可能的实施方式中,第一软件的属性以及第二软件的属性分别包括以下至少一个方面:
[0027]软件对应的功能、软件的发布者、软件的应用场景或软件的迭代版本信息,其中软件为第一软件或第二软件。
[0028]本申请第二方面提供了一种计算机设备,包括:
[0029]第一获取单元,用于获取第一软件的第一特征向量,第一软件为计算机设备上的软件,第一特征向量由至少一个第一特征组成,第一特征为表示第一软件的属性的词语;
[0030]第二获取单元,用于获取n个第二软件对应的分类,其中,该第二软件为所属的分类确定的软件,n大于或等于1;
[0031]第三获取单元,用于获取n个第二软件对应的第二特征向量,该第二特征向量基于至少一个第二特征得到,该第二特征为表示第二软件的属性的词语;
[0032]确定单元,用于基于第一特征向量以及n个第二软件对应的第二特征向量以及分类通过人工智能方法确定第一分类,该第一分类为第一软件的分类。
[0033]本申请实施例第二方面的计算机设备执行本申请实施例第一方面或第一方面任一种可能实现方式所描述的方法。
[0034]本申请的第三方面提供了一种计算机设备,包括:存储器、收发器、处理器以及总
线系统;
[0035]其中,存储器用于存储程序;
[0036]处理器用于执行存储器中的程序,以实现上述第一方面或第一方面任一种可能实现方式所描述的方法;
[0037]总线系统用于连接存储器以及处理器,以使存储器以及处理器进行通信。
[0038]本申请的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面或第一方面任一种可能实现方式所描述的方法。
[0039]本申请的第五方面提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述第一方面或第一方面任一种可能实现方式所描述的方法。
[0040]从以上技术方案可以看出,本申请实施例具有以下优点:
[0041]本申请实施例中,提供了一种分类方法,在本申请实施例中,计算机设备首先获取第一软件的第一特征向量,该第一软件为计算机设备上的软件,该第一特征向量基于至少一个第一特征得到,该第一特征为表示该第一软件的属性的词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种分类方法,其特征在于,包括:计算机设备获取第一软件对应的第一特征向量,所述第一软件为所述计算机设备上的软件,所述第一特征向量基于至少一个第一特征得到,所述第一特征为表示所述第一软件的属性的词语;所述计算机设备获取n个第二软件对应的分类,所述第二软件为所属的分类确定的软件,n大于或等于1;所述计算机设备获取n个所述第二软件对应的第二特征向量,所述第二特征向量基于至少一个第二特征得到,所述第二特征为表示所述第二软件的属性的词语;所述计算机设备基于所述第一特征向量以及n个所述第二软件对应的所述第二特征向量以及所述分类通过人工智能方法确定第一分类,所述第一分类为所述第一软件的分类。2.根据权利要求1所述的分类方法,其特征在于,所述计算机设备获取第一软件的第一特征向量包括:所述计算机设备获取所述第一软件的第一描述文本,所述第一描述文本为描述所述第一软件的属性的文本;所述计算机设备基于所述第一描述文本获取至少一个所述第一特征;所述计算机设备基于至少一个所述第一特征获取所述第一特征向量。3.根据权利要求2所述的分类方法,其特征在于,所述计算机设备获取所述第一软件的描述文本包括:所述计算机设备从描述所述第一软件的文献资料和/或网络信息中获取所述第一描述文本。4.根据权利要求1或2所述的分类方法,其特征在于,所述计算机设备获取n个第二软件对应的分类包括:所述计算机设备根据n个所述第二软件的元数据以及代码依赖数据获取n个所述第二软件对应的分类;和/或,所述计算机设备根据第一预设表项获取n个所述第二软件对应的分类,所述第一预设表项包括n个所述第二软件对应的分类情况。5.根据权利要求1或2所述的分类方法,其特征在于,所述计算机设备获取n个所述第二软件对应的第二特征向量包括:所述计算机设备根据n个第二描述文本获取n个所述第二软件对应的所述第二特征向量,所述第二描述文本为描述所述第二软件的属性的文本;和/或,所述计算机设备根据第二预设表项获取n个所述第二软件对应的所述第二特征向量,所述第二预设表项包括预设的n个所述第二软件对应的所述第二特征向量。6.根据权利要求5所述的分类方法,其特征在于,所述计算机设备根据n个第二描述文本获取n个所述第二软件对应的所述第二特征向量包括:所述计算机设备获取n个所述第二软件分别对应的n个所述第二描述文本;所述计算机设备基于n个所述第二描述文本获取n个所述第二软件分别对应的所述第二特征,所述第二特征的数量大于或等于1;
所述计算机设备基于n个所述第二软件分别对应的所述第二特征获取所述第二特征向量。7.根据权利要求6所述的分类方法,其特征在于,所述计算机设备获取n个所述第二软件分别对应的n个所述第二描述文本包括:所述计算机设备从分别描述n个所述第二软件的文献资料和/或网络信息中获取n个所述第二描述文本。8.根据权利要求1

3、6或7中任一项所述的分类方法,其特征在于,所述人工智能方法包括以下至少一种:邻近算法或聚类算法。9.根据权利要求1

3中任一项所述的分类方法,其特征在于,所述第一软件的属性以及所述第二软件的属性分别包括以下至少一个方面:软件对应的功能、所述软件的发布者、所述软件的应用场景或所述软件的迭代版本信息,其中,所述软件为所述第一软件或所述第二软件。10.一种计算机设备,其特征在于,所述计算机设备包括:第一获取单元,用于获取第一软件的第一特征向量,所述第一软件为所述计算机设备上的软件,所述第...

【专利技术属性】
技术研发人员:邵冬雪
申请(专利权)人:北京迪力科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1