【技术实现步骤摘要】
应用程序名称识别方法、装置及终端
本专利技术涉及数据处理
,尤其涉及一种应用程序名称识别方法、装置及终端。
技术介绍
随着互联网的不断发展,越来越多的应用市场相继出现,比如豌豆荚应用市场、腾讯应用宝、百度手机助手等,以满足用户便捷下载所需应用程序的需求。但是在这些应用市场中,对于同一个应用程序,往往具有不同的名称,比如为了吸引用户的注意,可能在应用程序名称中加入一些容易吸引用户的内容,以增强相应应用程序被使用的概率。而若多种数据源中同一个应用程序的名称各不相同,将导致该应用程序基础数据的解析率和利用率较低。目前为了解决多种数据源中应用程序名称不统一的问题,通常会采用人工进行识别,但人工识别的效率很低。
技术实现思路
本专利技术实施例提供一种应用程序名称识别方法、装置及终端,以解决目前人工识别应用程序名称的效率低的问题。为了解决上述技术问题,本专利技术是这样实现的:第一方面,本专利技术实施例提供了一种应用程序名称识别方法,包括:获取待识别应用程序的多个维度信息; ...
【技术保护点】
1.一种应用程序名称识别方法,其特征在于,包括:/n获取待识别应用程序的多个维度信息;/n根据所述待识别应用程序的多个维度信息和预先确定的标准应用程序的多个维度信息,确定所述待识别应用程序与所述标准应用程序之间的第一相似度值;/n当所述第一相似度值大于预设阈值时,将所述标准应用程序的标准名称确定为所述待识别应用程序的目标名称。/n
【技术特征摘要】 【专利技术属性】
1.一种应用程序名称识别方法,其特征在于,包括:
获取待识别应用程序的多个维度信息;
根据所述待识别应用程序的多个维度信息和预先确定的标准应用程序的多个维度信息,确定所述待识别应用程序与所述标准应用程序之间的第一相似度值;
当所述第一相似度值大于预设阈值时,将所述标准应用程序的标准名称确定为所述待识别应用程序的目标名称。
2.根据权利要求1所述的方法,其特征在于,所述根据所述待识别应用程序的多个维度信息和预先确定的标准应用程序的多个维度信息,确定所述待识别应用程序与所述标准应用程序之间的第一相似度值,包括:
分别针对所述待识别应用程序和所述标准应用程序的每一个维度信息,计算所述待识别应用程序与所述标准应用程序之间的相似度,得到多个第二相似度值;
利用每个所述第二相似度值分别乘以对应的预设权重值,得到所述第一相似度值。
3.根据权利要求1所述的方法,其特征在于,所述多个维度信息包括以下至少两项:
名称、安装包名、分类标签信息、开发者信息、下载量值、功能简介信息、更新时间信息、版本信息、图标文件信息。
4.根据权利要求2所述的方法,其特征在于,所述多个维度信息包括功能简介信息;
所述分别针对所述待识别应用程序和所述标准应用程序的每一个维度信息,计算所述待识别应用程序与所述标准应用程序之间的相似度,得到多个第二相似度值,包括:
对所述待识别应用程序的功能简介信息进行关键词过滤,得到所述待识别应用程序的第一关键词信息;
计算所述第一关键词信息和第二关键词信息的相似度,得到所述待识别应用程序与所述标准应用程序之间的一个第二相似度值;
其中,所述第二关键词信息是对所述标准应用程序的功能简介信息进行关键词过滤得到。
5.根据权利要求2所述的方法,其特征在于,所述多个维度信息包括下载量值;
所述分别针对所述待识别应用程序和所述标准应用程序的每一个维度信息,计算所述待识别应用程序与所述标准应用程序之间的相似度,得到多个第二相似度值,包括:
对所述待识别应用程序的下载量值进行标准量化,得到所述待识别应用程序所在的应用市场下的所述待识别应用程序的下载量值的第一占比值;
根据所述第一占比值和第二占比值,确定所述待识别应用程序与所述标准应用程序之间的一个第二相似度值;
其中,所述第二占比值是所述标准应用程序所在的应用市场下的所述标准应用程序的下载量值的占比值。
6.根据权利要求1所述的方法,其特征在于,所述获取待识别应用程序的多个维度信息之前,所述方法还包括:
获取所述待识别应用程序的安装包名;
判断是否预先存储有所述安装包名对应的标准名称;
所述获取待识别应用程序的多个维度信息,包括:
当没有预先存储有所述安装包名对应的标准名称时,获取所述待识别应用程序的多个维度信息。
7.根据权利要求6所述的方法,其特征在于,所述判断是否预先存储所述安装包名对应的标准名称之后,所述方法还包括:
当预先存储有所述安装包名对应的标准名称时,将所述标准名称确定为所述待识别应用程序的目标名称。
8.一种应用程序名称识别装置,其特征在于,包括:
技术研发人员:李春林,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。