一种融合多源可靠信息的移动应用推荐方法及装置制造方法及图纸

技术编号:34460068 阅读:50 留言:0更新日期:2022-08-06 17:18
本发明专利技术涉及推荐领域,具体涉及一种融合多源可靠信息的移动应用推荐方法及装置,方法包括获取移动应用样本及其对应的扩展数据;提取应用样本各界面的函数信息、权限信息和上下文文本信息,输入子功能分类器得到子功能分类,结合用户使用该类应用的时间信息和位置信息得到用户对该应用的偏好值;获取应用的流行度信息,通过可靠性分类器获取各个流行度数据的可靠性,计算应用的流行度;综合用户对应用的偏好值和应用的流行度向用户推荐应用;本发明专利技术通过提取应用包含的各类子功能,解决情境信息不全面且粗粒度的问题,提升应用推荐的准度和精度;通过提取跨市场级别的特征,更全面发现应用的虚假流行度数据,降低虚假数据对于推荐模型的影响。模型的影响。模型的影响。

【技术实现步骤摘要】
一种融合多源可靠信息的移动应用推荐方法及装置


[0001]本专利技术涉及推荐领域,具体涉及一种融合多源可靠信息的移动应用推荐方法及装置。

技术介绍

[0002]目前,国内外相关学者在移动应用推荐领域做了大量的研究,提出了一些有效的推荐模型。模型从推荐方法角度上主要分为:基于协同过滤的推荐模型、基于交互信息的推荐模型和基于扩展信息的推荐模型。
[0003]协同过滤是推荐系统中较为传统的一种方法,在商品推荐、视频推荐等领域均有广泛的应用。因此,部分学者直接将该思想移植到移动应用推荐系统中。协同过滤主要基于具有相似物品经验的用户通常具有相似的偏好这一假设,通过计算用户与物品之间的相似度,来进行物品推荐。在移动应用推荐中,已有的研究对偏好相同的用户的识别主要包括:计算用户使用的移动应用间的语义关系相似度、挖掘用户使用应用日志的相似度、分析用户评论内容的相似度、分析用户功能需求或安全需求的相似度等。
[0004]基于交互信息的推荐模型通常利用的是移动用户与应用在交互过程中产生的丰富的信息,包括用户使用应用的时间信息、位置信息等,相关交互信本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种融合多源可靠信息的移动应用推荐方法,其特征在于,具体包括以下步骤:获取移动应用样本及其对应的扩展数据;提取应用各界面函数信息、权限信息和上下文文本信息,将信息输入子功能分类器,子功能分类器的输出为各个类型子功能名称及对应的界面数量;将子功能分类器的输出与用户使用该类应用的时间信息和位置信息作为输入,得到用户对于该应用的偏好值;将流行度数据输入可靠性分类器进行可靠性计算,并根据可靠性为数据分配可靠性权重;根据应用的流行度数据以及其对应的可靠性权重,计算应用的流行度;根据用户对该应用的偏好值和应用的流行度综合进行排序,将排序的前N个应用推荐给用户。2.根据权利要求1所述的一种融合多源可靠信息的移动应用推荐方法,其特征在于,子功能分类器的获取过程包括:对于不同类别的移动应用,分别选择m个应用,人工试用每个应用并遍历应用的所有界面,为每个界面的功能打上标签;获取每个界面下使用的函数名以及申请的权限名,并根据系统组件使用的回调函数,定位每个界面的入口点,即入口组件的ID;动态运行应用,遍历应用的所有界面,并获取各个界面的Activity名称以及包含的文本信息作为上下文信息,并将入口组件的文本加入上下文信息;将上下文文本进行预处理,并进行分词和去停用词后按照从上到下的顺序进行排序,生成文本向量;将每个子功能对应的界面的文本向量作为训练集的正集,其他界面的文本信息作为训练集的负集,对子功能分类器进行训练,得到完成训练的子功能分类器。3.根据权利要求1所述的一种融合多源可靠信息的移动应用推荐方法,其特征在于,用户对于应用a的偏好值表示为:Prefer
a
=λ1PR
time
+λ2PR
position
+λ3SIM
func
,λ1+λ2+λ3=1其中,Prefer
a
代表用户对于应用a的偏好值,PR
time
为当前时间段用户使用该类应用的概率,PR
position
为当前地点用户使用该类应用的概率,SIM
func
为应用与用户使用的同类型应用的功能相似度;λ1、λ2、λ3分别为PR
time
、PR
position
、SIM
func
的影响因子。4.根据权利要求3所述的一种融合多源可靠信息的移动应用推荐方法,其特征在于,应用与用户使用的同类型应用的功能相似度SIM
func
表示为:其中,n为用户使用的同类型应用的数量,代表该应用a与用户使用的某个同类型应用b
i
的相同功能比率,为应用a与应用b
i
相同子功能对应的界面的总数量,SUM_UI
a
为应用a的界面的总数量。5.根据权利要求1所述的一种融合多源可靠信息的移动应用推荐方法,其特征在于,可靠性分类器的训练过程包括:
爬取恶意应用在不同应用商店的流行度数据作为训练集的正集,爬取良性应用的流行度数据作为训练集的负集;对训练集中每个应用的评论数据进行抽取,从评论数据中获取评论用户ID、评论内容、评分和评论时间信息;获取每个应用在每个应用商店的流行度数据并进行特征提取,提取包括评分变化向量、排名变化向量、好评数量变化向量、相同评论内容比率、相似评论内容比率共5个维度的特征;结合应用在不同应用商店的流行度数据,进行跨商店特征提取,提取包括不同商店内应用评分变化速率偏差值、不同商店内应用排名变化速率偏差值、不同商店内应用评论数量变化速率偏差值、相同评论内容比率、相似评论内容比率供5个维度的特征;将获取的10个维度的特征作为可靠性分类器的输入,并根据可靠性分类器分类结果的准确率和召回率选择合适的分类算法,得到完成训练的可靠性分类器。6.根据权利要求5所述的一种融合多源可靠信息的移动应用推荐方法,其特征在于,可靠性分类器对数据进行可靠性分类时,分别得出数据为可靠数据和不可靠数据的概率,用户设定可靠阈值和不可靠阈值,当可靠概率大于设置可靠阈值且不可靠概率小于设置的不可...

【专利技术属性】
技术研发人员:胡阳雨祝清意张亮余桀毛美玲
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1