基于大数据分析的计算机软件管理系统及方法技术方案

技术编号:38141857 阅读:16 留言:0更新日期:2023-07-08 09:56
本发明专利技术涉及软件管理技术领域,具体为基于大数据分析的计算机软件管理系统及方法,包括:采集所有软件信息形成软件信息集;对下载信息和使用信息采集形成历史数据集;采集使用的流量形成流量集;对数据进行存储;分析目标软件的转化率和应用程度;确认下载软件使用的流量,分析下载方式;确认目标软件的种类和软件相似度;基于应用程度、软件下载方式和软件相似度建立软件分析模型;分析目标软件是否为暂时性软件;分析软件删除时限,将软件携带的所有文件进行删除;确认软件删除时限后,进行实时计时处理;解决了频繁删除软件会存在许多残余占用内存的问题。残余占用内存的问题。残余占用内存的问题。

【技术实现步骤摘要】
基于大数据分析的计算机软件管理系统及方法


[0001]本专利技术涉及软件管理
,具体为基于大数据分析的计算机软件管理系统及方法。

技术介绍

[0002]现代生活中,随处可见的信息化,使得我国各行各业都离不开计算机软件的支持,而伴随着随智能手机等移动终端的普及,用户在移动终端上下载的软件也得以被广泛利用,它帮助人们获得更高的工作和生产效率,给人们提供一个更加安全、灵活和宽松的工作与生活环境,同时使我们建立良好的人脉关系,增多人与人之间的沟通,使得生活水平也大大的提高。
[0003]然而,用户下载软件有时可能只是需要短暂的使用一下软件功能,当用户使用结束后,一般都会选择删除软件,但有时用户会忘记删除,从而占用内存,同时,频繁删除软件会存在许多残余占用内存,同时降低用户体验感的问题,对客户和软件生产商家都存在一定消极影响。因此,如何分析用户需求判断用户使用软件的暂时性成为目前有待解决的问题。
[0004]所以,人们需要基于大数据分析的计算机软件管理系统及方法来解决上述问题。

技术实现思路

[0005]本专利技术的目的在于提供基于大数据分析的计算机软件管理系统及方法,以解决上述
技术介绍
中提出的问题。
[0006]为了解决上述技术问题,本专利技术提供如下技术方案:基于大数据分析的计算机软件管理方法,包括以下步骤:
[0007]步骤S100:在用户的历史下载记录中,对用户所有历史下载过的软件基于软件信息的不同进行分类;采集用户当前下载的软件信息,设为目标软件,对网络大数据中所述目标软件的用户下载信息和使用信息进行采集,形成历史数据集;同时采集网络大数据中对目标软件的所有下载模式使用的流量,形成流量集;其中,系统默认软件信息集中的软件为不需要删除的软件
[0008]步骤S200:获取所有采集到的数据,对数据进行存储;
[0009]步骤S300:根据历史数据集分析目标软件的转化率,进一步分析目标软件的应用程度;对目标软件信息中的文件大小进行标记,根据文件大小确认下载所述目标软件使用的流量,将其与流量集进行匹配,分析软件下载方式;将获取的目标软件和软件信息集进行匹配,确认目标软件的种类和软件相似度,若相似度极高,说明替代性强,不利于长期使用;基于应用程度、软件下载方式和软件相似度建立软件分析模型;
[0010]步骤S400:根据软件分析模型分析目标软件是否为暂时性软件;若属于暂时性软件,则对用户使用目标软件的过程进行监测,访问互联网的关键信息特征,判断用户使用软件方式与软件功能匹配,分析用户对软件的需求性,若用户对软件的需求性低,则根据用户
使用行为匹配历史数据集中的用户使用信息分析软件删除时限,利用标记显示算法对已经卸载目标软件a的用户进行标记,分析时间,待用户确认删除后,将软件携带的所有文件进行删除,避免残余,增加内存,提高网络使用速度;
[0011]步骤S500:确认软件删除时限后,进行实时计时处理,到达时限时进行提醒并确认相关软件的所有文件删除信息。
[0012]进一步的,步骤S100包括:
[0013]S110:在用户的历史下载记录中,对用户所有历史下载过的软件进行采集,形成软件信息集A={a1,a2,

,an},其中,a1,a2,

,an表示用户下载的第1、2、

、n个软件的软件信息,其中,所述软件信息包括软件名称和软件详情信息;基于软件信息集A,得到任意两个软件信息ai,ai+f的相似度
ɑ
=|ai∩ai+f|/|ai∪ai+f|,f=1,2,

,n

i,其中ai、ai+f∈A;将相似度
ɑ
大于相似阈值β的软件信息归为一类,确认所属类别软件的种类,利用计数算法记录分类后的软件种数x,形成软件信息集A

={a1

,a2

,

,ax

},其中,a1

,a2

,

,ax

表示分类后的第1、2、

、x种软件信息;其中所述计数算法属于本领域技术人员的常规技术手段,因此在本申请中就不再做出过多的赘述;
[0014]S120:对用户当前下载的软件信息a进行获取,设为目标软件a,基于目标软件a,对网络大数据中目标软件a的各个用户下载信息和使用信息进行采集,形成历史数据集B={b1,b2,

,bh},其中,b1,b2,

,bh表示目标软件a的第1、2、

、h个用户下载信息和使用信息,其中,用户下载信息和使用信息包括所有用户下载时间,删除时间,使用频率,用户评价等;同时基于目标软件a,对网络大数据中利用各个不同下载模式下载目标软件a使用的流量进行采集,形成流量集C={c1,c2,

,ck},其中,c1,c2,

,ck表示第1、2、

、k种下载模式下下载目标软件a使用的流量。
[0015]进一步的,所述步骤S200包括:利用数据库获取软件信息集A形成的形成软件信息集A

、历史数据集B和流量集C,对数据进行存储。
[0016]进一步的,步骤S300包括:
[0017]S310:对目标软件a的软件信息和软件信息集A

进行获取,基于软件信息a和软件信息集A

中的任意第j种软件信息aj

,根据公式ρ=1

!|aj
’‑
a|,得到目标软件a和任意第j种软件信息的相似度,遍历软件信息集A

,利用冒泡排序算法根据相似度值将软件种类进行降序,形成软件相似度集*A;对软件相似度集*A种的第一个数据*a1进行提取,其中*a1包括与目标软件a相似度最高的软件种类和相似度值μ,若相似度极高,说明替代性强,不利于长期使用;其中,所述冒泡排序算法属于本领域技术人员的常规技术手段,因此在本申请中就不再做出过多的赘述;
[0018]S320:根据历史数据集B对任意一个用户bg的下载信息和使用信息进行提取,形成使用时间集bg={f1,f2,

,fr},其中,f1,f2,

,fr表示用户bg第1、2、

、r次使用目标软件a的时间,不同用户使用次数不同,若使用次数为0则表示仅仅下载了软件但没有使用,遍历历史数据集B,对使用次数大于ω的用户进行提取得到用户数量为eb,其中ω表示次数阈值,则确认目标软件a的转化率为eb/h;基于使用时间集bg,根据公式
[0019]vg=[(f2

f1)+(f3

f2)+

+(fr

fr

1)]/r本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于大数据分析的计算机软件管理方法,其特征在于:包括以下步骤:步骤S100:在用户的历史下载记录中,对用户所有历史下载过的软件基于软件信息的不同进行分类;采集用户当前下载的软件信息,设为目标软件,对网络大数据中所述目标软件的用户下载信息和使用信息进行采集,形成历史数据集;同时采集网络大数据中对目标软件的所有下载模式使用的流量,形成流量集;步骤S200:获取所有采集到的数据,对数据进行存储;步骤S300:根据历史数据集分析目标软件的转化率,进一步分析目标软件的应用程度;对目标软件信息中的文件大小进行标记,根据文件大小确认下载所述目标软件使用的流量,将其与流量集进行匹配,分析软件下载方式;将获取的目标软件和软件信息集进行匹配,确认目标软件的种类和软件相似度;基于应用程度、软件下载方式和软件相似度建立软件分析模型;步骤S400:根据软件分析模型分析目标软件是否为暂时性软件;若属于暂时性软件,则对用户使用目标软件的过程进行监测,分析用户对软件的需求性,若用户对软件的需求性低,则根据用户使用行为匹配历史数据集中的用户使用信息分析软件删除时限,待用户确认删除后,将软件携带的所有文件进行删除;步骤S500:确认软件删除时限后,进行实时计时处理,到达时限时进行提醒并确认相关软件的所有文件删除信息。2.根据权利要求1所述的基于大数据分析的计算机软件管理方法,其特征在于:所述步骤S100包括:S110:在用户的历史下载记录中,对用户所有历史下载过的软件进行采集,形成软件信息集A={a1,a2,

,an},其中,a1,a2,

,an表示用户下载的第1、2、

、n个软件的软件信息;基于软件信息集A,得到任意两个软件信息ai,ai+f的相似度
ɑ
=|ai∩ai+f|/|ai∪ai+f|,f=1,2,

,n

i,其中ai、ai+f∈A;将相似度
ɑ
大于相似阈值β的软件信息归为一类,确认所属类别软件的种类,利用计数算法记录分类后的软件种数x,形成软件信息集A

={a1

,a2

,

,ax

},其中,a1

,a2

,

,ax

表示分类后的第1、2、

、x种软件信息;S120:对用户当前下载的软件信息a进行获取,设为目标软件a,基于目标软件a,对网络大数据中目标软件a的各个用户下载信息和使用信息进行采集,形成历史数据集B={b1,b2,

,bh},其中,b1,b2,

,bh表示目标软件a的第1、2、

、h个用户下载信息和使用信息;同时基于目标软件a,对网络大数据中利用各个不同下载模式下载目标软件a使用的流量进行采集,形成流量集C={c1,c2,

,ck},其中,c1,c2,

,ck表示第1、2、

、k种下载模式下下载目标软件a使用的流量。3.根据权利要求2所述的基于大数据分析的计算机软件管理方法,其特征在于:所述步骤S300包括:S310:对目标软件a的软件信息和软件信息集A

进行获取,基于软件信息a和软件信息集A

中的任意第j种软件信息aj

,根据公式ρ=1

!|aj
’‑
a|,其中所述!|aj
’‑
a|表示任意第j种软件信息aj

和软件信息a做差值的非,则得到目标软件a和任意第j种软件信息的相似度,遍历软件信息集A

,利用冒泡排序算法根据相似度值将软件种类进行降序,形成软件相似度集*A;对软件相似度集*A种的第一个数据*a1进行提取,其中*a1包括与目标软件a相似度最高的软件种类和相似度值μ;
S320:根据历史数据集B对任意一个用户bg的下载信息和使用信息进行提取,形成使用时间集bg={f1,f2,

,fr},其中,f1,f2,

,fr表示用户bg第1、2、

、r次使用目标软件a的时间,遍历历史数据集B,对使用次数大于ω的用户进行提取得到用户数量为eb,其中ω表示次数阈值,则确认目标软件a的转化率为eb/h;基于使用时间集bg,根据公式vg=[(f2

f1)+(f3

f2)+

+(fr

fr

1)]/r,得到任意用户bg的使用频率vg,对使用频率大于λ/ω的用户进行提取得到用户数量为vb,其中λ表示使用时长阈值,基于转化率eb/h和用户数量vb,得到目标软件a的应用程度d1=eb*(eb

vb)/[h*(h

eb)];S330:利用冒泡排序算法对流量集C中的流量数据进行升序排序后,得到新的流量集C

={c1

,c2

,

,ck

},其中,c1

,c2

,

,ck

表示排序后的第1、2、

、k种下载模式下下载目标软件a使用的流量;对目标软件a的软件信息进行获取,利用标记显示算法对目标软件信息中的文件大小进行标记,根据文件大小确认下载所述目标软件使用的流量数据为Q,基于流量集C

中任意第q种下载模式下使用的流量数据cq

,根据匹配公式:σq=|Q∩cq

|/|Q∪cq

|,其中,σ表示匹配相似值,遍历流量集C

,利用比较法获取匹配相似值最大的流量数据为cs,确认当前状态下目标软件a的下载模式为xs;基于流量数据cs,得到下载模式xs对目标软件a的损耗程度为d2=|cs

c1

|/(s

1);S340:根据软件相似度μ、目标软件a的应用程度d1和...

【专利技术属性】
技术研发人员:常雷刘庆波
申请(专利权)人:黑龙江哈杜普科技开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1