一种基于聚类模式的二进制软件打包方法及系统技术方案

技术编号:35907518 阅读:21 留言:0更新日期:2022-12-10 10:46
本发明专利技术公开一种基于聚类模式的二进制软件打包方法及系统,包括:1)在网页上配置打包留底文档内容;2)根据配置打包文档标题拆分名词和文件上传日志,在网页上辅助用户选定需要打包的代码文件;3)配置文本匹配机制对历史打包过程中产生的信息再利用,补充网页配置打包的细节内容;4)划分文件更新后受关联的打包文档、软件,选择是否一起更新或修改;5)通过验证系统测试,对相关测试参数收集和验证;6)验证无误后,对安装包解包并将解包结果作为半监督模糊聚类模型的训练集的一部分;7)整合其它已人工标定属性的训练集,迭代模型,优化检索结果并保存;本发明专利技术能够辅助人工编辑打包内容,减少人力成本,提高打包效率。提高打包效率。提高打包效率。

【技术实现步骤摘要】
一种基于聚类模式的二进制软件打包方法及系统


[0001]本专利技术属于计算机应用
,具体涉及到一种基于聚类模式的二进制软件打包方法及系统。

技术介绍

[0002]在计算机领域中,打包就是把各种文件压缩起来到一个新的文件里面去,而软件打包是指把需要的各个子对象集成到一个可以使用的软件包,软件中通常包含了多个代码文件,每个代码文件具有各自的功能,但是各个代码文件之间存在相互依赖关系,所以通常是将多个代码文件放到一起(即打包)提供给用户。
[0003]目前,软件打包是代码文件到电脑客户端类别产品的必要流程,随着产品的推陈出新,产品的定制化越来越多,打包配置和相应脚本也需要对应进行修改,其中存在可以共用的资源代码文件,很多的打包配置细节信息可以再利用。但共用文件的存放位置存在差异,在不同打包脚本和打包留底文档中,相同文件的打包配置信息因需求不同而内容不同,配置打包过程中,需要借鉴和汇总这些信息,对于多文件变更,初始配置打包的场景,出现耗费时间长,工作繁琐的问题,同时,产品更新可能会带动部分其它产品的改动,尤其打包留底文档和脚本。
[0004]在现有技术中,对于多文件变更,初始配置打包场景,依然存在需要大量手工编辑工作,由此,对整个软件自动化打包和验证流程在效率和准确性上造成了影响,为了满足需求,本专利技术提供一种基于聚类模式的二进制软件打包方法及系统。

技术实现思路

[0005]针对上述问题,本专利技术的主要目的在于设计一种基于聚类模式的二进制软件打包方法及系统, 该方法有助于工作人员高效构建准确的程序安装包,解决开发人员之间代码文件合并打包过程中的繁琐问题,能够在配置打包信息过程中提高效率。
[0006]为了实现上述目的本专利技术采用如下技术方案:本专利技术的技术方案中,硬件设备包括服务器、打包机器和工作站,服务器上装载服务系统,服务系统上包括网页的前后端、数据库和SVN库的部署,其中网页后端应用了文件检索机制,文本匹配机制和验证系统信息处理机制;打包机器装载打包系统;工作站装载验证系统;所述的SVN库存储了SVN日志、打包留底文档、代码文件和脚本,所述的脚本包括打包脚本和测试脚本,所述的SVN日志信息包括:版本号,文件名,更新内容理由说明,内容版本;在服务器和打包机器上完成软件打包流程,在工作站上完成安装包的验证流程,在软件打包和验证方面分别应用了基于密度的聚类模型和半监督模糊聚类模型。
[0007]通过公开的硬件设备,本专利技术目的在于保护一种基于聚类模式的二进制软件打包方法和基于打包验证系统的验证方法,具体公开如下:一种基于聚类模式的二进制软件打包方法,具体的打包方法如下:S1:网页配置:用户通过浏览器访问服务器,打开打包网页,在网页界面上配置打
包留底文档;通过辅助机制强化内容自动填充功能、减少人工检索和编辑工作;所述的辅助机制包括文件检索机制、文本匹配机制,所述的文件检索机制由基于密度的聚类模型和基于链表和临近节点的位置概率机制组成。
[0008]所述的网页配置信息包括安装包名称、版本、上传SVN路径、关联文件名、关联文件版本号、关联文件SVN路径、关联文件说明、关联文件是否需要注册、是否需要安装、迭代策略、安装顺序。
[0009]网页配置完成后,生成打包脚本,打包留底文档和测试脚本,对所述的打包留底文档和打包脚本、测试脚本进行管理。
[0010]S2:关键字的推荐:将SVN日志作为样本,使用基于密度的聚类模型得到不同的簇,对打包留底文档的标题进行拆分,拆分的内容和不同簇中样本对应的关键字进行比对,筛选出与拆分的内容涉及较多的样本,将此样本和其临近样本对应的关键字内容进行推荐,在网页上显示,提供用户进行选择。
[0011]S3:S2中推荐关键字内容后,再通过人工在网页上从推荐关键字中进行选定,人工选定的关键字内容通过基于链表和临近节点的位置概率机制,检索关联文件并配置打包留底文档的初步内容。
[0012]S4:检索到的关联文件中涉及的打包留底文档、打包脚本和SVN日志,使用文本匹配机制进行分析,并截取对应代码文件的SVN日志和历史打包留底文档内容,将配置打包留底文档的细节内容填补完整。
[0013]S5:根据S1中的打包留底文档中代码文件对应的内容生成打包脚本,对所述的打包脚本和打包留底文档进行管理。
[0014]S6:服务器发送指令到打包机器,打包机器在打包系统上拉取打包脚本和代码文件,生成软件安装包,并上传SVN库。
[0015]作为本专利技术进一步的描述,软件打包包括第一次软件打包和非第一次软件打包,在第一次软件打包场景下,使用文件检索机制;非第一次软件打包场景下,不使用文件检索机制,只调取对应工作角色的SVN最近上传的代码文件和打包文档。
[0016]作为本专利技术进一步的描述,所述的基于密度的聚类模型在文件检索机制中使用,查找其它相似产品或者关联代码文件对应的关键字内容;对SVN日志进行频次和分布分析,并根据编写习惯截取关键字信息,以该截取关键字和其映射的文件路径组成若干个节点,对节点进行基于密度的聚类分析,总结出不同的簇,将网页选定的关键字内容和不同簇中样本对应的关键字进行匹配,得到选定关键字归属的簇和该关键字对应的样本,每个样本代表一个节点,结合同簇中该节点的临近节点,总结并汇总分析出若干条文件路径内容的链表。
[0017]作为本专利技术进一步的描述,所述的基于链表和临近节点的位置概率机制在文件检索机制中使用,查找关联代码文件在SVN库上的路径,将查找的关联代码文件的SVN路径填充在网页上配置打包留底文档的初步内容。
[0018]作为本专利技术进一步的描述,所述的文本匹配机制包括模糊匹配和全文匹配,应用于S4中SVN日志和历史打包留底文档内容的关键信息截取;对检索关联文件对应的SVN日志和打包留底文档,根据编写习惯和模板,使用全文匹配确定关键内容的锚点,再对锚点与锚点之间的内容进行匹配,一部分采用文全文匹配,
一部分以软件名或者术语进行模糊匹配,截取关键信息。
[0019]作为本专利技术进一步的描述,本专利技术涉及的三个硬件设备分别装载三个不同系统,其中所述装载在工作站的系统为验证系统,验证系统上包括虚拟测试环境和测试流程管理模块,其中测试流程管理模块应用了运行状态监控机制、信息收集机制、节点反馈机制和检索结果优化机制,所述的半监督模糊聚类模型在验证系统的检索结果优化机制中应用;所述的半监督模糊聚类模型应用在验证系统的优化检索结果机制中,对安装包解包遍历过程中,根据子安装包、子目录和文件标记属性标签,以文件路径的层级关系设立样本与类中心的距离,由此将遍历解包结果作为半监督模糊聚类模型的训练集中一部分,对基于密度的聚类模型检索结果,做进一步的整理。
[0020]具体的本专利技术的验证内容包括两方面:第一方面是在验证的过程中,服务器向工作站发送请求验证指令和验证工作的系统配置信息,工作站收到打包机器的请求,调取虚拟系统环境,在该环境下载安装包,根据打包留底文档生成测试脚本,对安装包安装、运行、卸载的在测试环境收集信本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于聚类模式的二进制软件打包方法,其特征在于:硬件设备包括服务器、打包机器和工作站,所述的工作站为验证机器,所述的服务器上包括网页的前后端、数据库和SVN库的部署,所述的SVN库存储了SVN日志、打包留底文档、代码文件和脚本,所述的脚本包括打包脚本和测试脚本;具体的打包方法如下:S1:网页配置:在网页界面上,通过辅助机制,辅助用户配置打包留底文档;所述的辅助机制包括文件检索机制、文本匹配机制,所述的文件检索机制由基于密度的聚类模型和基于链表和临近节点的位置概率机制组成;S2:关键字的推荐:将SVN日志作为样本,使用基于密度的聚类模型得到不同的簇,对打包留底文档的标题进行拆分,拆分的内容和不同簇中样本对应的关键字进行比对,选出关联性强的样本,将此样本和其临近样本对应的关键字内容进行推荐;S3:S2中推荐关键字内容后,再通过人工在网页上从推荐关键字中进行选定,人工选定的关键字内容通过基于链表和临近节点的位置概率机制,检索关联文件并配置打包留底文档的初步内容;S4:检索到的关联文件中涉及的打包留底文档、打包脚本和SVN日志,使用文本匹配机制进行分析,并截取对应代码文件的SVN日志和历史打包留底文档内容,将配置打包留底文档的细节内容填补完整;S5:根据S1中的打包留底文档中代码文件对应的内容生成打包脚本,对所述的打包脚本和打包留底文档进行管理;S6:服务器发送指令到打包机器,打包机器拉取打包脚本和代码文件,生成软件安装包,并上传至SVN库。2.根据权利要求1所述的一种基于聚类模式的二进制软件打包方法,其特征在于:打包包括第一次软件打包和非第一次软件打包,在第一次软件打包场景下,使用了文件检索机制中的基于密度的聚类模型和基于链表和临近节点的位置概率机制;非第一次软件打包场景下,不使用文件检索机制,只调取对应工作角色的SVN最近上传的代码文件和打包文档。3.根据权利要求2所述的一种基于聚类模式的二进制软件打包方法,其特征在于:所述的基于密度的聚类模型应用在第一次软件打包场景下,查找其它相似产品或者关联代码文件对应的关键字内容;对SVN日志进行频次和分布分析,并根据编写习惯截取关键字信息,以该截取关键字和其映射的文件路径组成若干个节点,对节点进行基于密度的聚类分析,总结出不同的簇,将网页选定的关键字内容和不同簇中样本对应的关键字进行匹配,得到选定关键字归属的簇和该关键字对应的样本,每个样本代表一个节点,结合同簇中该节点的临近节点,总结并汇总分析出若干条文件路径内容的链表。4.根据权利要求3所述的一种基于聚类模式的二进制软件打包方法,其特征在于:所述的基于链表和临近节点的位置概率机制应用在第一次软件打包场景,查找关联代码文件在SVN库上的路径,将查找的关联代码文件的SVN路径,填充在网页上,配置打包留底文档的初步内容。5.根据权利要求1所述的一种基于聚类模式的二进制软件打包方法,其特征在于:所述的文本匹配机制包括模糊匹配和全文匹配,应用于S4中SVN日...

【专利技术属性】
技术研发人员:黎安民曾瑜馨叶秋菊叶利乔黄志伟翁嘉浩
申请(专利权)人:广东省电子商务认证有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1