The embodiment of the present invention discloses a content-based multi-version App update evaluation method and system, which includes: obtaining information and storing it in the database by automatically traversing App; obtaining information in the database for analysis, identification and processing to obtain differences between different versions of App; preprocessing relevant information such as comments information and comments time of App, and obtaining modifications. After that, the user comment information corresponding to each version of App is obtained; the user comment information corresponding to each version of App is obtained after the modification, and the comprehensive emotional analysis value of each App update is obtained by comparing and grading the different versions of App. Implementing the embodiments of the present invention can provide more comprehensive feedback for developers, improve work efficiency, and provide information about specific function life cycle for developers.
【技术实现步骤摘要】
一种基于内容的多版本App更新评价方法及系统
本专利技术涉及内容识别、内容比较
,尤其涉及一种基于内容的多版本App更新评价方法及系统。
技术介绍
在移动应用开发中,App版本的更新是很常见的事情。每次更新,应用发布者会发布更新日志,来说明新版本所做出的主要改变。但是这部分说明只是对于App主要修改的内容,或者重点突出的功能进行说明。这部分内容并不充分,还有很多修改的内容并没有在更新日志上表示出来。例如淘宝7.11版本App的更新日志中写到:“消息首页升级”,“修复了部分bug”,这些描述十分空泛,不够具体,而现有的软件分析,对于版本更新也只有更新日志可以作为标准。内容量少,信息不够具体,这就导致想要筛选有效的更新日志信息费时费力。如果可以标识出两个版本间所有差异,包括增加的内容,删除的内容,将会具有很大的价值。而在对于版本更新问题上的研究,大多着力于对于用户评论的挖掘。如:在线跟踪用户评论,在版本更新的时间节点,识别出用户评论中多次提到的问题,从而得出软件中新出现的问题。如,通过分析App用户评论,得到用户评论的情感倾向程度。但是这类研究仅仅分析用户评论的 ...
【技术保护点】
1.一种基于内容的多版本App更新评价方法,其特征在于,所述方法包括:通过自动遍历App,获取App信息并存储到数据库;获取数据库中的信息进行分析、识别处理,获得不同版本App的差异;获取对App应用商店的评论信息及评论时间等相关信息进行预处理,获得修改后与每个版本的App相对应的用户评论信息;获取所述修改后与每个版本的App相对应的用户评论信息,结合不同版本App的差异进行比较评分处理,获得每个App更新的综合情感分析数值。
【技术特征摘要】
1.一种基于内容的多版本App更新评价方法,其特征在于,所述方法包括:通过自动遍历App,获取App信息并存储到数据库;获取数据库中的信息进行分析、识别处理,获得不同版本App的差异;获取对App应用商店的评论信息及评论时间等相关信息进行预处理,获得修改后与每个版本的App相对应的用户评论信息;获取所述修改后与每个版本的App相对应的用户评论信息,结合不同版本App的差异进行比较评分处理,获得每个App更新的综合情感分析数值。2.如权利要求1所述的一种基于内容的多版本App更新评价方法,其特征在于,所述获取数据库中的信息进行分析、识别处理的具体步骤包括:获取所述App数据进行选取同一个App的不同版本,制成App的不同版本信息的列表,通过java语言进行编写程序,选择其中一组,即同一款App所有不同版本的列表;获取所述同一款App所有不同版本的列表,从中选取相邻两个版本的App进行提取该两个App的界面信息;获取所述两个App的界面信息,对其内容进行比较处理,获得两个具有相似性的界面;获取所述两个具有相似性的界面,对所述两个具有相似性的界面中的所有可见文字进行识别处理,获得界面内所有差异的内容。3.如权利要求2所述的一种基于内容的多版本App更新评价方法,其特征在于,所述获取所述两个App的界面信息,对其内容进行比较处理的具体步骤包括:对旧版本中相同PageId的界面进行定位,抽取PageId相同的新旧版本界面,进行比较界面内容,获得更新的新版本中未比较的界面属性;定义comp值来衡量两个界面内容相似性,通过App相关属性定位相同活动的界面,进行比较,对于英文文本,先对content进行分词处理,后计算英文单词的相似度,其具体公式如下:IC(w)=-log(p(w)),其中p(w)是单词w在WordNetSense中出现的频率,LCS(w1,w2)是单词w1和w2的最近公共祖先,两个单词的相似度similar(w1,w2)由两个单词最近公共祖先信息量的两倍除以两个单词的信息量之和得到。对于中文文本,先进行分词,之后再进行文本相似性的比较。当comp=1.0时,则判断为两个界面是完全相同的界面,记录下界面信息;当comp=0.0时,则判断为两个界面是完全不同的界面,记录下界面信息;当0.0<comp<1.0时,则判断为具有一定相似性的两个界面。4.如权利要求2所述的一种基于内容的多版本App更新评价方法,其特征在于,所述对所述两个具有相似性的界面中的所有可见文字进行识别处理的具体步骤包括:获取所述两个具有相似性的界面进行提取处理,获得界面所有的控件属性;对每个控件的属性中所有可见文字内容的集合,定义为T因为两个界面,所以定义两个多维向量:Ti={text1,text2,...,textn}Tj={text1,text2,...,textm}Ti表示新版本中所有可见文字内容的集合,Tj表示旧版本中所有可见文字内容的集合。对所述两个界面的集合Ti及Tj进行识别处理,如果Ti中textk可在Tj中找到,即新版本内容可以在旧版本中找到相同的,则判断为textk是重复的内容;如果Ti中textk不可在Tj中找到,即新版本内容在旧版本中没有找到相同的,则判断为textk是增加的内容;如果Tj中textl不可在Ti中找到,即旧版本内容在新版本中没有找到相同的,则判断为textl是删除的内容;获取识别出的差异内容...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。