一种针对APP软件使用质量的用户评论挖掘方法技术

技术编号：17655076 阅读：29 留言：0更新日期：2018-04-08 08:24

本发明专利技术涉及一种针对APP软件使用质量的用户评论挖掘方法，属于APP软件使用质量分析领域。本发明专利技术首先使用初始评论种子挖掘出反映使用质量的APP软件用户评论；然后针对与评论种子匹配失败的用户评论，根据APP软件使用质量特征词表判断该用户评论是否反映使用质量并抽取评论模式；最后基于候选评论模式抽取新的评论种子，进一步挖掘与使用质量相关的用户评论。本发明专利技术有助于从大量的APP软件用户评论中挖掘出与使用质量相关的评论；有助于获取APP软件用户评论中与ISO/IEC 25010使用质量属性相关的信息；有助于分析APP软件使用质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种针对APP软件使用质量的用户评论挖掘方法
本专利技术涉及一种针对APP软件使用质量的用户评论挖掘方法，属于APP软件使用质量分析领域。
技术介绍
当前，APP软件种类越来越多样化，不仅向人们提供信息和简单的服务，还可以从各方面影响人们的生活、经济甚至健康安全等。所以，评估APP软件的质量变得至关重要。根据国际标准化组织ISO的定义：“软件质量是软件产品满足规定和隐含需求能力有关的所有特征和所有特性的总和”。软件质量包括内部质量、外部质量、使用质量和过程质量。其中，使用质量是特定用户使用产品或系统满足其在特定使用环境下达到特定目标所要求的有效性、效率、安全性及满意度的程度。使用质量是在软件实际应用环境下，从用户视角出发体验到的非功能性的质量特性，其度量依赖于进行测量的环境，随着评估人的不同而发生变化。部分用户在使用APP软件后会发表相应的评论，用户评论是用户体验信息的重要来源，它反映了APP软件的使用情况以及用户对APP软件特定属性的关注等，是分析使用质量的重要依据。近年来，基于用户评论的使用质量分析受到越来越多的关注。如何从大量的APP软件用户评论中挖掘出与使用质量相关的评论成为亟需解决的问题。
技术实现思路
针对现有技术存在的不足，本专利技术提供了一种针对APP软件使用质量的用户评论挖掘方法。本专利技术的技术方案是：一种针对APP软件使用质量的用户评论挖掘方法，首先使用初始评论种子挖掘出反映使用质量的APP软件用户评论；然后针对与评论种子匹配失败的用户评论，根据APP软件使用质量特征词表判断该用户评论是否反映使用质量并抽取评论模式；最后基于候选评论模式抽...
一种针对APP软件使用质量的用户评论挖掘方法

【技术保护点】
一种针对APP软件使用质量的用户评论挖掘方法，其特征在于：首先使用初始评论种子挖掘出反映使用质量的APP软件用户评论；然后针对与评论种子匹配失败的用户评论，根据APP软件使用质量特征词表判断该用户评论是否反映使用质量并抽取评论模式；最后基于候选评论模式抽取新的评论种子，进一步挖掘与使用质量相关的用户评论。

【技术特征摘要】
1.一种针对APP软件使用质量的用户评论挖掘方法，其特征在于：首先使用初始评论种子挖掘出反映使用质量的APP软件用户评论；然后针对与评论种子匹配失败的用户评论，根据APP软件使用质量特征词表判断该用户评论是否反映使用质量并抽取评论模式；最后基于候选评论模式抽取新的评论种子，进一步挖掘与使用质量相关的用户评论。2.根据权利要求1所述的针对APP软件使用质量的用户评论挖掘方法，其特征在于：所述方法的具体步骤如下：Step1、初始化数据：评论库中有c条分词后的用户评论comment，m＝1，评论种子库中有s个评论种子seed，使用质量特征词表中有f个使用质量特征词feature_word；Step2、判断评论库中是否存在未判断的用户评论：判断m是否小于等于c：如果是，则取出一条未判断的用户评论commentm，抽取commentm的评论模式modem，执行Step3；否则，执行Step5；其中，评论模式modem＝<mode_wordm1+…+mode_wordmn+…+mode_wordmq，mode_speechm1+…+mode_speechmn+…+mode_speechmq，mode_quality_in_usem>，1≤n≤q；mode_word代表用户评论中的词，mode_speech代表代表用户评论中词的词性，q代表评论模式中词/词性的数量，mode_quality_in_usem代表评论commentm反映的使用质量，使用质量为使用质量特征词表中的5个使用质量属性之一，此时未对评论commentm进行使用质量判断，其值为unknown；Step3、判断commentm是否与某个评论种子匹配：若评论commentm与评论种子seedg匹配成功，mode_quality_in_usem＝seed_quality_in_useg，给出commentm判断结果：<commentm，seed_quality_in_useg>；m++，执行Step2；其中，1≤g≤s；若评论commentm与全部评论种子匹配失败，执行Step4；Step4、判断commentm是否与某个使用质量特征词匹配：若评论commentm与使用质量特征词feature_wordf′匹配成功，mode_quality_in_usem＝quality_in_usef'，给出commentm判断结果：<commentm，quality_in_usef'>；评论模式modem＝<mode_wordm1+…+mode_wordmn+…+mode_wordmq，mode_speechm1+…+mode_speechmn+…+mode_speechmq，mode_quality_in_usef'>，1≤n≤q进入候选评论模式库，m++，执行Step2；若评论commentm与使用质量特征词表匹配失败，mode_quality_in_usem＝null，给出commentm判断结果：<commentm，null>；m++，执行Step2；其中，null表示评论commentm不反映使用质量；1≤f'≤f；Step5、计算候选评论模式的文本相似度，得到分别属于5个不同的使用质量的5个词文本相似度最大的评论模式：{modemax1，…，modemax5}，执行Step6；Step6、选取候选评论模式库中的评论种子更新评论种子库：抽取评论模式{modemax1，…，modemax5}的评论种子seednewk，将seednewk中不为空的评论种子更新至评论种子库。3.根据权利要求2所述的针对APP软件使用质量的用户评论挖掘方法，其特征在于：所述Step3的具体步骤如下：Step3.1、初始化数据：i＝1；Step3.2、判断i是否小于等于s：如果是，则提取第i个评论种子seedi，执行Step3.3；否则，执行Step3.7；其中，seedi＝<seed_wordi1+…+seed_wordij+…+seed_wordip，seed_speechi1+…+seed_speechij+…+seed_speechip，seed_disi，seed_quality_in_usei>，1≤j≤p，seed_word代表评论种子中的词，seed_speech代表评论种子中词的词性，p代表评论种子中词/词性的数量，seed_disi为该评论种子的距离，其值为评价对象和评价观点之间可扩展的最大距离和评论种子中词/词性的数量之和，seed_quality_in_usei表示该评论种子反映的使用质量，使用质量为使用质量特征词表中的5个使用质量属性之一；其中，评价对象也称情感对象或者观点对象，是指某段文本中讨论的主题；评价观点指的是能够表达用户自身观点的带有情感倾向的词语，是判定用户对评价对象情感的根本依据；Step3.3、将评论commentm的词“mode_wordm1+…+mode_wordmn+…+mode_wordmq”与评论种子seedi的词“seed_wordi1+…+seed_wordij+…+seed_wordip”进行匹配，计算词匹配值commentWord_simmi：Step3.3.1、初始化j＝1，集合pos_word为空；Step3.3.2、判断j是否小于等于p：如果是，则执行Step3.3.3；否则，执行Step3.3.6；Step3.3.3、初始化n＝1，执行Step3.3.4；Step3.3.4、判断n是否小于等q：如果是，则执行Step3.3.5；否则，j++，执行Step3.3.2；Step3.3.5、判断seed_wordij是否和mode_wordmn相同：如果是，则将n添加到集合pos_word中，j++，执行Step3.3.2；否则，n++，执行Step3.3.4；Step3.3.6、使用公式(1)计算commentm和seedi匹配成功的词之间的最大距离dis_wordmi：dis_wordmi＝MAX{pos_word}-MIN{pos_word}(1)式(1)中，MAX表示计算集合中元素的最大值，MIN表示计算集合中元素的最小值；接着执行Step3.3.7；Step3.3.7、判断dis_wordmi是否小于等于seed_disi：如果是，则使用公式(2)计算commentm和seedi词匹配值commentWord_simmi：commentWord_simmi＝NUM(pos_word)/p(2)式(2)中，NUM表示计算集合中的元素个数；否则，commentWord_simmi＝0；执行Step3.4；Step3.4、将评论commentm的词性“mode_speechm1+…+mode_speechmn+…+mode_speechmq”与评论种子seedi的词性“seed_speechi1+…+seed_speechij+…+seed_speechip”进行匹配，计算词性匹配值commentSpeech_simmi：Step3.4.1、初始化j＝1，集合pos_speech为空；Step3.4.2、判断j是否小于等于p：如果是，则执行Step3.4.3；否则，执行Step3.4.7；Step3.4.3、初始化n＝1，执行Step3.4.4；Step3.4.4、判断n是否小于等于q：如果是，则执行Step3.4.5；否则，j++，执行Step3.4.2；Step3.4.5、判断seed_speechij是否和mode_speechmn相同：如果是，执行Step3.4.6；否则，n++，执行Step3.4.4；Step3.4.6、判断n是否大于集合pos_speech中的所有元素：如果是，则将n添加到集合pos_speech中，j++，执行Step3.4.2；否则，n++，执行Step3.4.4；Step3.4.7使用公式(3)计算commentm和seedi匹配成功的词性之间的最大距离dis_speechmi：dis_speechmi＝MAX{pos_speech}-MIN{pos_speech}(3)接着执行Step3.4.8；Step3.4.8、判断dis_speechmi是否小于等于seed_disi：如果是，则使用公式(4)计算commentm和seedi词性匹配值commentSpeech_simmi：commentSpeech_simmi＝NUM(pos_speech)/p(4)否则，commentSpeech_simmi＝0；执行Step3.5；Step3.5、使用公式(5)计算评论commentm与评论种子seedi的综合匹配值commentBoth_simmi：commentBoth_simmi＝0.5*commentWord_simmi+0.5*commentSpeech_simmi(5)执行Step3.6；Step3.6、i++，执行Step3.2；Step3.7、使用公式(6)获取评论commentm与所有评论种子中的评论种子seedg的最大综合匹配值commentBoth_simmg：commentBoth_simmg＝MAX{commentBoth_simm1,…,commentBoth_simmg,…,commentBoth_simms}(1≤g≤s)；(6)执行Step3.8；Step3.8、判断commentBoth_simmg是否大于0.5：如果是，则评论commentm与评论种子seedg匹...

【专利技术属性】
技术研发人员：姜瑛，胡甜媛，丁家满，李凌宇，汪海涛，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：云南,53

全部详细技术资料下载我是这个专利的主人