【技术实现步骤摘要】
一种基于用户评论识别App关键功能的方法及装置
本专利技术涉及App功能需求分析领域,具体是涉及一种基于用户评论识别App关键功能的方法及装置。
技术介绍
由于移动应用市场的快速增长和激烈竞争,App想要存活下来必须进行持续更新以挽留老用户和吸引新用户。而用户评论中包含了大量的有用信息,App开发者能通过评论获取用户反馈从而根据这些反馈制定更新方案,进而提升用户满意度。用户评论中包含了大量有用信息,如bug报告、功能请求和功能评估等,这些信息能够有效地帮助App开发者获取下一步更新的需求。然而,热门App每天平均能收到上千条用户评论,对这些评论进行人工分析不仅耗时耗力,而且效率低下。目前,本领域主要通过使用NLP相关的技术来对大量用户评论中的信息进行总结,如使用主题建模技术将用户评论进行聚类和优先级排序,从而识别出最重要的主题。同时,与App功能相关的需求分析也是本领域的重点,其主要通过特征提取、词性标注和语法解析等技术从应用描述或者评论中抽取出功能,然后识别出用户抱怨最多或者最需要改进的功能等。目前这些方法都针对英文,而缺 ...
【技术保护点】
1.一种基于用户评论识别App关键功能的方法,其特征在于,包括以下步骤:/n收集App,获取App描述,并将App描述存储到数据库;/n根据App描述,去除App描述中的非功能描述,获得与App功能相关的功能描述;/n根据App的功能描述,构建深度学习分类器;/n获取App在单位时间m内的用户评论,其中,单位时间m为180天;/n对用户评论进行纠错处理,过滤纠错后的用户评论中噪声数据,分割过滤后的用户评论,得到与用户评论相关的短句,对短句进行分词处理,去除短句中与App功能无关的词汇,获得与App功能相关的目标短句;/n构建相关度分类器;/n确定待挖掘用户评论的App,获取 ...
【技术特征摘要】
1.一种基于用户评论识别App关键功能的方法,其特征在于,包括以下步骤:
收集App,获取App描述,并将App描述存储到数据库;
根据App描述,去除App描述中的非功能描述,获得与App功能相关的功能描述;
根据App的功能描述,构建深度学习分类器;
获取App在单位时间m内的用户评论,其中,单位时间m为180天;
对用户评论进行纠错处理,过滤纠错后的用户评论中噪声数据,分割过滤后的用户评论,得到与用户评论相关的短句,对短句进行分词处理,去除短句中与App功能无关的词汇,获得与App功能相关的目标短句;
构建相关度分类器;
确定待挖掘用户评论的App,获取待挖掘用户评论的App的描述和单位时间m内用户评论;
对待挖掘用户评论的App的描述和在单位时间m内用户评论进行预处理,获得待挖掘用户评论的App的功能描述和目标短句;
根据待挖掘用户评论的App的类别,调取同类别若干App搭建的深度学习分类器和相关度分类器,获得同类别深度学习分类器和同类别相关度分类器;
根据同类别深度学习分类器,获得待挖掘用户评论的App的功能描述短语;
根据同类别相关度分类器,将待挖掘用户评论的App的功能描述短语和从评论中获取的目标短句进行匹配,获得待挖掘用户评论的App的与功能描述短语相关和不相关的短句,收集与功能描述短语相关的短句,得到功能描述短语的相关评论集和功能描述短语的集合;
根据待挖掘用户评论的App的单条功能描述短语的相关评论集(,n为功能描述短语的个数)和功能描述短语的集合构建回归模型,通过回归模型获得关键功能。
2.根据权利要求1所述的一种基于用户评论识别App关键功能的方法,其特征在于,根据App描述,去除App描述中的非功能描述,获得与App功能相关的功能描述,具体包括以下步骤:
去除对联系方式和订阅信息进行描述的句子以及其后面的句子,获得第一预处理描述;
去除第一预处理描述中冗余的标点符号、特殊符号、表情符号和除中文和英文以外的其他字符,得到功能描述。
3.根据权利要求2所述的一种基于用户评论识别App关键功能的方法,其特征在于,根据App的功能描述,构建深度学习分类器,具体包括以下步骤:
通过pyltp工具对功能描述进行分词、词性标注和依存句法解析,获得功能描述的语法解析树;
根据功能描述的语法解析树,抽选出候选短语;
对候选短语进行分类,分类为功能描述短语和非功能描述短语,将功能描述短语和非功能描述短语存储到数据库,并基于功能描述短语和非功能描述短语训练深度学习分类器;
获得深度学习分类器。
4.根据权利要求3所述的一种基于用户评论识别App关键功能的方法,其特征在于,对用户评论进行纠错处理,过滤纠错后的用户评论中噪声数据,分割过滤后的用户评论,得到与用户评论相关的短句,对短句进行分词处理,去除短句中与App功能无关的词汇,获得与App功能相关的目标短句,具体包括以下步骤:
通过百度AI开放平台,对用户评论进行纠错处理,得到纠错后用户评论;
获取纠错后用户评论,去除纠错后用户评论中的非中文和非英文字符,过滤噪声数据,得到过滤后用户评论;
获取过滤后用户评论,通过pyltp工具,将过滤后用户评论进行分句处理,分割成若干短句;
通过pyltp工具对短句进行分词,通过停用词表工具,根据停用词表去除短句中停用词,获得目标短句。
5.根据权利要求4所述的一种基于用户评论识别App关键功能的方法,其特征在于,根据待挖掘用户评论的App的单条功能描述短语的相关评论集和所有功能描述短语的集合构建回归模型,通过回归模型获得关键功能,具体包括以下步骤:
计算待挖掘用户评论的App和每条功能描述短语(,n为功能描述短语个数)在单位时间m内每天收到的情感倾向性评分数目,分别记为和,其中,情感倾向性评分为差评/好评;
将作为因变量,所有()作为自变量来构建如下回归模型:
其中,是一个常数,是()对应的相关系数;
采用后向消除法迭代地过滤出p值最大且大于0.05的自变量并重新建立模型,直到所有剩余自变量的p值都小于0.05为止,与最终剩下的自变量相关的功能即关键功能,并将关键功能按照最终生成模型的相关系数进行排序。
6.一种...
【专利技术属性】
技术研发人员:吴化尧,邓文俊,王乐进,钮鑫涛,聂长海,
申请(专利权)人:南京大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。