【技术实现步骤摘要】
一种辅助工具的评论分析方法和装置
[0001]本专利技术涉及计算机处理
,尤其涉及一种辅助工具的评论分析方法和装置。
技术介绍
[0002]传统的开源项目开发中,代码的提交、检查、测试、集成、部署等工作均需要人工完成。近年来,越来越多的开源项目使用辅助工具来自动化地协助开发者完成这些工作。例如,Travis等持续集成类辅助工具可以帮助项目自动合并代码、自动编译、运行测试。Codacy等静态分析工具检查代码中的错误,代码是否符合编码标准规范。持续交付工具和持续部署辅助工具可以使项目在较短的循环中可靠的发布。研究和实践表明,辅助工具能够显著加快项目开发过程,协助改善开源软件质量,减少缺陷数量。然而,现有辅助工具应用商店或辅助工具官方网站,都缺少用户对于辅助工具的评价及打分。因此项目管理者和开发者无法了解各个辅助工具的优缺点和实际使用评价,在相似工具之间难以进行有效选择,从而不利于开源项目的高效开发和辅助工具的推广应用。
[0003]在软件问答社区上存在大量辅助工具相关问答,辅助工具评论分散在这些回答之中。对这些辅助 ...
【技术保护点】
【技术特征摘要】
1.一种辅助工具的评论分析方法,其特征在于,包括:利用方面提取模型对所述辅助工具的评价句子进行方面提取以获得所述辅助工具按方面分类的评价句子,其中,对所述辅助工具的评价句子进行方面提取以获得所述辅助工具按方面分类的评价句子包括:根据方面相关的关键词计算所述评价句子属于每个方面的概率分布;以及利用BERT模型对按方面分类的评价句子进行情感分类和摘要提取以获得所述辅助工具的不同方面的方面级总结。2.根据权利要求1所述的辅助工具的评论分析方法,其特征在于,根据方面相关的关键词计算所述评价句子属于每个方面的概率分布进一步包括:基于方面信息注意力利用词向量计算句子向量;基于关键词注意力对方面中每个关键词向量进行加权求和计算方面嵌入向量;对全部方面嵌入向量进行加权求和得到句子重构向量,其中,通过减小所述句子向量和所述句子重构向量之间的内积训练所述方面提取模型;以及通过所述方面提取模型预测所述评价句子属于每个方面的概率分布。3.根据权利要求2所述的辅助工具的评论分析方法,其特征在于,基于方面信息注意力利用词向量计算句子向量进一步包括:通过词集与词向量矩阵的乘积获取所述词向量并且通过方面的关键词集与所述词向量矩阵的乘积获取关键词向量,其中,根据所述辅助工具的评价句子生成所述词集;基于所述方面信息注意力利用所述词向量与所述关键词向量的相似度计算单词注意力权重,其中,所述词向量与关键词向量的相似度由所述词向量、注意力参数矩阵和所述关键词向量的求和平均值的乘积获得;以及通过对所述词向量与所述单词注意力权重进行加权求和来获得所述句子向量。4.根据权利要求2或3所述的辅助工具的评论分析方法,其特征在于,基于关键词注意力对方面中每个关键词向量进行加权求和计算方面嵌入向量进一步包括:基于TF
‑
IDF从K个方面的评价句子中提取m个关键词集,其中,K与m均为正整数;基于所述关键词向量与所述句子向量的相似度计算关键词的注意力权重,其中,所述关键词向量与所述句子向量的相似度由所述关键词向量、关键词注意力参数矩阵和当前句子向量的乘积获得;以及基于所述关键词的注意力权重对方面中每个关键词向量进行加权求和计算方面嵌入向量。5.根据权利要求2所述的辅助工具的评论分析方法,其特征在于,通过所述方面提取模型中的线性层预测所述评价句子属于每个方面的概率分布;所述方面提取模型根据所述评价句子属于每个方面的概率分布与相应的方面嵌入向量计算句子重构向量。6.根据权利要求2所述的辅助工...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。