【技术实现步骤摘要】
基于自然语言处理技术的可定制软件测试评价方法及系统
[0001]本专利技术涉及自然语言处理
,尤其涉及一种基于自然语言处理技术的可定制软件测试评价方法及系统。
技术介绍
[0002]自然语言处理(Natural Language Processing,NLP)技术是一门研究如何使计算机能够理解、处理和生成人类自然语言的
它涉及了语言学、计算机科学和人工智能的多个学科的交叉,并致力于开发算法和模型,使计算机能够识别、理解和生成人类语言的各种表达形式,包括文本、语音和对话等。可定制软件测试评价方法是一种针对特定软件项目和测试需求进行定制的评价方法。它结合了软件测试和评价的理论与方法,通过使用自然语言处理技术对软件测试数据进行处理和分析,生成可定制的评价报告和指标,以评估和改进软件的质量和性能。传统的软件测试评价方法通常依赖于人工标注和主观判断,评价结果可能受评价者主观意见和标注误差的影响,导致评价结果的不一致性和不准确性。
技术实现思路
[0003]本专利技术为解决上述技术问题,提出了一种基于自然语 ...
【技术保护点】
【技术特征摘要】
1.一种基于自然语言处理技术的可定制软件测试评价方法,其特征在于,包括以下步骤:步骤S1:通过网络爬虫技术进行数据采集并通过自然语言处理对抓取的数据进行文本抽取,从而获取软件测试评价语料数据;步骤S2:对软件测试评价语料数据进行特征提取,从而获取软件测试评价语料特征数据;步骤S3:对软件测试评价语料特征数据进行深度自然语言模型构建,从而获取软件测试自然语言处理模型;步骤S4:获取软件测试数据,并利用软件测试自然语言处理模型对软件测试数据进行处理,从而获取软件分析测试报告;步骤S5:对软件分析测试报告进行软件指标评价,从而获取软件评价指标反馈数据。2.根据权利要求1所述的方法,其特征在于,步骤S1具体为:步骤S11:利用预设的网络爬虫引擎从互联网采集软件测试评价原始数据;步骤S12:对软件测试评价原始数据进行评价数据清洗并评价数据降噪,从而获取软件测试评价清洗数据;步骤S13:对软件测试评价清洗数据进行评价数据标注,从而获取软件测试评价标注数据;步骤S14:对软件测试评价标注数据进行文本特征提取以及偏好特征提取,从而获取软件测试评价文本特征数据以及软件测试评价偏向特征数据;步骤S15:对软件测试评价文本特征数据以及软件测试评价偏向特征数据进行特征数据划分,从而获取软件测试评价训练数据集、软件测试评价验证数据集以及软件测试评价测试数据集;步骤S16:对软件测试评价训练数据集、软件测试评价验证数据集以及软件测试评价测试数据集进行数据规范化处理,从而获取软件测试评价语料数据。3.根据权利要求2所述的方法,其特征在于,步骤S13的步骤具体为:步骤S131:确定软件测试评价清洗数据对应的软件测试评价原始数据包括软件测试标注数据时,则利用软件测试标注数据对软件测试评价清洗数据进行评价数据标注,从而获取软件测试评价标注数据;步骤S132:确定软件测试评价清洗数据对应的软件测试评价原始数据不包括软件测试标注数据时,则对软件测试评价清洗数据对应的软件测试评价原始数据进行关键词捕捉,从而获取软件测试关键词数据;步骤S133:利用预设的软件测试关键词偏向数据对软件测试关键词数据进行软件测试标注偏向计算,从而获取软件测试评价标注数据;步骤S134:利用软件测试评价标注数据对软件测试评价清洗数据进行评价数据标注,从而获取软件测试评价标注数据。4.根据权利要求3所述的方法,其特征在于,软件测试标注偏向计算通过软件测试标注偏向计算公式进行计算,其中软件测试标注偏向计算公式具体为:;
为软件测试标注偏向数据,为软件测试关键词数据,为软件测试底数常数项,为软件测试关键词的数量数据,为软件测试关键词序次项,为缩放指数,为第个软件测试关键词,为第个软件测试评价标注数据。5.根据权利要求1所述的方法,其特征在于,软件测试评价语料特征数据包括文本摘要表示数据以及情感特征提取数据,步骤S2具体为:步骤S21对软件测试评价语料数据进行词袋矩阵转化,从而获取软件测试评价词袋矩阵数据;步骤S22对软件测试评价词袋矩阵数据进行优化TF
‑
IDF权重计算,从而获取TF
‑
IDF词袋矩阵数据;步骤S23:对TF
‑
IDF词袋矩阵数据进行词嵌入训练,从而获取TF
‑
IDF词袋词嵌入模型;步骤S24:对TF
‑
IDF词袋词嵌入模型进行向量转换,从而获取句子...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。