【技术实现步骤摘要】
基于用户评论中上下文的语音识别测试数据生成方法
本专利技术属于智能软件测试
,具体涉及一种基于用户评论中上下文的语音识别测试数据生成方法。
技术介绍
随着人工智能和大数据技术的发展,市场上涌现出越来越多基于人工智能的产品,例如人脸识别、语音识别、机器翻译等等。智能软件在传统软件的基础上,融入了智能功能属性,这无疑给智能软件的测试带来很多新问题和困难,同时也对智能软件的测试提出较大的市场需要和研究需求。当前快速迭代的智能软件普遍存在测试数据偏少、可信性不足等问题,难以满足测试需求。同时,现有的测试数据生成方法生成的测试数据不能模拟真实场景。语音识别作为智能系统之一,在实际应用中的应用越来越多,对新系统的需求也越来越大。从各语音识别APP的用户评论出发,利用语音数据集中数据的真实性,来构造语音识别的测试上下文分类树模型,引导语音测试数据的增强,从而,缓解语音识别测试数据不充分和不真实的问题,帮助开发和测试人员进一步维护和改进智能系统的功能,对于频繁版本演化过程中智能软件的质量保证具有重要的研究意义和应用价值。目前, ...
【技术保护点】
1.一种基于用户评论中上下文的语音识别测试数据生成方法,其特征在于,包括步骤如下:/n1)上下文因素的析取:收集有关语音识别APP的评论文本信息,对所述评论文本信息进行预处理和关键词提取,筛选关键词构建上下文因素;根据上下文因素,从开源的语音数据集中提取各上下文因素的值,生成上下文因素的值域;/n2)上下文模型的构成:构建上下文因素评论数据集,获取评论数据集中上下文因素之间的优先级和语义关联关系,联合上下文因素和上下文因素的值域,构成上下文分类树模型;/n3)衍生测试数据的生成:将原始测试数据作为上下文分类树模型的输入,选择相应的测试需求,生成对应的衍生测试数据;/n4)衍 ...
【技术特征摘要】
1.一种基于用户评论中上下文的语音识别测试数据生成方法,其特征在于,包括步骤如下:
1)上下文因素的析取:收集有关语音识别APP的评论文本信息,对所述评论文本信息进行预处理和关键词提取,筛选关键词构建上下文因素;根据上下文因素,从开源的语音数据集中提取各上下文因素的值,生成上下文因素的值域;
2)上下文模型的构成:构建上下文因素评论数据集,获取评论数据集中上下文因素之间的优先级和语义关联关系,联合上下文因素和上下文因素的值域,构成上下文分类树模型;
3)衍生测试数据的生成:将原始测试数据作为上下文分类树模型的输入,选择相应的测试需求,生成对应的衍生测试数据;
4)衍生测试数据的评估:通过两种方法对测试数据进行评估,第一种是通过计算原始测试数据与衍生测试数据的相似度;第二种是将原始测试数据和衍生测试数据输入到被测的语音识别APP中,比较二者输出结果的差异性。
2.根据权利要求1所述的基于用户评论中上下文的语音识别测试数据生成方法,其特征在于,所述步骤1)具体包括:
11)收集移动应用商店中语音识别APP的用户评论以及包含语音识别功能的APP下有关语音识别的评论文本信息...
【专利技术属性】
技术研发人员:陶传奇,曹冬玉,黄志球,
申请(专利权)人:南京航空航天大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。