【技术实现步骤摘要】
测试语料生成方法、装置、设备及可读写存储介质
本申请涉及自然语言理解
,更具体地说,涉及一种测试语料生成方法、装置、设备及可读写存储介质。
技术介绍
随着人工智能相关技术的不断提高,自然语言理解交互的方式越来越复杂。为了更加方便用户,在多种业务场景下引入了人机交互系统。常见的如车载业务场景、音乐业务场景等。以车载业务场景为例,人机交互过程如下:用户:导航到科大讯飞机器:您打算从哪出发?用户:从三里庵出发按照这种交互过程,车载地图终端即会自动为用户提供从科大讯飞到三里庵的导航服务,无需用户操作终端选定起始位置、目标位置等,极大方便了用户的使用。人机交互系统在上线服务之前,需要经过测试,以检查人机系统对用户输入语料的语义理解是否准确。但是,用户收集到的实际训练语料数量有限,训练语料覆盖度不足,导致人机交互系统测试结果失真,测试结果不可靠。
技术实现思路
有鉴于此,本申请提供了一种测试语料生成方法、装置、设备及可读写存储介质,用于解决现有测试语料不足,导致人机交互系统测试结果失真,不可靠的问题。为了实现上述目的,现提出的方案如下:一种测试语料生成方法,包括:获取人机交 ...
【技术保护点】
1.一种测试语料生成方法,其特征在于,包括:获取人机交互场景下的历史用户交互语料;对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式;根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率;参考每一种组成方式的出现概率,逐条生成测试语料。
【技术特征摘要】
1.一种测试语料生成方法,其特征在于,包括:获取人机交互场景下的历史用户交互语料;对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式;根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率;参考每一种组成方式的出现概率,逐条生成测试语料。2.根据权利要求1所述的方法,其特征在于,所述对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式,包括:对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料所属的业务;所述根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率,包括:根据各条历史用户交互语料所属的业务,确定每一种业务的出现概率。3.根据权利要求2所述的方法,其特征在于,所述对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式,还包括:对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料对应的操作;所述根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率,还包括:根据各条历史用户交互语料所属的业务及对应的操作,确定每一种操作在同一业务下的出现概率。4.根据权利要求3所述的方法,其特征在于,所述对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式,还包括:对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料包含的语义槽及语义槽取值;所述根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率,还包括:根据各条历史用户交互语料所属的业务及包含的语义槽,确定每一种语义槽在同一业务下的出现概率。5.根据权利要求4所述的方法,其特征在于,还包括:对每一种语义槽的语义槽取值进行词扩展,得到扩展后的语义槽取值。6.根据权利要求4所述的方法,其特征在于,所述对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料的组成方式,还包括:对每条所述历史用户交互语料进行语义解析,确定每条所述历史用户交互语料包含的指定类型的词;所述根据各条历史用户交互语料的组成方式,确定每一种组成方式的出现概率,还包括:根据各条历史用户交互语料所属的业务及包含的指定类型的词,确定每一种指定类型的词在同一业务下的出现概率。7.根据权利要求6所述的方法,其特征在于,所述参考每一种组成方式的...
【专利技术属性】
技术研发人员:杨博昌,黄燕,施展,
申请(专利权)人:科大讯飞股份有限公司,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。