【技术实现步骤摘要】
语音数据集生成方法、装置、设备和计算机可读介质
[0001]本公开的实施例涉及计算机
,具体涉及语音数据集生成方法、装置、设备和计算机可读介质。
技术介绍
[0002]为了对智能电视、智能空调、智能窗帘等智能设备进行的语音控制功能进行测试,需要大量的语音数据。例如,如果需要测试是否能正常开启电视,需要一条内容为“打开电视”的测试语音。在测试时,一般需要测试人员人工说出测试语音,或者提前录制测试语音。
[0003]然而,当采用上述方式得到测试语音时,经常会存在如下技术问题:
[0004]人工说出或者录制效率低下,缺乏自动生成智能设备测试语音数据的方法。
技术实现思路
[0005]本公开的内容部分用于以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。本公开的内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。本公开的一些实施例提出了语音数据集生成方法、装置、设备和计算机可读介质,来解决以上
技术介绍
部分提到的技术问题中的一 ...
【技术保护点】
【技术特征摘要】
1.一种语音数据集生成方法,包括:通过服务端提供的接口获取多个智能设备的属性信息,得到智能设备属性信息集,其中,每个属性信息包括至少一个属性,所述至少一个属性中包括设备控制属性;对于所述智能设备属性信息集中的属性信息,根据所述属性信息所包括的至少一个属性和所述至少一个属性所包括的设备控制属性对应的属性值,生成所述属性信息对应的多条控制文本,其中,每个属性值对应至少一条控制文本;将各条控制文本进行语音合成,得到语音数据集。2.根据权利要求1所述的方法,其中,在所述对于所述智能设备属性信息集中的属性信息,根据所述属性信息所包括的至少一个属性和所述至少一个属性所包括的设备控制属性对应的属性值,生成所述属性信息对应的多条控制文本之前,所述方法还包括:根据所述设备控制属性,对所述智能设备属性信息集进行划分,得到多个智能设备属性信息子集。3.根据权利要求2所述的方法,其中,所述对于所述智能设备属性信息集中的属性信息,根据所述属性信息所包括的至少一个属性和所述至少一个属性所包括的设备控制属性对应的属性值,生成所述属性信息对应的多条控制文本,包括:对于所述多个智能设备属性信息子集中每个智能设备属性信息子集中的属性信息,将所述属性信息所包括的至少一个属性和所述至少一个属性所包括的设备控制属性对应的属性值,输入与所述智能设备属性信息子集对应的模型,生成所述属性信息对应的多条控制文本。4.根据权利要求1所述的方法,其中,所述根据所述属性信息所包括的至少一个属性和所述至少一个属性所包括的设备控制属性对应的属性值,生成所述属性信息对应的多条控制文本,包括:对于所述属性信息所包括的设备控制属性对应的每个属性值,根据所述属性值、所述属性值对应的设备控制属性、所述至少一个属性中所包括的设备名称,生成所述属性信息对应的多条控制文本。5.根据权利要求4所述的方法,其中,所述根据所述属性值、所述属性值对应的设备控制属性、所述至少一个属性中所包括的设备名称,生成所述属性信息对应的多条控制文...
【专利技术属性】
技术研发人员:王二旭,
申请(专利权)人:京东科技信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。