一种构建语料库的方法、设备、服务器和存储介质技术

技术编号：23625851 阅读：37 留言：0更新日期：2020-03-31 23:14

本申请涉及智能语音技术领域，特别涉及一种构建语料库的方法、设备、服务器和存储介质，该方法包括：依次读取各条语音资源，每读取一条，执行以下操作：基于一条语音资源，提取相应的语音特征，确定语音特征与已有的各个参考语音特征均未匹配成功时，对应语音特征建立新的语音特征库，以及将语音特征作为参考语音特征存储至新的语音特征库；构建与新的语音特征库相应的新的语料库；将一条语音资源转换为相应的文本语料，以及在确定文本语料与已有的各个参考文本语料均未匹配成功时，将文本语料添加至新的语料库。该方法提升了构建语料库的效率。

A method, device, server and storage medium for building corpus

全部详细技术资料下载

【技术实现步骤摘要】
一种构建语料库的方法、设备、服务器和存储介质
本申请涉及智能语音
，特别涉及一种构建语料库的方法、设备、服务器和存储介质。
技术介绍
随着信息技术的发展，智能语音技术已经成为人们信息获取和沟通最便捷、最有效的技术手段之一。智能语音技术，是实现人机语言交互的手段，语音识别和语音合成是智能语音技术的两个主要分支。语音识别和语音合成的实现，都需要预先构建语料库，基于语料库进行语音识别或者合成。已有技术下，语料库的一种构建方法为：通过大量志愿者进行语料录制，然后工作人员再对录制的语料信息进行采集、标注和后期维护。这种构建语料库的方式，语料的采集和构建，很大程度上依赖于人工操作，占用了大量的劳动力，并且人工采集的效率较低，导致语料采集所消耗的时间成本较高，构建语料库的效率比较低。有鉴于此，需要重新设计一种方法以克服上述缺陷。
技术实现思路
本申请实施例提供一种构建语料库的方法、设备、服务器和存储介质，用以解决现有技术中存在的构建效率低的技术问题。本申请实施例提供的具体技...

【技术保护点】
1.一种构建语料库的方法，其特征在于，包括：/n获取网络中已有的语音资源；/n依次读取各条语音资源，每读取一条，执行以下操作：/n基于一条语音资源，提取相应的语音特征，确定所述语音特征与已有的各个参考语音特征均未匹配成功时，对应所述语音特征建立新的语音特征库，以及将所述语音特征作为参考语音特征存储至所述新的语音特征库；/n构建与所述新的语音特征库相应的新的语料库；/n将所述一条语音资源转换为相应的文本语料，以及在确定所述文本语料与已有的各个参考文本语料均未匹配成功时，将所述文本语料添加至所述新的语料库。/n

【技术特征摘要】
1.一种构建语料库的方法，其特征在于，包括：
获取网络中已有的语音资源；
依次读取各条语音资源，每读取一条，执行以下操作：
基于一条语音资源，提取相应的语音特征，确定所述语音特征与已有的各个参考语音特征均未匹配成功时，对应所述语音特征建立新的语音特征库，以及将所述语音特征作为参考语音特征存储至所述新的语音特征库；
构建与所述新的语音特征库相应的新的语料库；
将所述一条语音资源转换为相应的文本语料，以及在确定所述文本语料与已有的各个参考文本语料均未匹配成功时，将所述文本语料添加至所述新的语料库。

2.如权利要求1所述的方法，其特征在于，基于一条语音资源，提取相应的语音特征，具体包括：
基于一条语音资源，提取相应的基音特征和音调特征。

3.如权利要求2所述的方法，其特征在于，依次读取各条语音资源之前，进一步包括：
构建普通话特征库，提取普通话的基音特征和音调特征，作为初始的参考语音特征存储至所述普通话特征库；
构建与所述普通话特征库对应的普通话语料库。

4.如权利要求2所述的方法，其特征在于，基于一条语音资源，提取相应的语音特征，确定所述语音特征与已有的任意一个参考语音特征未匹配成功，具体包括：
获取第一基音数值和第一音调数值，其中，所述第一基音数值由所述任意一个参考语音特征中的基音特征转换得到，所述第一音调数值由所述任意一个参考语音特征中的音调特征转换得到；
基于一条语音资源，提取相应的基音特征和音调特征，将提取的基音特征转换为第二基音数值，将提取的音调特征转换为第二音调数值；
计算所述第二基音数值与预设的第一基音数值的第一差值，以及计算所述第二音调数值与预设的第一音调数值的第二差值；
判定所述第一差值大于预设的第一阈值，且所述第二差值大于预设的第二差值时，则确定所述语音特征与普通话特征库中的参考语音特征未匹配成功。

5.如权利要求1或2所述的方法，其特征在于，进一步包括：
基于一条语音资源，提取相应的语音特征之后，若确定所述语音特征与已有的至少一项参考语音特征匹配成功，则将所述语音特征作为参考语音特征，存储至所述至少一项参考语音特征对应的语音特征库中；
将所述一条语音资源转换为相应的文本语料，以及在确定所述文本语料与已有的至少一条参考文本语料未匹配成功时，将所述文本语料添加至所述至少一条参考文本语料对应的语料库。

6.一种构建语料库的设备，其特征在于，包括：
获取单元，用于获取网络中已有的语音资源；
处理单元，用于依次读取各条语音资源，每读取一条，执行以下操作：
基于一条语音资源，提取相应的语音特征，...

【专利技术属性】
技术研发人员：李阳，
申请(专利权)人：珠海格力电器股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人