【技术实现步骤摘要】
用于识别合成语音的方法、装置、设备和介质
本公开的实施例涉及计算机
,具体涉及用于识别合成语音的方法、装置、设备和介质。
技术介绍
语音合成,又称文语转换(TexttoSpeech,TTS)技术,是利用电子计算机和一些专门装置模拟人,制造语音的技术。随着合成语音与真实语音越来越接近,如何鉴别哪些声音是真实的,哪些是伪造的是当前研究的一项重要课题,关系着诸如声纹识别、语音解锁等识别技术的安全性。
技术实现思路
本公开提出了用于识别合成语音的方法和装置。第一方面,本公开的实施例提供了一种用于识别合成语音的方法,该方法包括:获取待识别语音;对待识别语音进行识别,以生成用于指示待识别语音是否属于合成语音的预指示信息;基于预指示信息对待识别语音进行后处理,以生成用于指示待识别语音是否属于合成语音的指示信息。在一些实施例中,上述对待识别语音进行识别,以生成用于指示待识别语音是否属于合成语音的预指示信息,包括:将待识别语音输入至预先训练的合成语音识别模型,得到用于指示待识别语音是否属于合成 ...
【技术保护点】
1.一种用于识别合成语音的方法,包括:/n获取待识别语音;/n对所述待识别语音进行识别,以生成用于指示所述待识别语音是否属于合成语音的预指示信息;/n基于所述预指示信息对所述待识别语音进行后处理,以生成用于指示所述待识别语音是否属于合成语音的指示信息。/n
【技术特征摘要】
1.一种用于识别合成语音的方法,包括:
获取待识别语音;
对所述待识别语音进行识别,以生成用于指示所述待识别语音是否属于合成语音的预指示信息;
基于所述预指示信息对所述待识别语音进行后处理,以生成用于指示所述待识别语音是否属于合成语音的指示信息。
2.根据权利要求1所述的方法,其中,所述对所述待识别语音进行识别,以生成用于指示所述待识别语音是否属于合成语音的预指示信息,包括:
将所述待识别语音输入至预先训练的合成语音识别模型,得到用于指示待识别语音是否属于合成语音的预指示信息,其中,所述合成语音识别模型用于表征预指示信息与待识别语音之间的对应关系。
3.根据权利要求1所述的方法,其中,所述基于所述预指示信息对所述待识别语音进行后处理,以生成用于指示所述识别语音是否属于合成语音的指示信息,包括:
响应于确定所生成的预指示信息用于指示所述待识别语音属于合成语音,对所述待识别语音进行后处理,以生成用于指示所述待识别语音是否属于合成语音的指示信息。
4.根据权利要求3所述的方法,其中,所述对所述待识别语音进行后处理,以生成用于指示所述待识别语音是否属于合成语音的指示信息,包括:
从所述待识别语音中提取音素匹配的目标数目个语音切片;
确定所提取的目标数目个语音切片之间的相似度;
响应于确定所得到的相似度满足预设条件,生成用于指示所述待识别语音属于合成语音的指示信息。
5.根据权利要求2所述的方法,其中,所述合成语音识别模型通过以下步骤训练得到:
获取训练样本集合...
【专利技术属性】
技术研发人员:殷翔,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。