语音处理方法、信息装置与计算机程序产品制造方法及图纸

技术编号：23471756 阅读：32 留言：0更新日期：2020-03-06 13:25

本发明专利技术涉及一种语音处理方法、信息装置与计算机程序产品。该计算机执行的语音处理方法，包含：通过一麦克风取得一混合语音信号，其中该混合语音信号至少包含不特定的多个说话人所同时发出的多个语音信号；根据该混合语音样本信号而利用一生成对抗网络产出一组模拟语音信号，以模拟该多个语音信号；以及决定该组模拟语音信号的信号数目以估计所在环境中该多个说话人的人数，并提供作为一信息应用程序的输入。

Speech processing methods, information devices and computer program products

全部详细技术资料下载

【技术实现步骤摘要】
语音处理方法、信息装置与计算机程序产品
本专利技术大体而言关于计算机执行的语音处理方法与信息装置。特别地，关于一种计算机执行的语音处理方法与信息装置，其可从所接收到的混合语音信号中估计所在环境中不特定说话人的人数。
技术介绍
关于可检测语音且可供用户通过语音进行控制的信息装置，目前已有商业化的智能音箱产品，其基本结构可参考Amazon公司的产品AmazonEcho或是Google公司的产品GoogleHome而加以了解。此类装置一般而言具有处理器，而可在本地或是通过网络而在云端执行各式应用程序，以提供各式信息服务。此外，以GoogleHome为例，其可支持多用户，也就是可为每个用户提供不同的服务。为了要对用户进行识别，每个用户必须先注册其声纹。用户先对着GoogleHome说出「OkGoogle」和「HeyGoogle」两个唤醒词。然后GoogleHome会分析那些唤醒词，以分析出该用户声纹的特征。之后该用户再对GoogleHome说「OkGoogle」或「HeyGoogle」，GoogleHome就将声音与以前所注册的声纹比较，理解是谁在说话。另一方面，现有技术也可针对用户所发出的语音内容进行辨识，例如可辨识出用户话语中的特定字眼，进而决定用户当下所感兴趣的事物或是用户当下的情绪，由此可决定所要提供给该用户的服务内容。对此可参考例如美国专利US9934785或是USPub.20160336005。
技术实现思路
虽然现有技术中可以做到说话人的辨识以及单字或语句内容的识别，但仍然有...

【技术保护点】
1.一种计算机执行的语音处理方法，涉及一生成对抗网络，该生成对抗网络包含一个生成网络与一个判别网络，其中该方法包含：/n(a)通过一麦克风取得一混合语音信号，其中该混合语音信号至少包含多个说话人在一时段内发出的多个语音信号；/n(b)提供该混合语音信号给该生成网络，该生成网络以一生成模型来根据该混合语音信号加以产出一组模拟语音信号，以模拟该多个语音信号，其中该生成模型中的参数由该生成网络与该判别网络不断对抗学习而决定；以及/n(c)决定该组模拟语音信号的信号数目，并提供作为一信息应用程序的输入。/n

【技术特征摘要】
1.一种计算机执行的语音处理方法，涉及一生成对抗网络，该生成对抗网络包含一个生成网络与一个判别网络，其中该方法包含：
(a)通过一麦克风取得一混合语音信号，其中该混合语音信号至少包含多个说话人在一时段内发出的多个语音信号；
(b)提供该混合语音信号给该生成网络，该生成网络以一生成模型来根据该混合语音信号加以产出一组模拟语音信号，以模拟该多个语音信号，其中该生成模型中的参数由该生成网络与该判别网络不断对抗学习而决定；以及
(c)决定该组模拟语音信号的信号数目，并提供作为一信息应用程序的输入。

2.如权利要求1所述的方法，其中该多个说话人所发出的多个语音信号并无作为样本预先提供给该生成对抗网络。

3.如权利要求1所述的方法，还包含：
利用该组模拟语音信号的信号数目，辨识该多个说话人所发出的多个语音信号的声纹。

4.如权利要求1所述的方法，其中根据一预定时间表或条件，重复步骤(a)至(c)，以提供多个输入给该信息应用程序，由此该信息应用程序根据该多个输入以执行一特定应用。

5.一种计算机执行的语音处理方法，其中该方法包含：
(a)通过一麦克风取得一混合语音信号，其中该混合语音信号至少包含多个说话人在一时段内所发出的多个语音信号；
(b)根据...

【专利技术属性】
技术研发人员：许云旭，陈柏儒，
申请(专利权)人：洞见未来科技股份有限公司，
类型：发明
国别省市：萨摩亚;WS

全部详细技术资料下载我是这个专利的主人