说话人认证方法、服务器及计算机可读存储介质技术

技术编号:19062229 阅读:37 留言:0更新日期:2018-09-29 13:16
本发明专利技术公开了一种说话人认证方法,该方法包括:获取预设说话人的语音信息,其中,语音信息不限制内容;构建3D卷积神经网络架构;将说话人的语音信息输入至3D卷积神经网络架构;通过3D卷积神经网络架构创建并存储说话人的语音模型;当接收到测试话语时,将测试话语信息与存储的说话人的语音模型进行对比;计算测试话语信息与说话人的语音模型的相似度,当相似度大于一预设值时,则说话人认证成功,当相似度小于一预设值时,则说话人认证失败。本发明专利技术还提供一种服务器及计算机可读存储介质。本发明专利技术提供的说话人认证方法、服务器及计算机可读存储介质通过创建说话人的与文本无关的语音模型作为密码,不易破解,提高服务器使用安全。

【技术实现步骤摘要】
说话人认证方法、服务器及计算机可读存储介质
本专利技术涉及身份认证领域,尤其涉及一种说话人认证方法、服务器及计算机可读存储介质。
技术介绍
随着互联网信息技术的发展,智能硬件的应用越来越广泛,例如智能电视、智能手机、智能机器人等。在智能硬件中,为了信息安全,大部分智能设备都设置了身份验证密码,通常的身份认证密码为指纹验证或者数字密码或者图形密码作为身份的依据,但是很多时候通过按键或触摸屏不是最有效率的做法,使用语音输入会更方便。目前的语音识别主要是用户输入特定的文本语音,智能设备识别出相应的内容时,则身份验证成功,但是特定语音作为密码,容易被破解,具有安全隐患。
技术实现思路
有鉴于此,本专利技术提出一种说话人认证方法、服务器及计算机可读存储介质,通过创建说话人的与文本无关的语音模型作为密码,不易破解,提高服务器使用安全。首先,为实现上述目的,本专利技术提出一种说话人认证方法,该方法应用于服务器,所述方法包括:获取预设说话人的语音信息,其中,所述语音信息不限制内容;构建3D卷积神经网络架构;将所述说话人的语音信息输入至所述3D卷积神经网络架构;通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型;当接收到测试话语时,将测试话语信息与所述存储的所述说话人的语音模型进行对比;计算所述测试话语信息与所述说话人的语音模型的相似度,当相似度大于一预设值时,则说话人认证成功,当相似度小于一预设值时,则说话人认证失败。可选地,所述将所述说话人的语音信息输入至所述3D卷积神经网络架构的步骤,具体包括如下步骤:将获取到的所述说话人的语音信息解析成音频堆叠帧;将所述音频堆叠帧输入至所述3D卷积神经网络架构。可选地,所述通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型的步骤,具体包括:将所述音频堆叠帧的每个词生成一个向量;根据属于所述说话人的音频堆叠帧的平均向量生成说话人的语音模型。可选地,所述通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型的步骤,具体包括:获取同一个说话人的多个不同的语音信息;将所述多个不同的语音信息解析成特征图谱并叠加在一起;将叠加在一起的特征图谱转换成向量输入到卷积神经网络架构卷积神经网络架构以生成说话人的语音模型。可选地,所述计算所述测试话语与所述说话人的语音模型的相似度计算公式为:其中,D1表示测试话语的向量,D2表示说话人模型的向量,分子表示两个向量的点乘积,分母表示两个向量的模的积。此外,为实现上述目的,本专利技术还提供一种服务器,所述服务器包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的说话人认证系统,所述说话人认证系统被所述处理器执行时实现如下步骤:获取预设说话人的语音信息,其中,所述语音信息不限制内容;构建3D卷积神经网络架构;将所述说话人的语音信息输入至所述3D卷积神经网络架构;通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型;当接收到测试话语时,将测试话语信息与所述存储的所述说话人的语音模型进行对比;计算所述测试话语信息与所述说话人的语音模型的相似度,当相似度大于一预设值时,则说话人认证成功,当相似度小于一预设值时,则说话人认证失败,其中,所述通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型的步骤,具体包括:将所述音频堆叠帧的每个词生成一个向量;根据属于所述说话人的音频堆叠帧的平均向量生成说话人的语音模型。可选地,所述将所述说话人的语音信息输入至所述3D卷积神经网络架构的步骤,具体包括如下步骤:将获取到的所述说话人的语音信息解析成音频堆叠帧;将所述音频堆叠帧输入至所述3D卷积神经网络架构。可选地,,所述计算所述测试话语与所述说话人的语音模型的相似度计算公式为:其中,D1表示测试话语的向量,D2表示说话人模型的向量,分子表示两个向量的点乘积,分母表示两个向量的模的积。可选地,所述通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型的步骤,具体包括:获取同一个说话人的多个不同的语音信息;将所述多个不同的语音信息解析成特征图谱并叠加在一起;将叠加在一起的特征图谱转换成向量输入到卷积神经网络架构卷积神经网络架构以生成说话人的语音模型。进一步地,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质存储有说话人认证系统,所述说话人认证系统可被至少一个处理器执行,以使所述至少一个处理器执行如上述的说话人认证方法的步骤。相较于现有技术,本专利技术所提出的服务器、说话人认证方法及计算机可读存储介质,首先,获取预设说话人的语音信息,其中所述语音信息不限制内容;然后,构建3D卷积神经网络架构;进一步地,将所述说话人的语音信息输入至所述3D卷积神经网络架构;接着,通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型;然后,当接收到测试话语时,将测试话语信息与所述存储的所述说话人的语音模型进行对比;最后,计算所述测试话语信息与所述说话人的语音模型的相似度,当相似度大于一预设值时,则说话人认证成功,当相似度小于一预设值时,则说话人认证失败,通过创建说话人的与文本无关的语音模型作为密码,不易破解,提高服务器使用安全。附图说明图1是本专利技术服务器一可选的硬件架构的示意图;图2是本专利技术说话人认证系统第一实施例的程序模块示意图;图3本专利技术将说话人语音解析成音频流堆叠帧的示意图;图4为本专利技术说话人认证方法第一实施例的流程示意图;图5为本专利技术说话人认证方法第一实施例中步骤S303的具体流程示意图。附图标记:服务器2存储器11处理器12网络接口13说话人认证系统200获取模块201构建模块202输入模块203对比模块204计算模块205解析模块206本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。需要说明的是,在本专利技术中涉及“第一”、“第二”等的描述仅用于描述目的,而不能理解为指示或暗示其相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。另外,各个实施例之间的技术方案可以相互结合,但是必须是以本领域普通技术人员能够实现为基础,当技术方案的结合出现相互矛盾或无法实现时应当认为这种技术方案的结合不存在,也不在本专利技术要求的保护范围之内。参阅图1所示,是服务器2一可选的硬件架构的示意图。本实施例中,所述服务器2可包括,但不仅限于,可通过系统总线相互通信连接存储器11、处理器12、网络接口13。需要指出的是,图1仅示出了具有组件11-13的服务器2,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、本文档来自技高网...

【技术保护点】
1.一种说话人认证方法,应用于服务器,其特征在于,所述方法包括:获取预设说话人的语音信息,其中,所述语音信息不限制内容;构建3D卷积神经网络架构;将所述说话人的语音信息输入至所述3D卷积神经网络架构;通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型;当接收到测试话语时,将测试话语信息与所述存储的所述说话人的语音模型进行对比;计算所述测试话语信息与所述说话人的语音模型的相似度,当相似度大于一预设值时,则说话人认证成功,当相似度小于一预设值时,则说话人认证失败。

【技术特征摘要】
1.一种说话人认证方法,应用于服务器,其特征在于,所述方法包括:获取预设说话人的语音信息,其中,所述语音信息不限制内容;构建3D卷积神经网络架构;将所述说话人的语音信息输入至所述3D卷积神经网络架构;通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型;当接收到测试话语时,将测试话语信息与所述存储的所述说话人的语音模型进行对比;计算所述测试话语信息与所述说话人的语音模型的相似度,当相似度大于一预设值时,则说话人认证成功,当相似度小于一预设值时,则说话人认证失败。2.如权利要求1所述的说话人认证方法,其特征在于,所述将所述说话人的语音信息输入至所述3D卷积神经网络架构的步骤,具体包括如下步骤:将获取到的所述说话人的语音信息解析成音频堆叠帧;将所述音频堆叠帧输入至所述3D卷积神经网络架构。3.如权利要求1所述的说话人认证方法,其特征在于,所述通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型的步骤,具体包括:将所述音频堆叠帧的每个词生成一个向量;根据属于所述说话人的音频堆叠帧的平均向量生成说话人的语音模型。4.如权利要求1所述的说话人认证方法,其特征在于,所述通过所述3D卷积神经网络架构创建并存储所述说话人的语音模型的步骤,具体包括:获取同一个说话人的多个不同的语音信息;将所述多个不同的语音信息解析成特征图谱并叠加在一起;将叠加在一起的特征图谱转换成向量输入到卷积神经网络架构卷积神经网络架构以生成说话人的语音模型。5.如权利要求4所述的说话人认证方法,其特征在于,所述计算所述测试话语与所述说话人的语音模型的相似度计算公式为:其中,D1表示测试话语的向量,D2表示说话人模型的向量,分子表示两个向量的点乘积,分母表示两个向量的模的积。6.一种服务器,其特征在于,所述服务器包括存储器、处理器,所述存储器上存储有可在所述处理器上运行的说话人认证系统...

【专利技术属性】
技术研发人员:王义文王健宗肖京
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1