嵌入水印的语音认证系统及其方法技术方案

技术编号:35726419 阅读:18 留言:0更新日期:2022-11-26 18:24
本发明专利技术提供一种语音认证系统。根据本发明专利技术的一实施例的语音认证系统包括:语音采集部,采集将说话者的语音数字化的语音信息;学习模型服务器,基于采集的所述说话者的语音信息生成语音图像,使深度神经网络(Deep Neural Network,DNN)模型学习所述语音图像,并提取所述语音图像的特征向量;水印服务器,基于所述特征向量生成水印(watermark),将所述水印和个别信息嵌入所述语音图像或语音转换数据;以及认证服务器,基于所述特征向量生成私钥(private key),并且基于认证结果确定是否提取所述水印和所述个别信息。取所述水印和所述个别信息。取所述水印和所述个别信息。

【技术实现步骤摘要】
【国外来华专利技术】嵌入水印的语音认证系统及其方法


[0001]本专利技术涉及一种语音认证系统及方法,更详细而言,涉及一种通过嵌入水印来增强安全性的语音认证系统及方法。

技术介绍

[0002]生物认证是指,根据他人无法模仿的身体信息对用户进行识别来认证的技术。在各种生物认证技术中,近来,正在积极进行对于语音识别技术的研究。语音识别技术主要分为“语音识别”和“说话者认证”。语音识别是理解不特定多数所说的“内容”,而不管是谁在说话,而说话者认证是用于区分“谁”在说话。
[0003]作为说话者认证技术的一示例,有“声音认证服务”。如果能够仅通过语音准确快速确认主体是“谁”,则可以通过减少各种领域中为个人认证所需的现有方法,例如,登录后输入密码、认证电子证书(certificate)等繁琐的步骤,从而为使用者提供便利。
[0004]此时,说话者认证技术在首次登记用户的语音后,通过比较每次请求认证时用户发声的语音和登记的语音,根据是否一致来进行认证。当用户登记语音时,可以以几秒(例如,10秒)为单位从语音数据中提取特征点。特征点可以以语调、语速等各种类型提取,并且可以通过这种特征点的组合识别用户。
[0005]然而,当登记用户进行登记或认证语音时,可能会发生位于附近的第三者在未经许可的情况下录制登记用户的语音,并用该录制文件尝试说话者认证的情况,因此说话者认证技术的安全性可能会成为问题。如果出现这种情况,会给用户带来巨大的损失,说话者认证的可信度必然会降低。即说话者认证技术的效用性降低,并且语音认证数据的伪造或篡改可能经常发生。
[0006]为了解决这种问题,说话者认证技术可以通过计算预先学习的登记用户的语音数据模型和第三者的语音数据的相似度的方式进行认证,尤其,深度神经网络可以用于学习模型。
[0007]另外,最近开发一种通过生物体信息进行认证来创建并修改医疗记录的技术,以确保医疗综合管理系统的医疗记录的安全。换言之,正在开发一种当患者和医务人员访问电子医疗记录时,应用基于生物识别的认证模型的安全技术。
[0008]然而,仍然需要一种能够支持在认证交换个人健康/医疗信息的区域之间仅安全地发送和接收可用信息,并且限制电子医疗记录的访问的安全技术和模型。
[0009]另外,由于在生成并传输医疗记录和咨询数据的过程中存在安全问题和黑客攻击的可能性,因此存在发生医疗事故时可能伪造病历记录的问题。

技术实现思路

[0010]专利技术要解决的问题
[0011]本专利技术用于解决上述问题,提供一种语音认证系统,其可以通过准确率提高的语音认证,仅使指定的用户(说话者)阅览和修改相应医疗信息。
[0012]并且可以通过嵌入水印的认证技术,确保语音认证数据的完整性(integrity)。
[0013]本专利技术要解决的问题不限于以上所提及的问题,本领域技术人员可以从以下记载中清楚地理解未提及的其他问题。
[0014]用于解决问题的手段
[0015]根据用于解决所述问题的本专利技术的一实施例的语音认证系统包括:语音采集部,采集将说话者的语音数字化的语音信息;学习模型服务器,基于采集的所述说话者的语音信息生成语音图像,使深度神经网络(Deep Neural Network,DNN)模型学习所述语音图像,并提取所述语音图像的特征向量;水印服务器,基于所述特征向量生成水印(watermark),将所述水印和个别信息嵌入所述语音图像或语音转换数据;以及认证服务器,基于所述特征向量生成私钥,并且基于认证结果确定是否提取所述水印和所述个别信息。
[0016]另外,所述学习模型服务器可包括:帧生成部,基于所述语音信息生成规定时间的语音帧;频率分析部,基于所述语音帧分析语音频率,并且通过对所述语音频率进行图像化来按照时间序列生成所述语音图像;以及神经网络学习部,通过使所述深度神经网络模型学习所述语音图像来提取所述特征向量。
[0017]所述水印服务器可包括:水印生成部,生成并存储与所述特征向量对应的所述水印;水印嵌入部,将所生成的所述水印和所述个别信息嵌入所述语音图像的像素或所述语音转换数据;以及水印提取部,基于所述说话者的认证结果提取预先存储的所述水印和所述个别信息。
[0018]所述认证服务器可包括:暗号生成部,通过对所述特征向量进行加密来生成与所述特征向量对应的所述私钥;认证比较部,比较加密的所述特征向量和认证对象的特征向量的同一性;以及认证判断部,根据比较结果判断对所述说话者的认证是否成功,并且确定是否提取所述水印和所述个别信息。
[0019]另外,根据本专利技术一实施例的语音认证方法可包括:语音采集步骤,采集将说话者的语音数字化的语音信息;学习模型步骤,基于采集的所述说话者的语音信息生成语音图像,使深度神经网络(Deep Neural Network,DNN)模型学习所述语音图像,并提取所述语音图像的特征向量;暗号生成步骤,通过对所述特征向量进行加密来生成与所述特征向量对应的私钥(private key);水印生成步骤,基于所述私钥生成并存储水印(watermark)和个别信息;水印嵌入步骤,将所生成的所述水印和所述个别信息嵌入所述语音图像的像素或语音转换数据;认证比较步骤,比较加密的所述特征向量和认证对象的特征向量的同一性(identity);认证判断步骤,根据比较结果判断所述说话者的认证是否成功,并确定是否提取所述水印和所述个别信息;以及水印提取步骤,基于认证结果提取预先存储的所述水印和所述个别信息。
[0020]另外,所述学习模型步骤可包括:帧生成步骤,基于所述语音信息生成规定时间的语音帧;频率分析步骤,基于所述语音帧分析语音频率,并且通过对所述语音频率进行图像化来按照时间序列生成所述语音图像;神经网络学习步骤,使所述深度神经网络模型学习所述语音图像;以及特征向量提取步骤,提取学习的所述语音图像的所述特征向量。
[0021]本专利技术的具体事项包括在详细说明和附图中。
[0022]专利技术效果
[0023]根据本专利技术,由于提高了安全性,因此未经授权的人不能使用说话者的语音信息
进行包括伪造或篡改的阅览。
[0024]另外,由于使用深度神经网络模型,因此可以提高说话者的语音认证的准确率。
附图说明
[0025]图1是本专利技术一实施例的语音认证系统的框图。
[0026]图2是本专利技术一实施例的语音认证系统的学习模型服务器的框图。
[0027]图3是本专利技术一实施例的语音认证系统的水印服务器的框图。
[0028]图4是本专利技术一实施例的语音认证系统的认证服务器的框图。
[0029]图5是示出本专利技术一实施例的语音认证方法的流程的流程图。
[0030]图6是示出本专利技术一实施例的语音认证方法的学习模型步骤的动作流程的流程图。
[0031]图7是示出本专利技术一实施例的在语音认证系统的学习模型服务器中提取特征向量(D

向量)的一举例的图示。
[0032]图8是示出本专利技术一实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种语音认证系统,其中,包括:语音采集部,采集将说话者的语音数字化的语音信息;学习模型服务器,基于采集的所述说话者的语音信息生成语音图像,使深度神经网络模型学习所述语音图像,并提取所述语音图像的特征向量;水印服务器,基于所述特征向量生成水印,将所述水印和个别信息嵌入所述语音图像或语音转换数据;以及认证服务器,基于所述特征向量生成私钥,并且基于认证结果确定是否提取所述水印和所述个别信息。2.根据权利要求1所述的语音认证系统,其中,所述深度神经网络模型包括长短期记忆神经网络模型、卷积神经网络神经网络模型和时延神经网络模型中的至少一种,所述特征向量为D

向量。3.根据权利要求1所述的语音认证系统,其中,所述个别信息为包括与所述特征向量对应的医疗代码、患者个人信息和医疗记录信息中的至少一种的医疗信息。4.根据权利要求1所述的语音认证系统,其中,所述学习模型服务器包括:帧生成部,基于所述语音信息生成规定时间的语音帧;频率分析部,基于所述语音帧分析语音频率,并且通过对所述语音频率进行图像化来按照时间序列生成所述语音图像;以及神经网络学习部,通过使所述深度神经网络模型学习所述语音图像来提取所述特征向量。5.根据权利要求4所述的语音认证系统,其中,所述频率分析部通过将所述语音帧适用于短时傅里叶转换算法来生成所述语音图像。6.根据权利要求1所述的语音认证系统,其中,所述水印服务器包括:水印生成部,生成并存储与所述特征向量对应的所述水印;水印嵌入部,将所生成的所述水印和所述个别信息嵌入所述语音图像的像素或所述语音转换数据;以及水印提取部,基于所述说话者的认证结果提取预先存储的所述水印和所述个别信息。7.根据权利要求6所述的语音认证系统,其中,所述水印嵌入部被配置为:提取每个所述语音图像的像素的RGB值,计算所述RGB值和整个RGB平均值的差,将所述水印和所述个别信息嵌入计算的差小于临界值的像素。8.根据权利要求6所述的语音认证系统,其中,所述水印嵌入部被配置为:将所述水印和所述个别信息嵌入将所述语音信息转换为多维数组的所述语音转换数据的最低有效位。9.根据权利...

【专利技术属性】
技术研发人员:全昰璘
申请(专利权)人:扶植AI有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1