当前位置: 首页 > 专利查询>东南大学专利>正文

一种二值权重卷积神经网络模块及其用于声纹识别的方法技术

技术编号:28627774 阅读:29 留言:0更新日期:2021-05-28 16:24
本发明专利技术公开了一种二值权重卷积神经网络模块及其用于声纹识别的方法。属于人工智能神经网络技术领域。其功能为对采集到的语音特征进行二值化的卷积计算与全连接计算,采用符号判断方式判断输入语音中是否含有目标说话人,并输出判断结果。其核心结构包括地址生成单元、状态机控制单元和复用计算单元。本发明专利技术采用二值化的卷积神经网络,极大减少了计算过程中的乘法操作,通过状态机控制单元控制整个网络的操作,通过判断全连接神经元的符号进行说话人判断,简单有效。模块化程度高,结构简单,可行性好,实现了较好的声纹识别效果同时有效降低了整体计算的功耗和延时。

【技术实现步骤摘要】
一种二值权重卷积神经网络模块及其用于声纹识别的方法
本专利技术涉及人工智能神经网络
,尤其是一种二值权重卷积神经网络模块及其用于声纹识别的方法。
技术介绍
声纹识别技术属于语音识别技术的一个分支,实现对说话人的身份的确认的功能。传统上来说,声纹识别技术会采用高斯混合模型来实现,但采用该模型虽然可以保证较为优秀的准确率,但会面临硬件开销大,资源利用率低,无法复用等问题。目前在整个行业对软件模型和硬件结构的优化的追求下,行业内涌现出了很多采用通用卷积神经网络来实现声纹识别的方案,但采用该方案对硬件资源的利用率仍不够高,且相对功耗较高。本专利技术采用了具有高能源效率和低硬件开销的二值权重卷积神经网络来实现声纹识别方案,用很少的精确度降低换取了硬件面积和能源效率上的大幅度提升,并且网络结构可复用。
技术实现思路
本专利技术要解决的技术问题是采用传统方法的实现声纹识别网络系统规模大,功耗大,结构冗余严重,本专利技术提供一种二值权重卷积神经网络模块及其用于声纹识别的方法,应用于说话人声纹识别以及卷积神经网络二值化。本专利技术在可重本文档来自技高网...

【技术保护点】
1.一种二值权重卷积神经网络模块,其特征在于,包括地址生成单元、状态机控制单元和复用计算单元;状态机控制单元与地址生成单元以及复用计算单元连接;/n所述状态机控制单元用于控制地址生成单元和复用计算单元,完成神经网络参数与语音声纹特征数据读写与计算;/n地址生成单元用于产生神经网络参数的读取地址、语音声纹特征数据的读写地址;/n复用计算单元对输入的语音声纹特征数据依次进行二值化的卷积计算、全连接计算和符号比较计算;判断输入的语音声纹特征数据是否与目标说话人的语音特征相匹配,并输出判断结果。/n

【技术特征摘要】
1.一种二值权重卷积神经网络模块,其特征在于,包括地址生成单元、状态机控制单元和复用计算单元;状态机控制单元与地址生成单元以及复用计算单元连接;
所述状态机控制单元用于控制地址生成单元和复用计算单元,完成神经网络参数与语音声纹特征数据读写与计算;
地址生成单元用于产生神经网络参数的读取地址、语音声纹特征数据的读写地址;
复用计算单元对输入的语音声纹特征数据依次进行二值化的卷积计算、全连接计算和符号比较计算;判断输入的语音声纹特征数据是否与目标说话人的语音特征相匹配,并输出判断结果。


2.根据权利要求1所述的一种二值权重卷积神经网络模块,其特征在于,所述地址生成单元包括数据读地址模块、计算结果写地址模块、语音数据写地址模块、语音数据读地址模块、权重参数写地址模块和读写地址选择模块;
所述数据读地址模块用于生成读取接收到的说话人声纹特征数据时的基址,所述计算结果写地址模块用于生成神经网络计算完毕后写入结果的目标地址,所述语音数据写地址模块用于生成训练时存储目标语音数据时的目标地址,所述语音数据读地址模块用于生成神经网络加载语音声纹特征数据时的对应地址,所述权重参数写地址模块用于生成存储训练时得到的网络权重参数的目标地址;所述读写地址选择模块受状态机控制单元直接控制,数据读地址模块、计算结果写地址模块、语音数据写地址模块、语音数据读地址模块和权重参数写地址模块的输出,就是读写地址选择模块的输入数据,状态机控制单元发出控制信号到读写地址选择模块,控制读写地址选择模块数据的输出。


3.根据权利要求1所述的一种二值权重卷积神经网络模块,其特征在于,所述复用计算单元包括特征缓冲器模块、二维卷积计算模块、归一化单元、全连接缓冲器、智能计算模块组和阈值比较模块;
复用计算单元通过调用缓冲器模块、二维卷积计算模块和归一化单元进行二值化的卷积计算,特征缓冲器对输入的数据进行规整处理,并对规整处理后的数据进行排序,再通过二维卷积计算模块实现卷积运处后,经过归一化单元进行数据规整,将规整后的数据作为卷积计算的结果输出;
复用计算单元通过调用全连接缓冲器、智能计算模块组和归一化单元进行全连接计算,卷积计算的结果作为输入,经全连接缓冲器后进入智能计算模块组进行全连接计算,在智能计算模块组计算完后数据被送入归一化单元进行数据规整,随后将规整后的数据作为全连接计算的结果输出;
全连接计算的结果输入到阈值比较模块,进行符号比较计算,即与预设的阈值进行比较,并完成说话人身份的判定。


4.根据权利要求3所述的一种二值权重卷积神经网络模块,其特征在于,所述的归一...

【专利技术属性】
技术研发人员:刘波吴海舸张轩
申请(专利权)人:东南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1