一种自闭症语音特征辅助识别机器人及方法技术

技术编号：27108098 阅读：32 留言：0更新日期：2021-01-25 19:00

本发明专利技术公开了一种自闭症语音特征辅助识别机器人及方法，所述机器人包括：自闭症语音特征识别模型构建及训练单元，利用长短记忆神经网络和卷积神经网络构建自闭症语音特征识别模型，以量化的语音特征作为传感信号输入模型，对语音特征在传感信号的表现特征进行学习，并利用反向传播法对所述模型进行训练，实现分类器在网络权重的优化，最终获得可用于语音信号识别的自闭症语音特征识别模型；语音采集单元，采集机器人与被测者互动过程中被测者的语音信息；语音信息预处理单元，用于将采集的语音信息进行预处理，将语音特征量化为M维的语音特征向量；语音特征识别单元，利用训练好的模型，对经预处理后的语音信号进行语音特征识别。征识别。征识别。

全部详细技术资料下载

【技术实现步骤摘要】
一种自闭症语音特征辅助识别机器人及方法

[0001]本专利技术涉及语音情感识别
，特别是涉及一种基于LSTM(Long Short-Term Memory，长短期记忆网络)与CNN(Convolutional Neural Networks，卷积神经网络)的自闭症语音特征辅助识别机器人及方法。

技术介绍

[0002]孤独症谱系障碍(autism spectrum disorder，ASD)又称自闭症，已经越来越被社会所关注。在中国，0至14岁的自闭症儿童患者数量在300万至500万之间。目前对孤独症的评估方法，主要集中在语言交流障碍、社会交往障碍、重复刻板行为三方面。对ASD进行有效的、准确的评估需要临床经验丰富的专业医疗人员对儿童进行观察，并一同进行试验。这样的方法需要大量的人力对数据进行整理，效率低下并存在一定的人为主观性，评估结果的误差会比较大。
[0003]另一方面，现有的语音情感识别方法中，主要有基于深度信念网络的语音情感识别方法、基于长短期记忆网络(LSTM)的语音情感识别方法和基于卷积神经网络(CNN)的语音情感识别方法。上述三种方法中，存在的主要缺点是无法兼顾各个网络模型的优点。比如，深度信念网络可以将一维序列用作输入，但是无法利用序列前后间的相关性；长短期记忆网络虽然能够利用序列前后间的相关性，但是提取的特征维数较高；卷积神经网络无法直接对语音序列进行处理，需先对语音信号进行傅里叶变换，将其转换为频谱后作为输入。传统的语音情感识别方法在特征提取和分类发展前景小，以及现有的基于深度学习的...

【技术保护点】

【技术特征摘要】
1.一种自闭症语音特征辅助识别机器人，包括：自闭症语音特征识别模型构建及训练单元，利用长短记忆神经网络和卷积神经网络构建自闭症语音特征识别模型，以量化的语音特征作为传感信号输入所述自闭症语音特征识别模型，对语音特征在传感信号的表现特征进行学习，并利用反向传播法对所述自闭症语音特征识别模型进行训练，实现分类器在网络权重的优化，最终获得可用于语音信号识别的自闭症语音特征识别模型；语音采集单元，用于采集机器人与被测者互动过程中被测者的语音信息；语音信息预处理单元，用于将采集的语音信息进行预处理，将语音特征量化为M维的语音特征向量；语音特征识别单元，用于利用训练好的自闭症语音特征识别模型，对经所述语音采集单元采集、所述语音信息预处理单元处理后的语音信号进行语音特征识别。2.如权利要求1所述的一种自闭症语音特征辅助识别机器人，其特征在于：所述所述自闭症语音特征识别模型由输入层、LSTM网络层、BN1层、CNN网络层、池化层、BN2层、Flatten层、dropout层、全连接层、输出层依次连接。3.如权利要求2所述的一种自闭症语音特征辅助识别机器人，其特征在于：所述LSTM网络用于对长序列语音进行处理，其由LSTM1层、LSTM2层依次连接，所述LSTM1层与所述LSTM2层激活函数均为Tanh，所述LSTM网络输出为语音特征序列。4.如权利要求3所述的一种自闭症语音特征辅助识别机器人，其特征在于：所述LSTM网络的LSTM1层和LSTM2层分别包括输出门、输入门、遗忘门，通过各个门的参数来控制输出信息输入门i
t
由当前输入数据x
t
和前一时刻单元输出h
t-1
决定，遗忘门f
t
控制历史信息的传递，输出门O
t
计算LSTM网络的输出值h
t
。5.如权利要求4所述的一种自闭症语音特征辅助识别机器人，其特征在于：所述CNN网络为卷积层，将经过上层处理的特征向量和当前层的卷积核执行卷积运算，增强原始信号的特征并减少噪声，最后由激活函数给出卷积计算结果。...

【专利技术属性】
技术研发人员：陈首彦，张铭焰，杨晓芬，赵志甲，朱大昌，
申请(专利权)人：广州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人