【技术实现步骤摘要】
一种居家老人呼救设备
本专利技术涉及中文语音识别技术,具体涉及一种居家老人呼救设备。
技术介绍
从现在到本世纪中叶是中国人口老龄化高速发展的时期,积极、科学、有效应对人口老龄化至关重要。到2022年左右,中国65岁以上人口将占到总人口的14%,由老龄化社会进入老龄社会。而居家养老是目前老人养老的主要模式,但对于高龄患病老人,在日常生活中往往会遇到突发的紧急情况,需要救助。目前的老人呼救设备多以按键或手机为主,需要手动操作,老人在遭遇紧急情况下,可能没有行动能力来手动操作,则亟需进行语音呼救。目前,语音识别技术已经深入到生活的方方面面,如语音助手、语音检索、智能穿戴设备等应用。而作为联合国六种工作语言之一,已有17亿人以上使用中文作为日常交流的语言,中文语音识别应用领域广泛,具有很大的实用价值。当前,虽然有大量深度学习方法应用于中文语音识别领域,但语音识别方法在识别速度和识别精度上有很大的局限性,且过分依赖于高性能处理器,为了克服上述问题,将语音识别模型的训练过程与识别过程分离,分别在云端和客户端进行。
技术实现思路
针对现有技术中的不足,本专利技术提供一种基于龙芯派的居家老人呼救设备,通过在服务器端对声纹识别模型和语音识别模型进行训练,再将服务器端训练完成的模型和环境下载部署到以龙芯2K1000处理器基础的客户端,在客户端完成声纹模型参数微调和语音识别以及拨打电话功能。为实现上述目的,本专利技术采用了以下技术方案:一种居家老人呼救设备,包括用于部署声纹识别模型、语音识别模型 ...
【技术保护点】
1.一种居家老人呼救设备,其特征在于:包括用于部署声纹识别模型、语音识别模型训练环境及训练的服务器端、用于声纹识别、语音识别和拨打电话的客户端,所述客户端包括微处理器、拾音设备、电话卡和扬声器,所述拾音设备与微处理器的音频输入接口连接,将捕捉到的语音输入微处理器,所述微处理器上部署维纳滤波器,对接收到的语音信号进行降噪处理;所述电话卡和扬声器与微处理器音频输出接口连接,用以执行电话功能;所述服务器端训练完成的声纹识别模型、语音识别模型和训练环境打包部署到客户端的微处理器,采集经降噪处理的目标用户语音信号,对客户端声纹识别模型进行参数微调,录入目标用户声纹,从而构成本地声纹识别模型、本地语音识别模型及运行环境;经降噪处理的语音信号输入本地声纹识别模型和语音识别模型,根据声纹识别结果进行目标用户的判断,当声纹识别结果为目标用户,则将语音信号输入本地语音识别模型,获取识别语音结果,根据语音识别结果,微处理器执行对应的执行指令;当声纹识别结果为非目标用户,则不进行语音识别,微处理器控制扬声器发出用户不匹配的指令。/n
【技术特征摘要】
1.一种居家老人呼救设备,其特征在于:包括用于部署声纹识别模型、语音识别模型训练环境及训练的服务器端、用于声纹识别、语音识别和拨打电话的客户端,所述客户端包括微处理器、拾音设备、电话卡和扬声器,所述拾音设备与微处理器的音频输入接口连接,将捕捉到的语音输入微处理器,所述微处理器上部署维纳滤波器,对接收到的语音信号进行降噪处理;所述电话卡和扬声器与微处理器音频输出接口连接,用以执行电话功能;所述服务器端训练完成的声纹识别模型、语音识别模型和训练环境打包部署到客户端的微处理器,采集经降噪处理的目标用户语音信号,对客户端声纹识别模型进行参数微调,录入目标用户声纹,从而构成本地声纹识别模型、本地语音识别模型及运行环境;经降噪处理的语音信号输入本地声纹识别模型和语音识别模型,根据声纹识别结果进行目标用户的判断,当声纹识别结果为目标用户,则将语音信号输入本地语音识别模型,获取识别语音结果,根据语音识别结果,微处理器执行对应的执行指令;当声纹识别结果为非目标用户,则不进行语音识别,微处理器控制扬声器发出用户不匹配的指令。
2.根据权利要求1所述的一种居家老人呼救设备,其特征在于:所述客户端的微处理器为嵌入式龙芯2K1000处理器。
3.根据权利要求1所述的一种居家老人呼救设备,其特征在于:所述服务器端的声纹识别模型为基于GMM(高斯混合模型)的声纹识别模型,是通过以下步骤获取的:
步骤S1、语音提供者标注:将ST-CMDS数据中语音提供者的语音信号进行标注,对同一语音提供者的普通wav语音信号打上相同标签;
步骤S2、特征提取:将普通wav语音信号通过MFCC特征提取方法转换为卷积神经网络需要的二维频谱图像信号,即语音信号特征矩阵;
步骤S3、非目标用户声纹模型训练:将语音信号特征矩阵输入高斯混合模型GMM中,进行GMM模型的参数估计;
步骤S4、模型参数固定:基于最大似然估计算法,通过EM算法进行迭代,得到GMM模型的最优参数,将不同语音提供者的语音特征分簇。
4.根据权利要求3所述的一种居家老人呼救设备,其特征在于:所述客户端的本地声纹识别模型为基于GMM-UBM的声纹识别模型,是通过以下步骤获取的:
步骤K1、客户端部署GMM模型:将在服务器端经过非目标用户训练的基于GMM的声纹识别模型和运行环境部署到客户端;
步骤K2、目标用户语音信号录入:启动基于GMM的声纹识别模型,通过客户端拾音设备录入目标用户语音信号,存储为模型训练数据;
步骤K3、声纹识别模型参数微调:通过背景模型UBM,使用目标用户训练数据,利用最大后验概率算法,...
【专利技术属性】
技术研发人员:韩振华,薛海涛,
申请(专利权)人:山西云芯新一代信息技术研究院有限公司,
类型:发明
国别省市:山西;14
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。