一种基于深度学习的语音互动设备制造技术

技术编号:26381139 阅读:20 留言:0更新日期:2020-11-19 23:49
本发明专利技术属于智能设备技术领域,具体为一种基于深度学习的语音互动设备,包括壳体、触摸显示屏和语音采集器,所述壳体的前表面中间设置有触摸显示屏,所述壳体的左侧和右侧设置有语音采集器,所述壳体的内腔设置有处理器、预处理单元、深度学习芯片、语音处理单元和驱动单元,所述处理器电性输入连接预处理单元,所述预处理单元电性输入连接语音采集器,所述处理器双向连接语音处理单元和深度学习芯片,其结构合理,首先通过语音降噪、语音合成和语音信号转换对语音采集器采集的语音进行预处理,然后在通过时频分解、目标计算和特征抽取、分离模型和波形合成对采集到的语音信号进行增强,提高了语音信息的准确性。

【技术实现步骤摘要】
一种基于深度学习的语音互动设备
本专利技术涉及智能设备
,具体为一种基于深度学习的语音互动设备。
技术介绍
随着科技的发展,人们对智能设备与人的互动交流有了更高的要求。例如:智能设备能够“听懂”人说话而做出相应的反应。深度学习全称深度神经网络,本质上是多层次的人工神经网络算法,即模仿人脑的神经网络,从最基本的单元上模拟了人类大脑的运行机制。最早的神经网络的思想起源于1943年的MCP人工神经元模型,当时是希望能够用计算机来模拟人的神经元反应的过程,但直到最近,它才真正让人工智能火起来。主要原因在于:算法的突破、数据量的激增和计算机能力/成本的下降。其中计算能力的提升的作为人工智能实现的物理基础,对人工智能发展的意义不言而喻。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。近年来,其所取得的前所未有的突破掀起了人工智能新一轮的发展热潮。目前,研发出来的基于深度学习技术的主流芯片有CPU、GPU、FPGA、ASIC。投放市场的深度学习芯片有中国科学院计算技术研究所研发的“寒武纪”芯片、麻省理工学院研发的Eyeriss芯片等等。现有的基于深度学习的语音互动设备在使用的过程中,市场上已经有能够识别人声并进行互动的智能设备,但此类设备存在以下缺陷:对人声识别的准确度不高,为此我们提出一种新型的基于深度学习的语音互动设备解决上述问题。
技术实现思路
本部分的目的在于概述本专利技术的实施方式的一些方面以及简要介绍一些较佳实施方式。在本部分以及本申请的说明书摘要和专利技术名称中可能会做些简化或省略以避免使本部分、说明书摘要和专利技术名称的目的模糊,而这种简化或省略不能用于限制本专利技术的范围。鉴于现有语音互动设备中存在的问题,提出了本专利技术。因此,本专利技术的目的是提供一种基于深度学习的语音互动设备,能够实现在使用的过程中,对收集到的语音进行预处理和信号增强,提高准确性。为解决上述技术问题,根据本专利技术的一个方面,本专利技术提供了如下技术方案:一种基于深度学习的语音互动设备,其包括壳体、触摸显示屏和语音采集器,所述壳体的前表面中间设置有触摸显示屏,所述壳体的左侧和右侧设置有语音采集器,所述壳体的内腔设置有处理器、预处理单元、深度学习芯片、语音处理单元和驱动单元,所述处理器电性输入连接预处理单元,所述预处理单元电性输入连接语音采集器,所述处理器双向连接语音处理单元和深度学习芯片,所述处理器电性输出连接驱动单元;其中,预处理单元包括语音降噪、语音合成和语音信号转换;语音处理单元包括时频分解、目标计算和特征抽取、分离模型和波形合成。作为本专利技术所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述驱动单元电性输出连接触摸显示屏,根据不同的语音指令,控制触摸显示屏显示不同的内容。作为本专利技术所述的一种基于深度学习的语音互动设备的一种优选方案,其中:语音降噪采用mask方法进行降噪,因此我们的目标为IRM(t,f)其中|S(t,f)|2为纯净语音的能量谱,|N(t,f)|2为噪声的能量谱。作为本专利技术所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述壳体的顶部设置有提手,所述提手的顶部设置有防滑套,方便装置的携带。作为本专利技术所述的一种基于深度学习的语音互动设备的一种优选方案,其中:所述壳体的底部四角设置有支撑脚架,支撑脚架的底部设置有防护垫片,用于增加稳定性。与现有技术相比,本专利技术的有益效果是:通过该一种基于深度学习的语音互动设备的设置,结构设计合理,首先通过语音降噪、语音合成和语音信号转换对语音采集器采集的语音进行预处理,然后在通过时频分解、目标计算和特征抽取、分离模型和波形合成对采集到的语音信号进行增强,提高了语音信息的准确性。附图说明为了更清楚地说明本专利技术实施方式的技术方案,下面将结合附图和详细实施方式对本专利技术进行详细说明,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其它的附图。其中:图1为本专利技术结构示意图;图2为本专利技术系统框图;图3为本专利技术语音处理单元结构示意图。图中;100壳体、110触摸显示屏、120语音采集器。具体实施方式为使本专利技术的上述目的、特征和优点能够更加明显易懂,下面结合附图对本专利技术的具体实施方式做详细的说明。在下面的描述中阐述了很多具体细节以便于充分理解本专利技术,但是本专利技术还可以采用其他不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本专利技术内涵的情况下做类似推广,因此本专利技术不受下面公开的具体实施方式的限制。其次,本专利技术结合示意图进行详细描述,在详述本专利技术实施方式时,为便于说明,表示器件结构的剖面图会不依一般比例作局部放大,而且所述示意图只是示例,其在此不应限制本专利技术保护的范围。此外,在实际制作中应包含长度、宽度及深度的三维空间尺寸。为使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的实施方式作进一步地详细描述。本专利技术提供如下技术方案:一种基于深度学习的语音互动设备,包括壳体100、触摸显示屏200和语音采集器300,壳体100的前表面中间设置有触摸显示屏200,壳体100的左侧和右侧设置有语音采集器300,壳体100的内腔设置有处理器、预处理单元、深度学习芯片、语音处理单元和驱动单元,处理器电性输入连接预处理单元,预处理单元电性输入连接语音采集器300,处理器双向连接语音处理单元和深度学习芯片,处理器电性输出连接驱动单元;具体的,预处理单元包括语音降噪、语音合成和语音信号转换;语音处理单元包括时频分解、目标计算和特征抽取、分离模型和波形合成,驱动单元电性输出连接触摸显示屏200,根据不同的语音指令,控制触摸显示屏200显示不同的内容,语音采集器300用于语音采集,触摸显示屏200用于根据语音内容显示不同的内容,实现语音互动语音降噪采用mask方法进行降噪,因此我们的目标为IRM(t,f)其中|S(t,f)|2为纯净语音的能量谱,|N(t,f)|2为噪声的能量谱。工作原理:在使用的过程中,首先通过语音采集器300与语音指令进行采集,首先通过语音降噪、语音合成和语音信号转换对语音采集器300采集的语音进行预处理,然后在通过时频分解、目标计算和特征抽取、分离模型和波形合成对采集到的语音信号进行增强,提高了语音信息的准确性。虽然在上文中已经参考实施方式对本专利技术进行了描述,然而在不脱离本专利技术的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,本专利技术所披露的实施方式中的各项特征均可通过任意方式相互结合起来使用,在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此,本专利技术并不局限于文中公开本文档来自技高网...

【技术保护点】
1.一种基于深度学习的语音互动设备,其特征在于:包括壳体(100)、触摸显示屏(200)和语音采集器(300),所述壳体(100)的前表面中间设置有触摸显示屏(200),所述壳体(100)的左侧和右侧设置有语音采集器(300),所述壳体(100)的内腔设置有处理器、预处理单元、深度学习芯片、语音处理单元和驱动单元,所述处理器电性输入连接预处理单元,所述预处理单元电性输入连接语音采集器(300),所述处理器双向连接语音处理单元和深度学习芯片,所述处理器电性输出连接驱动单元;/n其中,/n预处理单元包括语音降噪、语音合成和语音信号转换;/n语音处理单元包括时频分解、目标计算和特征抽取、分离模型和波形合成。/n

【技术特征摘要】
1.一种基于深度学习的语音互动设备,其特征在于:包括壳体(100)、触摸显示屏(200)和语音采集器(300),所述壳体(100)的前表面中间设置有触摸显示屏(200),所述壳体(100)的左侧和右侧设置有语音采集器(300),所述壳体(100)的内腔设置有处理器、预处理单元、深度学习芯片、语音处理单元和驱动单元,所述处理器电性输入连接预处理单元,所述预处理单元电性输入连接语音采集器(300),所述处理器双向连接语音处理单元和深度学习芯片,所述处理器电性输出连接驱动单元;
其中,
预处理单元包括语音降噪、语音合成和语音信号转换;
语音处理单元包括时频分解、目标计算和特征抽取、分离模型和波形合成。


2.根据权利要求1所述的一种基于深度学习的语音互动设备,其特征在于:所述驱...

【专利技术属性】
技术研发人员:朱映辉江玉珍
申请(专利权)人:韩山师范学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1