一种基于语音识别技术的导航设备制造技术

技术编号:24275945 阅读:50 留言:0更新日期:2020-05-23 15:12
本实用新型专利技术公开了一种基于语音识别技术的导航设备,属于智能导航技术领域。该导航设备包括主控芯片,与主控芯片相连的屏幕显示装置、存储卡、无线网络模块、定位模块、语音合成芯片和音频编解码芯片,及与音频编解码芯片相连的麦克风、扬声器和短语音识别装置;所述扬声器还与语音合成芯片相连,所述短语音识别装置还与麦克风相连;所述主控芯片还可通过无线网络模块连接后台服务器。该导航设备与现有的后台服务器协同作用,可实现更加智能的交互体验和更实时合理的路线安排。

A navigation device based on speech recognition technology

【技术实现步骤摘要】
一种基于语音识别技术的导航设备
本技术涉及智能导航
,具体涉及一种基于语音识别技术的导航设备。
技术介绍
本世纪第二个十年,深度学习技术的应用给计算机的各个领域带来了前所未有的希望,很快语音识别技术也传来了喜讯,深度学习使得语音识别在以往最好的系统的基础上错误率下降了30%以上。刚好突破了商业应用的零界点。该技术随着互联网大数据等一系列新技术一起成为了业界毫无争议的标准前沿技术。另一方面,各大平台相继推出了AI开放API,例如百度AI开发平台以及其他像Google、阿里等互联网公司将人工智能技术开放出来,使得最前沿的技术得以落地,降低了前沿技术应用的门槛。软件和硬件的发展必定是相辅相成的,有了软件的技术,那么硬件平台也会迎来如雨后春笋般的发展。目前市面上存在的智能音箱等语音交互式设备不具备地理位置查询导航功能,而带有导航功能的导航仪由于设计年份较早使用的都是本地语音识别技术,识别效果不理想,不够智能化,而且其信息不够实时。
技术实现思路
本技术的目的是为了解决上述技术问题,提供一种基于语音识别技术的导航设备,该设备与后台服务器协同作用,可实现更加智能的交互体验和更实时合理的路线安排。为实现上述目的,本技术采用的技术方案如下:一种基于语音识别技术的导航设备,包括主控芯片,与主控芯片相连的屏幕显示装置、存储卡、无线网络模块、定位模块、语音合成芯片和音频编解码芯片,及与音频编解码芯片相连的麦克风、扬声器和短语音识别装置;所述扬声器还与语音合成芯片相连,所述短语音识别装置还与麦克风相连;所述主控芯片还通过无线网络模块连接后台服务器。作为一种优选方案,所述短语音设别为YS-LDV7语音识别模块,用于关键词唤醒。作为一种优选方案,所述音频编解码芯片为VS1053,用于对关键词进行编解码。作为一种优选方案,所述主控芯片为STM32微控制器,用于读取音频编解码芯片编码好的数据流,并可通过无线网络模块将其发送至后台服务器。作为一种优选方案,所述存储卡为TF卡,用于将主控芯片读取到的数据以文件形式保存。作为一种优选方案,所述语音合成芯片为YS-5152,用于语音合成。作为一种优选方案,所述屏幕显示装置为TFT屏幕,用于显示状态信息。作为一种优选方案,所述后台服务器包括均可通过无线网络模块与主控芯片相连的百度云AI开放平台、图灵可训练机器人和地图API。与现有技术相比,本技术具有以下有益效果:本技术导航设备集自动语音识别和导航功能于一体,具备语音唤醒、音频信息编解码、音频信息上传至服务程序、音频信息和文字信息接受、语音合成功能,可实现更加智能的交互体验和更实时合理的路线安排。并且,该导航设备成本低廉,其所用零部件皆为市场上最常见的,既适合在校学生和物联网爱好者用来学习使用,又适宜于推广应用于导游行业和车载导航行业。附图说明图1为本技术结构示意图。图2为后台服务器工作流程图。具体实施方式下面结合附图说明和实施例对本技术作进一步说明,本技术的方式包括但不仅限于以下实施例。本实施例的目的是为了提供一种基于语音识别技术的导航设备,参见图1,该导航设备包括STM32微控制器,与STM32微控制器相连的2.8寸TFT屏幕、TF存储卡、ESP8266无线WIFI模块、GPS定位模块、YS-5152语音合成模块和VS11053音频编解码芯片,及与VS11053音频编解码芯片相连的麦克风、扬声器和YS-LDV7短语音识别模块;所述扬声器还与YS-5152语音合成模块相连,所述YS-LDV7短语音识别模块还与麦克风相连,形成一种具备语音唤醒、音频信息编解码、音频信息上传至服务器、音频信息和文字信息接受、语音合成功能的硬件设备。此外,该导航设备配合使用fatfs文件系统、HTTP传输协议等软件及协议可实现对音频的采集、处理及合成。在使用时,本实施例导航设备的工作流程如下:(1)使用YS-LDV7语音识别模块进行关键词唤醒;(2)使用VS1053对唤醒关键词的后一段语音进行编码;(3)STM32微控制器读取VS1053编码好的数据流,并将读取到的数据以文件形势保存到TF存储卡中;(4)STM32微控制器将保存好的音频文件通过ESP8266以HTTP协议将数据大宝后发送至后台服务器;(5)后台服务器程序对语音进行识别、自然语义分析、返回处理后的文本信息;(6)ESP8266将后台返回的数据发送至STM32微控制器;(7)STM32微控制器将文本信息传送到YS-5152进行语音合成并播放后,扬声器播放,同时在TFT屏幕上显示状态信息。其中,步骤(5)的后台服务器可以选用现有的能够对语音进行识别、自然语义分析、文本信息传输的服务器,即可使本实施例导航设备实现其功能。在此,为了便于更清楚的对本实施例导航设备进行介绍,本实施例的后台服务器包括百度云AI开放平台、图灵可训练机器人、高德地图API的服务平台,三者均可通过无线导航设备的无线网络模块实现与导航设备的连接。而步骤(5)中后台服务器对数据的处理过程参见图2,具体为:A、接受并处理无线网络发来的数据包;B、将处理后的数据包使用百度云AI开放平台的语音识别技术对语音信息进行语音识别、自然语义分析操作,对音频信息进行目的分类然后将关键信息重新标准格式化,将音频转化为文字,以降低图灵机器人识别出错问题;C、将音频转化后的文字作为训练好的图灵机器人的输入;判断图灵机器人是否能够对音频中的内容进行响应,响应失败则代表无用信息丢弃并返回程序开始部分;响应成功则将响应信息使用语音合成功能转化为音频流返回;D、对返回的信息做进一步处理;E、将进一步处理后的数据发送给导航设备的硬件部分。如此,用百度AI开放平台提升了语音识别的效果,可极大提升了识别率。而且使用可训练的图灵机器人,使得交互效果更加智能化并且可以通过对机器人的训练让机器人更专注于特定的领域。另外相对于传统的导航方式,使用的是高德实时地图不仅能够提供更加实时的路况信息,而且能有更优的路线规划。硬件方面使用YS-5152能够在网络链路质量较差的情况下保持正常工作,当检测到网络链路质量较差时,后台以文本信息代替音频流信息回应硬件达到更快的响应速度,确保导航的准确性。进一步的提升本实施例导航设备的性能。上述实施例仅为本技术的优选实施方式之一,不应当用于限制本技术的保护范围,但凡在本技术的主体设计思想和精神上作出的毫无实质意义的改动或润色,其所解决的技术问题仍然与本技术一致的,均应当包含在本技术的保护范围之内。本文档来自技高网...

【技术保护点】
1.一种基于语音识别技术的导航设备,其特征在于,包括主控芯片,与主控芯片相连的屏幕显示装置、存储卡、无线网络模块、定位模块、语音合成芯片和音频编解码芯片,及与音频编解码芯片相连的麦克风、扬声器和短语音识别装置;所述扬声器还与语音合成芯片相连,所述短语音识别装置还与麦克风相连;所述主控芯片还通过无线网络模块连接后台服务器。/n

【技术特征摘要】
1.一种基于语音识别技术的导航设备,其特征在于,包括主控芯片,与主控芯片相连的屏幕显示装置、存储卡、无线网络模块、定位模块、语音合成芯片和音频编解码芯片,及与音频编解码芯片相连的麦克风、扬声器和短语音识别装置;所述扬声器还与语音合成芯片相连,所述短语音识别装置还与麦克风相连;所述主控芯片还通过无线网络模块连接后台服务器。


2.根据权利要求1所述的一种基于语音识别技术的导航设备,其特征在于,所述短语音设别为YS-LDV7语音识别模块,用于关键词唤醒。


3.根据权利要求1或2所述的一种基于语音识别技术的导航设备,其特征在于,所述音频编解码芯片为VS1053,用于对关键词进行编解码。
...

【专利技术属性】
技术研发人员:王明亮罗永崔晓旭张艳秋田智
申请(专利权)人:四川农业大学
类型:新型
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1