基于图像识别和语音交互的学习方法及系统技术方案

技术编号：17033453 阅读：25 留言：0更新日期：2018-01-13 19:43

本发明专利技术公开了一种基于图像识别和语音交互的学习方法及系统，包括：用户通过移动终端拍照或在移动终端中选择一张图片上传至服务器端；服务器端的图像识别模块接收移动终端发来的图片，并将图片处理成至少一条文本推送至移动终端；用户选择其中一条文本或自己推荐一条文本，移动终端自动将该文本发送至服务器端的语音合成模块，语音合成模块接收移动终端发来的文本，并将文件处理合成为音频数据反馈至移动终端；移动终端接收音频数据供用户学习；用户根据音频数据进行跟读，并通过移动终端录音发送至服务器端的语音识别模块；所述语音识别模块接收移动终端发送来的录音，对录音进行分析并给出评价反馈至移动终端，达到随时随地进行拍照学习的目的。

全部详细技术资料下载

【技术实现步骤摘要】
基于图像识别和语音交互的学习方法及系统
本专利技术涉及图像识别及语音交互领域，具体涉及一种基于图像识别和语音交互的学习系统及方法。
技术介绍
习主席说，建设“人人皆学、处处能学、时时可学”的学习型社会。坚持不懈推进教育信息化，努力以信息化为手段扩大优质教育资源覆盖面。我们将通过教育信息化，逐步缩小区域、城乡数字差距，大力促进教育公平，让亿万孩子同在蓝天下共享优质教育、通过知识改变命运。现有技术中，语音合成技术、在线录音技术、语音识别技术，都已经是相对成熟的技术，但是现有技术中还存在很多不足，例如：学生在学习中，学习内容都是教材规定好的，无法自动生成教学内容，对任意内容自动生成图文声音并茂的教学内容，并辅导使用者进行外语学习和练习的产品还没有。
技术实现思路
为解决上述技术问题，本专利技术提出了一种基于图像识别和语音交互的学习方法及系统，以达到随时随地进行拍照学习的目的。为达到上述目的，本专利技术的技术方案如下：基于图像识别和语音交互的学习方法，包括：用户通过移动终端拍照或在移动终端中选择一张图片上传至服务器端；服务器端的图像识别模块接收移动终端发来的图片，并将图片处理成至少一条文本推送至移动终端；用户选择其中一条文本或自己推荐一条文本，移动终端自动将该文本发送至服务器端的语音合成模块，所述语音合成模块接收移动终端发来的文本，并将文件处理合成为音频数据反馈至移动终端；移动终端接收音频数据供用户学习；用户根据音频数据进行跟读，并通过移动终端录音发送至服务器端的语音识别模块；所述语音识别模块接收移动终端发送来的录音，对录音进行分析并给出评价反馈至移动终端。作为优选的...
基于图像识别和语音交互的学习方法及系统

【技术保护点】
一种基于图像识别和语音交互的学习方法，其特征在于，包括：用户通过移动终端拍照或在移动终端中选择一张图片上传至服务器端；服务器端的图像识别模块接收移动终端发来的图片，并将图片处理成至少一条文本推送至移动终端；用户选择其中一条文本或自己推荐一条文本，移动终端自动将该文本发送至服务器端的语音合成模块，所述语音合成模块接收移动终端发来的文本，并将文件处理合成为音频数据反馈至移动终端；移动终端接收音频数据供用户学习；用户根据音频数据进行跟读，并通过移动终端录音发送至服务器端的语音识别模块；所述语音识别模块接收移动终端发送来的录音，对录音进行分析并给出评价反馈至移动终端。

【技术特征摘要】
1.一种基于图像识别和语音交互的学习方法，其特征在于，包括：用户通过移动终端拍照或在移动终端中选择一张图片上传至服务器端；服务器端的图像识别模块接收移动终端发来的图片，并将图片处理成至少一条文本推送至移动终端；用户选择其中一条文本或自己推荐一条文本，移动终端自动将该文本发送至服务器端的语音合成模块，所述语音合成模块接收移动终端发来的文本，并将文件处理合成为音频数据反馈至移动终端；移动终端接收音频数据供用户学习；用户根据音频数据进行跟读，并通过移动终端录音发送至服务器端的语音识别模块；所述语音识别模块接收移动终端发送来的录音，对录音进行分析并给出评价反馈至移动终端。2.根据权利要求1所述的基于图像识别和语音交互的学习方法，其特征在于，所述图像识别模块采用TensorFlow程序对图片进行处理，TensorFlow利用训练好的模型进行预测得到推荐文本。3.根据权利要求1所述的基于图像识别和语音交互的学习方法，其特征在于，所述语音合成模块根据预先设置的语法知识库和语法字典对文本进行分析；将分析后的文本训练，生成有韵律的神经网络；结合预先设置的语音语料库生成音频数据。4.根据权利要求1所述的基于图像识别和语音交互的学习方法，其特征在于，所述语音识别模块分析待识别的语音，得到语音参数，将所述语音参数与语音识别库中的语音模板进行一一比较，并采用判决的方法找出最接近该语音参数的模板，得出识别结果并评分。5.根据权利要求4所述的基于图像识别和语音交互的学习方法，其特征在于，所述语音参数比较的标准是计量语音特征参数矢量之间的失真测度。6.一种基于图像识别和语音交互的学习系统，其特征在于，包括：移动...

【专利技术属性】
技术研发人员：朱奇峰，
申请(专利权)人：苏州清睿教育科技股份有限公司，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人