基于IOS交互式语音播报系统技术方案

技术编号:18460813 阅读:120 留言:0更新日期:2018-07-18 13:31
基于IOS交互式语音播报系统,设计并实现了基于IOS平台交互式语音录播系统;本系统核心技术采用声音处理包和语音识别包,系统功能分为录音功能、播放功能、语音交换功能和文件管理四个方面设计;本系统具有录音、播放、文件管理、语音识别和语音交互功能。

Interactive speech broadcasting system based on IOS

Based on IOS interactive speech broadcasting system, an interactive voice video recording system based on IOS platform is designed and implemented. The core technology of this system uses sound processing package and voice recognition package. The system function is divided into four aspects: recording function, playback function, voice exchange function and file management. The system has a recording, playing and playing, and the system has a recording, playing and playing. File management, speech recognition and voice interaction.

【技术实现步骤摘要】
基于IOS交互式语音播报系统
本专利技术使用Objective-C技术,特别涉及IOS平台上的声音和语音识别技术。
技术介绍
录音软件是iPhone和iPad移动设备必备的工具,给工作、学习和生活带来了很大的便利;IOS系统自带的录音机软件是一款操作简单、高质量的软件,具有高音质的录音文件输出和良好的用户体验;但是,系统自带的录音软件的功能也相对较少;同样苹果商店的其他录音软件一般只是实现录音、播放、文件的存储和文件的管理;有的功能强的录音软件还具有录音文件的编辑、网络分享等功能。
技术实现思路
系统应用核心技术:1.声音处理包:在IOS应用开发中,播放音频主要采用AudioToolbox.framework和AVFoundation.framework;前者主要用于短音频的播放,通常用于一些特效音频播放,对于这类音频不需要进行进度、循环等控制;后者常用于播放一些较长的音频,对于这些音频的播放通常需要进行精确的控制;所以,本系统录音机功能的实现使用的是AVFoundation框架;录音机应用程序使用了AVFoundation框架中的AVAudioRecorder实现录音功能;使用框架中的AVAudioPlayer来实现播放功能;AVAudioPlayer可以看成一个播放器,它支持多种音频格式,而且能够进行进度、音量、播放速度等控制;AVAudioPlayer一次只能播放一个音频文件,本系统中多个音频的播放是通过创建多个播放器对象来完成;要用这两个类,需要添加头文件:#import<AVFoundation/AVFoundation.h>;2.语音识别包:关于语音识别功能的核心技术可以采用第三方开发包;诸如此类的语音识别包有很多,本系统采用的是讯飞语音识别开发包;使用这SDK需要做如下事情:1)到讯飞官方网站的开发者专区(http://open.voicecloud.cn/developer.php)先注册一个开发者账号;2)登陆之后到自己的个人中心创建一个应用,填写好相关信息,然后等待审核通过;3)应用审核通过后,选择对应平台的SDK下载;4)解压下载的压缩包,从包中选择部分framework添加到工程中,具体在BuildingPhasesLinkBinaryWithLibraries中设置;如果使用了离线识别,需要增加libc++.dylib。系统功能设计:1.录音功能:主要功能是当用户按下“开始录音”按钮时,系统设置录音的参数并开始录音;当松开按钮,则录音结束,并将以当前的系统时间命名录音文件后再进行本地化存储,同时显示到列表视图中供用户查看和编辑;录制时,有进度条控件显示音频的大小;2.播放功能:主要功能是当用户点击“开始播放”按钮时,开始按列表视图中音频文件的顺序播放;另外,还具有暂停播放和停止播放功能;3.语音交互功能:该功能的实现关键问题是系统播放完一个音频后,下一个音频什么时候播放;有两种解决方案:一种方案是播放一个音频后,等待一段时间,等待的时间是音频文件的播放时间乘以一个系数,该系数根据用户写字的速度快慢自行设定;另一种方案是系统暂停播放听写作业,录音机播放一个预先录制好“写好了”的音频文件咨询用户,当用户听写完,说“好了”、“下一个”或“写完了”等关键词时,再继续播放下一个音频文件;当用户说“再来一遍”、“重报”或“重复”等关键词时,系统就再重播一遍刚才的音频;第一种方案适合课堂上的作业听写,不会因为个人个别词的听写慢而等待;而第二种方案采用人机交互,适合个人的作业听写,更加人性化;4.文件管理:主要功能是向左滑动删除表视图中的音频文件,同样也真正意义上删除沙盒中的文件;也可以点击“全选”和“全部删除”按钮删除所有文件。本文档来自技高网...

【技术保护点】
1.基于IOS交互式语音播报系统,采用声音处理包和语音识别包核心技术,在IOS平台应用开发的互式语音录播系统。

【技术特征摘要】
1.基于IOS交互式语音播报系统,采用声音处理包和语音识别包核心技术,在IOS平台应用开发的互式语音录...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:长沙湘佩网络技术有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1