【技术实现步骤摘要】
本专利技术属于语音信号处理
,涉及一种智能交通信息服务应用系统,尤其涉及一 种语音识别装置,此外,本专利技术还涉及一种上述语音识别装置的模型训练方法,同时还涉及 使用上述语音识别装置的交通智能信息服务平台。
技术介绍
智能交通信息服务应用领域中,手机、PDA等信息服务手持终端由于环境、使用者自身素 质等条件限制,使得人机信息交互及为不便,于是通过语音识别完成客户端向服务器端信息 输入成为了交通信息服务应用的重要功能之一。语音识别当前的应用焦点集中在大词汇量非特定人连续语音识别上。 一般来说,较为可 靠的音识别系统都只能应用在小词汇量(< 1000)范围内, 一但词汇条目数量增加,语音识 别的正确率和正确速度都将有明显下降。随着语音技术的发展和成熟,语音识别的词汇量, 正确率已有了明显提高。以语音合成、语音识别、语音编解码为代表的智能语音技术正逐渐 开始向其他应用领域渗透,特别的,在交通信息服务应用领域中,用户通过语音完成人机信 息交流方式,大大简化了原本复杂的操作过程,使得交通信息服务更具人性化魅力和个性化 特色。该技术已引起国内外计算机、消费电子业界的广泛关注,尤其在美国、欧洲、日本等 工业发达国家,都在不断加大研究和产业化的力度。
技术实现思路
本专利技术所要解决的技术问题是提供一种可以方便用户与城市交通智能信息服务平台信 息交互的语音识别装置。另外,本专利技术还提供了使用上述语音识别装置的交通智能信息服务平台。 另外,本专利技术还提供了上述语音识别装置的模型训练方法。为解决上述技术问题,本专利技术采用如下技术方案一种语音识别装置,包括数据采 ...
【技术保护点】
一种语音识别装置,包括数据采集管理模块、语音识别模块,其特征在于:所述语音识别装置还包括模型训练模块,所述数据采集管理模块、模型训练模块分别与所述语音识别模块连接; 所述模型训练模块用于产生可供识别器识别的HMM模型; 所述数据采集管理模块包括数据存储命名规则单元、数据拆分单元;数据存储命名规则单元用于制定特定的数据存储命名格式规范;数据拆分单元用于将语音数据实体根据命名格式规范以具体每一条路名为单位拆分成对应的小的语音单位; 语音识别模块包括数据预处理单元、识别单元、汉字与拼音字母转换单元;数据预处理单元用于为待识别人实时语音录制,同时实现语音编码转换;识别单元通过HMM模型,得到识别概率,并列举出概率较大的若干项条目作为识别结果;汉字与拼音字母转换单元用于将识别出的一系列字母按照拼音和声调规则映射到对应汉字,并向用户呈现最终结果。
【技术特征摘要】
1. 一种语音识别装置,包括数据采集管理模块、语音识别模块,其特征在于所述语音识别装置还包括模型训练模块,所述数据采集管理模块、模型训练模块分别与所述语音识别模块连接;所述模型训练模块用于产生可供识别器识别的HMM模型;所述数据采集管理模块包括数据存储命名规则单元、数据拆分单元;数据存储命名规则单元用于制定特定的数据存储命名格式规范;数据拆分单元用于将语音数据实体根据命名格式规范以具体每一条路名为单位拆分成对应的小的语音单位;语音识别模块包括数据预处理单元、识别单元、汉字与拼音字母转换单元;数据预处理单元用于为待识别人实时语音录制,同时实现语音编码转换;识别单元通过HMM模型,得到识别概率,并列举出概率较大的若干项条目作为识别结果;汉字与拼音字母转换单元用于将识别出的一系列字母按照拼音和声调规则映射到对应汉字,并向用户呈现最终结果。2、 根据权利要求1所述的语音识别装置,其特征在于所述模型训练模块包括 训练配置信息单元,用于为训练准备必要的初始化数据;语音编码转换单元,用于将音频的时域波形转换为用于描述语音频域特征参数; 训练过程控制单元,用于控制实施训练具体步骤流程; 训练强度控制单元,用于控制训练过程中重复叠代训练次数。3、 根据权利要求1所述的语音识别装置,其特征在于所述语音识别模块还包括语音回 放单元,用于实时采集的语音数据并向客户回放。4、 根据权利要求1所述的语音识别装置,其特征在于所述语音识别模块还包括有限状 态自动机,语音识别装置在识别过程中,按照所述有限状态自动机设定的路线判别;识别单 元通过MM模型和自动机模型,得到识别概率,并列举出概率较大的若干项条目作为识别结 果。5、 根据权利要求4所述的语音识别装置,其特征在于所述识别单元根据HMM模型得出 对应由音素组合而成的字概率并按照自动机模型设计的识别路线得到最终识别概率输出,并 列举出概率较大的前五项条目作为识别结果。6、 根据权利要求1所述的语音识别装置,其特征在于所述数据采集管理模块还包括 录制单元,用于在录音人员朗读词条时记录对应语音数据;数据存储整理单元,用于记录语音数据存放信息,并根据设定的规则,将所述数据拆分 单元拆分完毕的小语音单元保存在数据库对应位置中:。7、 根据权利要求6所述的语音识别装置,其特征在于所述数据存储整理单元记录的语音数据存放信息至少包括录音人姓名、性别、录制时间、数据存储路径、完成路名条目、录 音人发音是否标准等信息。8、 根据权利要求1所述的语音识别装置,其特征在于所述语音识别装置用于智能交通 信息服务平台中,所述录制单元用于保存待录音者录制的城市交通路名语音信息,以WAV音 频格式作为训练样本,录制过程中录制单元提...
【专利技术属性】
技术研发人员:蒋昌俊,曾国荪,陈闳中,苗夺谦,闫春钢,方钰,吴俊伟,白星振,
申请(专利权)人:同济大学,
类型:发明
国别省市:31[中国|上海]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。