当前位置: 首页 > 专利查询>聂敏专利>正文

一种多语言文本中的语言识别系统技术方案

技术编号：35270875 阅读：16 留言：0更新日期：2022-10-19 10:42

本发明专利技术涉及语音识别技术领域，具体涉及一种多语言文本中的语言识别系统；包括多语音获取单元、多语音处理单元和识别应用单元；本发明专利技术将所接收的语音信息去除噪音，以便提升后续语音识别的准确性，将去除噪音的语音信息传输给多语音处理单元，对所接收的语音信息进行特征提取，通过三种特征提取，并将所提取的特征与所存储的已知特征进行匹配，进而获知其语言，能够有效实现多语音的识别效果，并提升识别的准确性，此外，还会将所识别的语音传输给识别应用单元，由识别应用单元进行试播放，并实时的对所试播放的内容进行检测，然后在正式的输出识别结果，进一步的保障所播放信息的准确性。确性。确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种多语言文本中的语言识别系统

[0001]本专利技术涉及语音识别
，具体涉及一种多语言文本中的语言识别系统。

技术介绍

[0002]语言识别是指系统在获得一段语音数据之后，可以根据自身的模型智能化的得到这段语音数据所对相应的语言种类。
[0003]语言是人们进行沟通最常用的方法之一，是一种不可或缺的技能。在历史长河中，各个地区形成了多种多样的文化，也相应产生了多种多样的语言。目前全球总计有两千多种语言，每种语言的使用人数相差很多，使用最广泛的是英语，汉语的使用者占总人口比例最大。其中有大约十四种语言是全球使用最多的语言，总体人数大约是全球总人数的百分之六十四。在全球化日益加剧的过程中，各种语言的碰撞越来越多，语言不通导致的交流障碍日益凸显，给全球化进程带来了极大困难。当务之急就是必须解决语言沟通上的困难，要解决这一困难的首要任务就是要对语言种类进行区分，语言识别系统应运而生。
[0004]专利申请号为CN202010043379.X的专利，其在说明书中记载有“对待识别多语种混说语音数据进行端点检测，得到多帧语音状态信息；将所有的语音状态信息输入至语种识别模型，输出所述待识别多语种混说语音数据中每一帧语音状态信息所属的语种；其中，所述语种识别模型是基于多语种混说语音样本以及预先确定的多语种混说语音样本中每一帧语音状态信息所属的语种进行训练后得到。本专利技术实施例提供的多语种混说语音的语种识别方法及装置，通过缩减人工预处理和后续处理，以原始语音波形作为输入，将特征提取和分类建立一体化结构模型，尽可...

【技术保护点】

【技术特征摘要】
1.一种多语言文本中的语言识别系统，其特征在于，包括多语音获取单元(100)、多语音处理单元(200)和识别应用单元(300)，其中：所述多语音获取单元(100)用于获取所接收的语音信息，并对所接收的语音信息进行噪音除杂处理；所述多语音处理单元(200)用于对所接收的语音进行特征提取，并根据所提取的特征进行语言种类的匹配，以及对语音进行识别，所述多语音处理单元(200)与多语音获取单元(100)连接；所述识别应用单元(300)用于多所识别的语音进行试播放，并对所播放的语音信息进行识别检测，以及播放所识别的正式语音信息，所述识别应用单元(300)与多语音处理单元(200)连接。2.根据权利要求1所述的一种多语言文本中的语言识别系统，其特征在于，所述多语音获取单元(100)包括语音输入模块(110)、噪音清除模块(120)和第一通讯模块(130)，其中：所述语音输入模块(110)用于接收所输入的语音信息；所述噪音清除模块(120)用于对所输入的语音信息进行噪音清除，所述噪音清除模块(120)与语音输入模块(110)连接；所述第一通讯模块(130)用于实现多语音获取单元(100)与多语音处理单元(200)的信息交互。3.根据权利要求1所述的一种多语言文本中的语言识别系统，其特征在于，所述多语音处理单元(200)包括第二通讯模块(210)、数据库模块(220)和特征提取模块(230)，其中：所述第二通讯模块(210)用于实现多语音处理单元(200)与多语音获取单元(100)和识别应用单元(300)间的信息交互；所述数据库模块(220)用于存储所接收的语音信息，所述数据库模块(220)与第二通讯模块(210)连接；所述特征提取模块(230)用于从所接收的语音信息中提取声学特征、韵律特征以及词法特征，所述特征提取模块(230)与数据库模块(220)和第二通讯模块(210)均连接。4.根据权利要求3所述的一种多语言文本中的语言识别系统，其特征在于...

【专利技术属性】
技术研发人员：聂敏，
申请(专利权)人：聂敏，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人