当前位置: 首页 > 专利查询>聂敏专利>正文

一种多语言文本中的语言识别系统技术方案

技术编号:35270875 阅读:16 留言:0更新日期:2022-10-19 10:42
本发明专利技术涉及语音识别技术领域,具体涉及一种多语言文本中的语言识别系统;包括多语音获取单元、多语音处理单元和识别应用单元;本发明专利技术将所接收的语音信息去除噪音,以便提升后续语音识别的准确性,将去除噪音的语音信息传输给多语音处理单元,对所接收的语音信息进行特征提取,通过三种特征提取,并将所提取的特征与所存储的已知特征进行匹配,进而获知其语言,能够有效实现多语音的识别效果,并提升识别的准确性,此外,还会将所识别的语音传输给识别应用单元,由识别应用单元进行试播放,并实时的对所试播放的内容进行检测,然后在正式的输出识别结果,进一步的保障所播放信息的准确性。确性。确性。

【技术实现步骤摘要】
一种多语言文本中的语言识别系统


[0001]本专利技术涉及语音识别
,具体涉及一种多语言文本中的语言识别系统。

技术介绍

[0002]语言识别是指系统在获得一段语音数据之后,可以根据自身的模型智能化的得到这段语音数据所对相应的语言种类。
[0003]语言是人们进行沟通最常用的方法之一,是一种不可或缺的技能。在历史长河中,各个地区形成了多种多样的文化,也相应产生了多种多样的语言。目前全球总计有两千多种语言,每种语言的使用人数相差很多,使用最广泛的是英语,汉语的使用者占总人口比例最大。其中有大约十四种语言是全球使用最多的语言,总体人数大约是全球总人数的百分之六十四。在全球化日益加剧的过程中,各种语言的碰撞越来越多,语言不通导致的交流障碍日益凸显,给全球化进程带来了极大困难。当务之急就是必须解决语言沟通上的困难,要解决这一困难的首要任务就是要对语言种类进行区分,语言识别系统应运而生。
[0004]专利申请号为CN202010043379.X的专利,其在说明书中记载有“对待识别多语种混说语音数据进行端点检测,得到多帧语音状态信息;将所有的语音状态信息输入至语种识别模型,输出所述待识别多语种混说语音数据中每一帧语音状态信息所属的语种;其中,所述语种识别模型是基于多语种混说语音样本以及预先确定的多语种混说语音样本中每一帧语音状态信息所属的语种进行训练后得到。本专利技术实施例提供的多语种混说语音的语种识别方法及装置,通过缩减人工预处理和后续处理,以原始语音波形作为输入,将特征提取和分类建立一体化结构模型,尽可能简化模型从原始输入到最终输出的步骤,增加模型的整体契合度,提高了语种识别的准确率”,但是上述方法,只缺少可靠的语音特征提取效果,识别的准确性不佳,并且整个识别过程复杂,影响了识别效率,无法满足使用需求。
[0005]综上所述,研发一种多语言文本中的语言识别系统,仍是语音识别
中亟需解决的关键问题。

技术实现思路

[0006]本专利技术为了解决上述问题,本专利技术提供了一种多语言文本中的语言识别系统,本专利技术将所接收的语音信息去除噪音,以便提升后续语音识别的准确性,多语音处理单元对所接收的语音信息进行特征提取,所提取的特征包括声学特征、韵律特征以及词法特征,并将所提取的特征与所存储的已知特征进行匹配,进而获知其语言,能够有效实现多语音的识别效果,并提升识别的准确性,再根据其语言从数据库内调取相应的识别模型,对语音进行识别,达到识别效果,此外,还会对识别结果进行试播放,并实时的对所试播放的内容进行检测,然后在正式的输出识别结果,进一步的保障所播放信息的准确性。
[0007]为实现上述目的,本专利技术提供了如下技术方案:
[0008]本专利技术提供了一种多语言文本中的语言识别系统,包括多语音获取单元、多语音处理单元和识别应用单元,其中:
[0009]所述多语音获取单元用于获取所接收的语音信息,并对所接收的语音信息进行噪音除杂处理;
[0010]所述多语音处理单元用于对所接收的语音进行特征提取,并根据所提取的特征进行语言种类的匹配,以及对语音进行识别,所述多语音处理单元与多语音获取单元连接;
[0011]所述识别应用单元用于多所识别的语音进行试播放,并对所播放的语音信息进行识别检测,以及播放所识别的正式语音信息,所述识别应用单元与多语音处理单元连接。
[0012]本专利技术进一步的设置为:所述多语音获取单元包括语音输入模块、噪音清除模块和第一通讯模块,其中:
[0013]所述语音输入模块用于接收所输入的语音信息;
[0014]所述噪音清除模块用于对所输入的语音信息进行噪音清除,所述噪音清除模块与语音输入模块连接;
[0015]所述第一通讯模块用于实现多语音获取单元与多语音处理单元的信息交互。
[0016]本专利技术进一步的设置为:所述多语音处理单元包括第二通讯模块、数据库模块和特征提取模块,其中:
[0017]所述第二通讯模块用于实现多语音处理单元与多语音获取单元和识别应用单元间的信息交互;
[0018]所述数据库模块用于存储所接收的语音信息,所述数据库模块与第二通讯模块连接;
[0019]所述特征提取模块用于从所接收的语音信息中提取声学特征、韵律特征以及词法特征,所述特征提取模块与数据库模块和第二通讯模块均连接。
[0020]本专利技术进一步的设置为:所述数据库模块还用于存储特征提取信息,以及对应特征的识别语音信息。
[0021]本专利技术进一步的设置为:所述多语音处理单元还包括特征匹配模块和识别调取模块,其中:
[0022]所述特征匹配模块根据所提取的特征和所存储的匹配特征信息进行匹配,匹配相应的语言种类,所述特征匹配模块与数据库模块和特征提取模块均连接;
[0023]所述识别调取模块根据所匹配的语言种类,从数据库模块内调取相应的语音识别模型,所述识别调取模块与数据库模块和特征匹配模块均连接。
[0024]本专利技术进一步的设置为:所述多语音处理单元还包括语音识别模块,所述语音识别模块根据所接收的语音识别模型和语音信息,对语音信息进行识别,所述语音识别模块与第二通讯模块和识别调取模块均连接。
[0025]本专利技术进一步的设置为:所述识别应用单元包括第三通讯模块、语音检测模块和语音试播模块,其中:
[0026]所述第三通讯模块用于实现识别应用单元与多语音处理单元间的信息交互;
[0027]所述语音检测模块用于对所试播的语音信息实时的检测,所述语音检测模块与第三通讯模块和语音试播模块均连接;
[0028]所述语音试播模块用于对所识别的语音进行试播,所述语音试播模块与第三通讯模块连接。
[0029]本专利技术进一步的设置为:所述识别应用单元还包括语音播放模块,所述语音播放
模块用于播放所识别的正式语音信息,所述语音播放模块与语音试播模块连接。
[0030]有益效果
[0031]采用本专利技术提供的技术方案,与已知的公有技术相比,具有如下有益效果:
[0032]本专利技术接收待识别的语音信息,将所接收的语音信息去除噪音,以便提升后续语音识别的准确性,将去除噪音的语音信息传输给多语音处理单元,对所接收的语音信息进行特征提取,所提取的特征包括声学特征、韵律特征以及词法特征,通过三种特征提取,并将所提取的特征与所存储的已知特征进行匹配,进而获知其语言,能够有效实现多语音的识别效果,并提升识别的准确性,再根据其语言从数据库内调取相应的识别模型,对语音进行识别,达到识别效果,此外,还会将所识别的语音传输给识别应用单元,由识别应用单元进行试播放,并实时的对所试播放的内容进行检测,然后在正式的输出识别结果,进一步的保障所播放信息的准确性。
附图说明
[0033]图1为本专利技术一种多语言文本中的语言识别系统的系统图;
[0034]图2为本专利技术一种多语言文本中的语言识别系统中多语音获取单元的系统图;
[0035]图3为本专利技术一种多语言文本中的语言识别系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多语言文本中的语言识别系统,其特征在于,包括多语音获取单元(100)、多语音处理单元(200)和识别应用单元(300),其中:所述多语音获取单元(100)用于获取所接收的语音信息,并对所接收的语音信息进行噪音除杂处理;所述多语音处理单元(200)用于对所接收的语音进行特征提取,并根据所提取的特征进行语言种类的匹配,以及对语音进行识别,所述多语音处理单元(200)与多语音获取单元(100)连接;所述识别应用单元(300)用于多所识别的语音进行试播放,并对所播放的语音信息进行识别检测,以及播放所识别的正式语音信息,所述识别应用单元(300)与多语音处理单元(200)连接。2.根据权利要求1所述的一种多语言文本中的语言识别系统,其特征在于,所述多语音获取单元(100)包括语音输入模块(110)、噪音清除模块(120)和第一通讯模块(130),其中:所述语音输入模块(110)用于接收所输入的语音信息;所述噪音清除模块(120)用于对所输入的语音信息进行噪音清除,所述噪音清除模块(120)与语音输入模块(110)连接;所述第一通讯模块(130)用于实现多语音获取单元(100)与多语音处理单元(200)的信息交互。3.根据权利要求1所述的一种多语言文本中的语言识别系统,其特征在于,所述多语音处理单元(200)包括第二通讯模块(210)、数据库模块(220)和特征提取模块(230),其中:所述第二通讯模块(210)用于实现多语音处理单元(200)与多语音获取单元(100)和识别应用单元(300)间的信息交互;所述数据库模块(220)用于存储所接收的语音信息,所述数据库模块(220)与第二通讯模块(210)连接;所述特征提取模块(230)用于从所接收的语音信息中提取声学特征、韵律特征以及词法特征,所述特征提取模块(230)与数据库模块(220)和第二通讯模块(210)均连接。4.根据权利要求3所述的一种多语言文本中的语言识别系统,其特征在于...

【专利技术属性】
技术研发人员:聂敏
申请(专利权)人:聂敏
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1