当前位置: 首页 > 专利查询>杨卫卫专利>正文

基于区块链的大数据语音识别系统及方法技术方案

技术编号:37414987 阅读:13 留言:0更新日期:2023-04-30 09:39
本发明专利技术具体涉及一种基于区块链的大数据语音识别系统及方法,其方法包括步骤:将接收的语音信号转化为电信号,进而转化为数字信号,将数字信号转化生成整句的文字符,将整句的文字符划分成短句,并从短句中提取关键特征词,并且根据音色、音调、音高、音频、抑扬顿挫将接收的语音信号进行分类归纳形成声音特征参数;将关键特征词和声音特征参数与数据库匹配,根据数据库的匹配结果形成规范语句。根据数据库的匹配结果形成规范语句。

【技术实现步骤摘要】
基于区块链的大数据语音识别系统及方法


[0001]本专利技术具体涉及一种基于区块链的大数据语音识别系统及方法。

技术介绍

[0002]语音识别技术涉及的范围之广泛及于工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别技术所涉及的领域包括:信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等。语音识别技术就是与机器进行语音交流,让机器明白你说什么,语音识别可以认为是“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。现有的语音识别系统基本都是只能识别普通话,但现实生活中,输入的语音信息常常带有方言或外语,对于这样的情况,计算机就很难识别,经常会出现识别出错的情况。

技术实现思路

[0003]本专利技术的目的在于提供一种基于区块链的大数据语音识别系统及方法,以解决上述
技术介绍
中提出的问题。
[0004]为了解决上述技术问题,本专利技术提供如下技术方案:
[0005]基于区块链的大数据语音识别系统,包括语音信号收集单元、信号转化单元、信号参数化单元、语句生成单元、特征提取单元、语类分析匹配单元、数据库、语义还原单元;所述语音信号收集单元分别与信号转化单元、信号参数化单元电信号连接,所述语音信号收集单元用于接收语音信号,所述信号转化单元用于将接收的语音信号转化为电信号,进而转化为数字信号,所述信号参数化单元用于将接收的语音信号参数化,所述参数化是指将收集到的语音信号根据音色、音调、音高、音频、抑扬顿挫进行分类归纳形成声音特征参数;所述语句生成单元与信号转化单元电信号连接,所述语句生成单元用于读取数字信号,并将数字信号转化生成整句的文字符,所述特征提取单元与语句生成单元电信号连接,所述特征提取单元用于将整句的文字符划分成短句,并从短句中提取关键特征词,所述语类分析匹配单元分别与特征提取单元和信号参数化单元电信号连接,所述语类分析匹配单元用于根据关键特征词和声音特征参数与数据库匹配,所述数据库包括第一数据库和第二数据库,所述第二数据库包含n类数据模块,所述语义还原单元与语类分析匹配单元电信号连接,所述语义还原单元用于根据语类分析匹配单元的匹配结果形成规范语句。
[0006]进一步,所述语类分析匹配单元根据关键特征词和声音特征参数与数据库匹配方法为:所述第一数据库设置有对应特征对比模型,所述第二数据库的每一类数据模块也均设有对应的特征对比模型;语类分析匹配单元首先将声音特征参数输入第一数据库的特征对比模型进行比对,输出比对结果评分,如比对结果评分满足设定的第一阈值,则将关键特征词与第一数据库匹配;如果不满足设定的第一阈值,则初步判别为归属第二数据库,同时将声音特征参数输入第二数据库的每一类数据模块的特征对比模型进行比对,选择比对结果评分最高的数据模块,并向用户发出是否属于该数据模块确认,如确认后结果为属于该
数据模块,则将关键特征词与该数据模块匹配,如果确认后结果为不属于该数据模块,则匹配重新输入的指令。
[0007]进一步,关键特征词与第一数据库匹配的方法为:通过融合算法将关键特征词融合形成一级规范指令,然后从第一数据库中匹配相应的二级规范指令。
[0008]进一步,关键特征词与数据模块匹配的方法为:通过融合算法将关键特征词融合形成符合对应的数据模块的三级规范指令,然后从对应的数据模块中匹配相应的四级规范指令。
[0009]进一步,所述第一数据库为普通话数据库,所述第二数据库为方言数据库,n类数据模块为不同地方的方言,一个地方的方言归属为一类数据模块。
[0010]进一步,所述文字符包括汉字、数字、字母。
[0011]基于区块链的大数据语音识别方法,包括以下步骤:将接收的语音信号转化为电信号,进而转化为数字信号,将数字信号转化生成整句的文字符,将整句的文字符划分成短句,并从短句中提取关键特征词,并且根据音色、音调、音高、音频、抑扬顿挫将接收的语音信号进行分类归纳形成声音特征参数;将关键特征词和声音特征参数与数据库匹配,根据数据库的匹配结果形成规范语句。
[0012]与现有技术相比,本专利技术的有益效果:
[0013]本申请通过将接收的语音信号转化为电信号,进而转化为数字信号,将数字信号转化生成整句的文字符,将整句的文字符划分成短句,并从短句中提取关键特征词,并且根据音色、音调、音高、音频、抑扬顿挫将接收的语音信号进行分类归纳形成声音特征参数;将关键特征词和声音特征参数与数据库匹配,根据数据库的匹配结果形成规范语句,数据库包括普通话数据库和方言数据库,方言数据库中有不同地方的方言的数据模块,对于输入的语音信号不论是普通话还是方言都能够准确精准识别,各种语音信息都能准确找到输出指令。
附图说明
[0014]图1为为本申请系统组成框图。
具体实施方式
[0015]下面将结合本专利技术实施例,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0016]本申请公开了基于区块链的大数据语音识别系统,如图1所示,包括语音信号收集单元、信号转化单元、信号参数化单元、语句生成单元、特征提取单元、语类分析匹配单元、数据库、语义还原单元;所述语音信号收集单元分别与信号转化单元、信号参数化单元电信号连接,所述语音信号收集单元用于接收语音信号,所述信号转化单元用于将接收的语音信号转化为电信号,进而转化为数字信号,所述信号参数化单元用于将接收的语音信号参数化,所述参数化是指将收集到的语音信号根据音色、音调、音高、音频、抑扬顿挫进行分类归纳形成声音特征参数;所述语句生成单元与信号转化单元电信号连接,所述语句生成单
元用于读取数字信号,并将数字信号转化生成整句的文字符,所述特征提取单元与语句生成单元电信号连接,所述特征提取单元用于将整句的文字符划分成短句,并从短句中提取关键特征词,所述语类分析匹配单元分别与特征提取单元和信号参数化单元电信号连接,所述语类分析匹配单元用于根据关键特征词和声音特征参数与数据库匹配,所述数据库包括第一数据库和第二数据库,所述第二数据库包含n类数据模块,所述语义还原单元与语类分析匹配单元电信号连接,所述语义还原单元用于根据语类分析匹配单元的匹配结果形成规范语句。本申请通过将接收的语音信号转化为电信号,进而转化为数字信号,将数字信号转化生成整句的文字符,将整句的文字符划分成短句,并从短句中提取关键特征词,并且根据音色、音调、音高、音频、抑扬顿挫将接收的语音信号进行分类归纳形成声音特征参数;将关键特征词和声音特征参数与数据库匹配,根据数据库的匹配结果形成规范语句,数据库包括普通话数据库和方言数据库,方言数据库中有不同地方的方言的数据模块,对于输入的语音信号不论是普通话还是方言都能够准确精准识别,各种语音信息都能准确找到输出指令。
[0017]优选的,所述语类分析匹本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于区块链的大数据语音识别系统,其特征在于,包括语音信号收集单元、信号转化单元、信号参数化单元、语句生成单元、特征提取单元、语类分析匹配单元、数据库、语义还原单元;所述语音信号收集单元分别与信号转化单元、信号参数化单元电信号连接,所述语音信号收集单元用于接收语音信号,所述信号转化单元用于将接收的语音信号转化为电信号,进而转化为数字信号,所述信号参数化单元用于将接收的语音信号参数化,所述参数化是指将收集到的语音信号根据音色、音调、音高、音频、抑扬顿挫进行分类归纳形成声音特征参数;所述语句生成单元与信号转化单元电信号连接,所述语句生成单元用于读取数字信号,并将数字信号转化生成整句的文字符,所述特征提取单元与语句生成单元电信号连接,所述特征提取单元用于将整句的文字符划分成短句,并从短句中提取关键特征词,所述语类分析匹配单元分别与特征提取单元和信号参数化单元电信号连接,所述语类分析匹配单元用于根据关键特征词和声音特征参数与数据库匹配,所述数据库包括第一数据库和第二数据库,所述第二数据库包含n类数据模块,所述语义还原单元与语类分析匹配单元电信号连接,所述语义还原单元用于根据语类分析匹配单元的匹配结果形成规范语句。2.根据权利要求1所述的基于区块链的大数据语音识别系统,其特征在于,所述语类分析匹配单元根据关键特征词和声音特征参数与数据库匹配方法为:所述第一数据库设置有对应特征对比模型,所述第二数据库的每一类数据模块也均设有对应的特征对比模型;语类分析匹配单元首先将声音特征参数输入第一数据库的特征对比模型进行比对,输出比对结果评分,如比对结果评分满足设定的第一阈值,则将关键特征词...

【专利技术属性】
技术研发人员:杨卫卫
申请(专利权)人:杨卫卫
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1