一种基于人工智能的自动调音终端设备制造技术

技术编号：28041870 阅读：27 留言：0更新日期：2021-04-09 23:25

本发明专利技术公开了一种基于人工智能的自动调音终端设备，本发明专利技术属于人工智能领域，涉及语音识别技术；用于解决但现有语音识别技术无法根据用户的个人语言习惯以及语速形成专属调节数据库，进而导致语音识别成功率降低，影响使用体验的问题；感知模块对使用场景中连入同一个无线网或/和局域网或/和专用网络内的物联网设备进行识别，可以针对性的对用户进行语音训练，同时，新特征采集识别模块内标准指令集可以进行一步缩小用户的语音训练难度，进而提高识别率；通过特征学习模块的设置，进而可以根据用户的语言特色建立对应的数据库，进而提高识别准确率；通过人工智能调节模块的设置进而提高提高识别准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于人工智能的自动调音终端设备
本专利技术属于人工智能领域，涉及语音识别技术，具体是一种基于人工智能的自动调音终端设备。
技术介绍
语音识别是一门交叉学科。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场。人们预计，未来10年内，语音识别技术将进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。语音识别听写机在一些领域的应用被美国新闻界评为1997年计算机发展十件大事之一。很多专家都认为语音识别技术是2000年至2010年间信息
十大重要的科技发展技术之一。语音识别技术所涉及的领域包括：信号处理、模式识别、概率论和信息论、发声机理和听觉机理、人工智能等等；与机器进行语音交流，让机器明白你说什么，这是人们长期以来梦寐以求的事情。中国物联网校企联盟形象得把语音识别比做为“机器的听觉系统”。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高技术。语音识别技术主要包括特征提取技术、模式匹配准则及模型训练技术三个方面。语音识别技术车联网也得到了充分的引用，例如在...

【技术保护点】
1.一种基于人工智能的自动调音终端设备，其特征在于，包括新特征采集识别模块、特征学习模块、特征生成模块、感知模块、采集模块以及人工智能调节模块；/n所述，人工智能调节模块用于对识别失败的音频信息进行智能修复，具体步骤如下：/n步骤一：获取无法识别的音频信息，进行MFCC转换，并与新特征数据库进行匹配，并将无法识别的音频信息对应的最终识别内容进行输出；/n步骤二：将MFCC转换后的无法识别的音频信息的音素频率图代入坐标内，调取最终识别内容对应的学习音素频率图，并将学习音素频率图代入坐标内；/n步骤三：比较两个音素频率图内的每个转折点，当出现转折点不同时，获取不同转折点对应的音素，此时将无法识别的...

【技术特征摘要】
1.一种基于人工智能的自动调音终端设备，其特征在于，包括新特征采集识别模块、特征学习模块、特征生成模块、感知模块、采集模块以及人工智能调节模块；
所述，人工智能调节模块用于对识别失败的音频信息进行智能修复，具体步骤如下：
步骤一：获取无法识别的音频信息，进行MFCC转换，并与新特征数据库进行匹配，并将无法识别的音频信息对应的最终识别内容进行输出；
步骤二：将MFCC转换后的无法识别的音频信息的音素频率图代入坐标内，调取最终识别内容对应的学习音素频率图，并将学习音素频率图代入坐标内；
步骤三：比较两个音素频率图内的每个转折点，当出现转折点不同时，获取不同转折点对应的音素，此时将无法识别的音频信息的音素频率图中对应的音素标记为异常音素，将学习音素频率图中对应的音素标记为修正音素，并将其存储；
步骤四：将修正音素与异常音素发送至采集模块。

2.根据权利要求1所述的一种基于人工智能的自动调音终端设备，其特征在于，采集模块用于采集用户的音频信息，并将音频信息进行储存；
其中，当采集模块接收到异常音素与对应的修正音素后，再次采集时，若出现异常音素时，采集模块将异常音素替换为修正音素，完成采集。

3.根据权利要求2所述的一种基于人工智能的自动调音终端设备，其特征在于，所述特征学习模块用于实时收集用户的语音信息，并将收集到的音频代入声学模型进行建模，并获取声学模型中每一帧所对应的音素，并通过MFCC转换，得到学习音素频率图；
其中，当学习音素频率图出现某段频率曲线与标准音素频率图相同的频率曲线时，将学习音素频率图中相同的频率曲线标记为关键音素，并将带有关键音素的这段音素进行提取。

4.根据权利要求3所述的一种基于人工智能的自动调音终端设备，其特征在于，所述特征学习模块内安装有若干语音识别软件，将提取后的这段音素发送至语音识别软件进行认证识别，并获取第一种语音识别软件的识别内容，并将识别内容标记为第一识别文本，获取第二种语音识别软件的识别内容，并将识别内容标记为第二识别文本；
对比第一识别文本与第二识别文本，如果相似度低于95％，则将提取后的这段音素...

【专利技术属性】
技术研发人员：李本江，李本松，
申请(专利权)人：江西台德智慧科技有限公司，
类型：发明
国别省市：江西;36

全部详细技术资料下载我是这个专利的主人