基于有限集语音识别的人机交互方法与装置制造方法及图纸

技术编号：3046497 阅读：218 留言：0更新日期：2012-04-11 18:40

一种基于有限集语音识别的人机交互方法，其特征在于，以预先设定的问句和有限集答句结合计算机语音识别技术来达到人机交互，包括以下步骤：　　　　１．１）计算机装置输出一个提问；　　　　１．２）计算机以声音或显示方式中的至少一种，提示２－２０个句子组成的与上述提问关联的有限集目标答句，使用者择其一，对计算机语音输入设备，念出这个回答的读音；　　　　１．３）计算机对输入的使用者语音，与１．２）中的有限集目标答句模板逐个进行失真测度，以比对确定此输入语音为上述有限集目标答句中的某一个；　　　　１．４）在确定这个识别结果之后，计算机程序按所预定上下逻辑关系，发出语意向下连贯的新问题，进入新一轮对话场景，即再重复步骤１．１），１．２）与１．３），而使对话不断向前延续，直至某一训练单元结束。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人机交互技术，具体涉及计算机语音识别技术和计算机辅助语言学习技术，即一种利用计算机语音识别技术模拟人机对话情景、技巧性利用现有语音识别技术水平，以使用者的真实语音与计算机互动的人机交互方法及装置。
技术介绍
语言知识的学习过程，从语言信息学的角度来看是以语言作为信息载体，进行采集、吸收、处理、储存的过程。在语言的学习中，对话情景，特别是对确定情景下特定问题的准确应答并反复训练的过程，是语言学习(包括母语学习在内)的基本机理，也是最直接有效的学习过程。自动语音识别(Automatic Speech Recognition)，简称ASR，即对一位发音者发出的语音进行判别确定的过程，是以计算机实现“声音”到“文字或指令”转换的技术。一个语音识别系统工作时，首先将话筒(MIC)输入的标准语音信号进行放大，带通滤波，A/D变换后，存入RAM区内，这形成该语音的模板。这个过程称为系统的”学习”或”训练”，多个这种存入RAM的模板组成模板库。一个未知的语音信号也经上述各电路，由CPU将此信号的数据存入RAM区内某一特定区，然后将此未知信号与区内各目标模板逐一比对，按某一种识别算法，进行计算测度，再经识别决策，将识别测度失真最小的1个模板输出做为识别结果，或同时按业务逻辑要求，执行某个动作。以计算机语音识别技术为基础，以人机对话方式建构模拟情景对话的学习模式是语言学习机器辅助方法的重要发展方向。这种方式包括对话情景设计、视听输出、人机交互过程、智能判断以及评价和改善建议，通过虚拟现实技术来营造一种接近于真实对话情景的环境与气氛，培养学习者以该语言进行实际...

【技术保护点】

【技术特征摘要】
1.一种基于有限集语音识别的人机交互方法，其特征在于，以预先设定的问句和有限集答句结合计算机语音识别技术来达到人机交互，包括以下步骤1.1)计算机装置输出一个提问；1.2)计算机以声音或显示方式中的至少一种，提示2-20个句子组成的与上述提问关联的有限集目标答句，使用者择其一，对计算机语音输入设备，念出这个回答的读音；1.3)计算机对输入的使用者语音，与1.2)中的有限集目标答句模板逐个进行失真测度，以比对确定此输入语音为上述有限集目标答句中的某一个；1.4)在确定这个识别结果之后，计算机程序按所预定上下逻辑关系，发出语意向下连贯的新问题，进入新一轮对话场景，即再重复步骤1.1)，1.2)与1.3)，而使对话不断向前延续，直至某一训练单元结束。2.根据权利要求1所述方法，其特征在于，所述提问与有限集目标答句的全体为预先编撰的脚本，是一个多路径可选树形结构，其中一个提问句与一组有限集目标答句对应，任一回答句与一个新提问句唯一对应，依此确定人机对话发展的逻辑关系。3.根据权利要求1或2所述方法，其特征在于，所述提问句是指装置自动发出的一个引导性语音，由发出预定的第一个语音作为对话过程的开始，在对话过程之中，由上一轮对话中装置语音识别出的回答句确定下一个新的问句。4.根据权利要求2所述方法，其特征还在于，预先编撰脚本中对一个问题的2-20个回答句时，使这些回答句互相之间的语音数字特征区别足够大以便于语音识别。5.根据权利要求1-4中任何一项所述方法，其特征还在于，在所述步骤1.3)中，根据得到的失真测度，提供对用户发音的评价。6.根据权利要求1所述方法，其特征在于，可设定其中的提问句与答句均为唯一确定对应，人...

【专利技术属性】
技术研发人员：王东篱，
申请(专利权)人：王东篱，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人