当前位置: 首页 > 专利查询>施国梁专利>正文

语言计算机制造技术

技术编号:2893652 阅读:219 留言:0更新日期:2012-04-11 18:40
这是一个关于用频谱分析法进行语音输入以及对文字信息进行处理的方案及其设备的发明专利技术。内容有:从语音辨识的角度建立一个知识环境和接收信息的环境;对所接收的信息进行分解、清洗、同步、简化、译码和比较以得到音节或拼音;从语气、语调和语法等方面将音节或拼音辨识为句子并注上标点。本发明专利技术可用于制造语音打字机、自动翻译电话、各种声控自动化设备以及各种工业和家用机器人。还可用来辨板其它各种以电波表示的物理量。(*该技术在2006年保护过期,可自由使用*)

【技术实现步骤摘要】
本专利技术是关于计算机,特别是人工智能计算机的专利技术。计算机的广泛应用大大增强了人类改造自然的能力,但是这些计算机仍需人通过键盘来输入信息。为了使成千上万的科学家、作家和学者从枯燥的键盘输入和抄写中解放出来,使人们能对计算机口授命令,专利技术出以语音为媒介来进行输入的装置-多维逼近法计算机语音输入装置。鉴于在辩析和处理语言方面这个装置具有许多优异之处,作者将所有含有这类语音输入装置的计算机称作语言计算机。需要指出,语音辩析至今未获突破,很重要的原因是有关的理论研究不够。为了弥补这一缺陷。作者不得不在说明书中花很大气力来深入讨论必要的理论问题以期有关的技术方案和解决问题的思路能更容易理解。发达的语言在语言计算机中可具有三种确定的状态,它们是语音、文字和计算机记录这些文字或语音的内部码(本文以下常简称为内码)。其中语音和文字是以前就有的,语音是语言最原始的状态,它的产生和被接收同时实现,它表示信息的形式具有瞬时性、空间性、渗透性和强制性。它所含信息一般要比文字多,如表示出喜怒哀乐、抑扬顿挫,强调不同的重点以及带有说话者的发音特征等。语音容易受到噪声影响,并且常常以不规范的形式被使用。此外语音的使用常伴随对现场环境的理解和对信息的反馈。文字是语言中最高级的状态,它表示信息的方式具有永久性和可传递性。常要求对文字的使用有较强的规范性,如加上各种标点符号,要求一定的书面格式等以保证对文字理解的一致性。语音和文字是语言的两种不同表现形式,构成发达的自然语言的两要素。体现语言的信息性、社会性和可处理性;内码是人们为处理自然语言而设计的一种低级无声语言,具有文字的某些属性。它仅向物理器件体现出信息性和可处理性,而不能体现出语言的社会性。由于社会性是语言的根本属性,所以首先要求语音、文字和内码这三种状态能够相互转换。图1以框图形式给出语言计算机中三种语言状态转换的示意图,它粗略地体现了语言计算机的功能。图中箭头(1)表示信号的流向,各方框中的内容表示信号所取的状态或表示信号流过时将受到的各种处理形式。通过语音辩析语言计算机能听懂声音,并将声音变成内码,通过图像辩析语言计算机可将书面文字,各种图像变成内码。各种信息以内码的形式在计算机内被处理和存储。内码可经语音合成变成声音由扬声器播出或另外以文字图像形式在显示屏上被显示。内码也可在计算机之间进行交换。语言计算机中的内码的具体形式将在语言计算机设计过程中逐步明朗。为了更好地理解语音辩析的原理和工作过程,考察学生听写朗读这样一个例子。可以看到,为了完成这一作业学生必须具备以下三个条件一、语音辩识的能力。二、按照辩析出的声音写出正确并符合格式的文字的能力。三、有不清楚的地方可以问。对应这三个条件语音辩析装置有三个功能部件,分别叫做一、音节辩识器。用于从声音中辩析出各个音节和相应的句调。二、句子辩析器。用于从音节和附加信息中找到对应的文字并组成句子。三、视听反馈器。用于与人交流信息。这三个部件不仅可以将简单的声音转化为内码,而且可用来辩析出完整的句子,所以这些条件也是充分的。作者将具备这三个条件的装置叫做多维逼近法计算机语音输入装置,它是语言计算机中最重要的部分之一。所谓多维逼近法是根据线性代数中空间、空间的点、空间的维以及空间转换的概念,将语音辩析问题归结为将语音空间的某些点按一定法则转换到文字空间的对应的点的问题。其确切定义为在语音辩析过程中,我们所朗读的每个音节都是稠密的语音空间的一个点,这个音节所对应的词或词素都是文字空间的一个点。在 语音空间的点向文字空间的点转换的过程中,凡是能为找到某确定的文字空间的点而独立地提供新的有效信息从而缩小寻找范围向该确定的点逼近的每个方法都形成空间的一个维。空间中每个点的坐标都由这些维唯一确定。这种通过确定每个维的座标而找到空间某确定的点的方法称为多维逼近法。而信息在语言计算机中所取形式的变化可看作空间的变换。辟如将某本汉语书看作一个空间,书中的字就是空间的点。而书的版序、每版的页的序数、每页的行的序数、每行的字的序数,可分别看作时间维、高度维、前后维和左右维。如规定维的方向和基准点,则对于寻找每一个字,每个维都提供有效的信息并且书中每个字的坐标可由这四个维唯一确定。这样,在寻找某确定的字的过程中,每知道一个维的座标就是向这个字逼近了一步。同一空间,维的划分可以不同。下面通过阐述这语音辩析装置是如何完成听写作业的来说明语音辩析中的多维逼近法和这个方法的具体实现。约定机器可辩识商务印书馆1971年修订重排本《新华字典》收入的八千五百个字。(本文其它一些语言学资料也来源此书)。声音是用现代规范汉语的声音发出的且带有感情,机器理解这些声音并不需要附加环境和历史的知识。朗读的内容是我的平凡岁月里有了一个你,显得充满活力!为了打印这句话所对应的文字,可以把汉语拼音(在我国台湾省,也正推广着一种汉语注音方案,但手头无可供研究的资料)的音节作为汉语语音辩识中的第一维,叫做音节维。它将声音转换到具体的汉语拼音和句调信息。句调是指一句口语中各个音节的具体形式和各音节之间的关系。对汉语来讲,句调包括重音、阴阳上去、儿化音、音节间隔、停顿、节奏和句子的语气、语调。音节维可以用将现场信号与内存标准信号比较的方法来实现。但对于辩析的内容多并且所辩析的声音有畸变、噪声大的情况。就需要寻找更有效的方法。有一种方法是先对接收的声音信号,进行模/数转换,然后再从这些数字化的信号中寻找对应的文字。但这种方法需要高精度、高速、大容量的模/数转换器、存储器和处理器。并且由于这方法本身固有的弱点,使其对信息量丰富的波形和相位的微小变化不敏感,对信号的校正和抗干扰的能力弱,从而使辩析质量难以进一步提高。为克服上述缺点,本专利技术设计出先用频谱分解法来获取一定数量的频谱分量的幅值和相位,然后从中选取部分或全部并根据信息估计器提供的信息对所选频谱分量进行校正后再通过译码比较等方法来求得对应的音节和句调这种从声音到拼音或音节的辩析方案。图2是这种辩析方案的流程图。拾音得到的声波取电压形式(一般要通过电平保持等环节)经频谱分解和幅相鉴别转化成多个频谱分量的幅值和相对相位形式。这些幅相值经相量加法器校正后除去了由信息估计器模拟出的有规律的其它信号和畸变。它们被划分成各个独立的音节单元和确定语种或声音的类别后再由函数插值器进行同步和简化(为使辩析效率高,对简化后的内容可先进行一定的检查,以剔除部分无用信号)。同步后的幅相信号尝试进行译码,若译码成功即得到一个拼音或音节则对其进一步进行精细比较后将得到的各种句调信息与音节一起送到存储器或送到下一个语音辩析环节。这里要指出,对于在朗读中被略去的音素要“无”中生“有”补上,对于在朗读中由于联诵而含混的地方要加以澄清。如果因为噪声或声音失真太大译码不成功则由译码判断器根据附加信息寻找原因并从存储器中取出原始的幅相信号重新进行校正,同步和简化。这种再次校正由于可能由多种原因造成而要重复进行,为提高速度,可采用并行电路(当然第一次译码也可用这种并行电路)。图中仅用简略号(2)来表示并行器件中与虚线框(3)相同的部分。如重新校正后还不能译出有关拼音或音节则暂付阙如等以后的辩析中再加以解决。先详细给出实现图2中部分框所述功能的技术方案及处理原则。由于本文档来自技高网...

【技术保护点】
一种用频谱分析法的声音辩析方案。其特征是:A.方案利用滤波器阵列来对声波进行频谱分解。B.方案利用信息估计器来模拟辩析对象中各类有规律的其它信号。C.方案利用低频定位法来确定同步时刻(插值时刻)以指导函数插值运算器阵列来对信号进 行清洗和同步。使用上述辩析方案的能识别可用电波形式来表达的物理量、特别是识别声音,并能将所识别的内容加以记录、处理和输出的装置,这装置也就是通常讲的人工智能计算机,内部含有各种处理器、存储器、输出输入设备,其特征是:a)装置内含有频 谱分量采样器和幅相值求取器。b)装置内含有译码比较器。

【技术特征摘要】
1.一种用频谱分析法的声音辩析方案。其特征是A.方案利用滤波器阵列来对声波进行频谱分解。B.方案利用信息估计器来模拟辩析对象中各类有规律的其它信号。C.方案利用低频定位法来确定同步时刻(插值时刻)以指导函数插值运算器阵列来对信号进行清洗和同步。使用上述辩析方案的能识别可用电波形式来表达的物理量、特别是识别声音,并能将所识别的内容加以记录、处理和输出的装置,这装置也就是通常讲的人工智能计算机,内部含有各种处理器、存储器、输出输入设备,其特征是a)装置内含有频谱分量采样器和幅相值求取器。b)装置内含有译码比较器。2.如权利要求1所述的装置。其特征是装置内含有用压电材料制成的滤波器阵列,用于对一般波形进行频谱分解。3.如权利要求1和权利要求2所述的装置。其特征是装置内含有信息估计器。用于模拟辩析对象中各类有规律的其它信号。4.如权利要求1、权利要求2、权利要求3所述的装置。其特征是装置内含有函数插值运算器、尤其是应用低频定位法来确定插值时刻的函数插值运算器,用以对采样信号进行清洗和同步。5.如权利要求1、权利要求2、权利要求3和权利要求4所...

【专利技术属性】
技术研发人员:施国梁
申请(专利权)人:施国梁
类型:发明
国别省市:31[中国|上海]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1