【技术实现步骤摘要】
本专利技术涉及自然语言理解,它通过构造的语义库和语法库,实现中文理解的量化。它能 精确的给出句中词的正确度(数值表示的正确与否的程度)。
技术介绍
人类在进行语言交流时,表达者是逐渐地表述完所有的内容,而接受者也是逐渐地理解 表达者的意思,当表达者表述到一部分时,接受者也理解了一些内容,无需表达者全部表达 完毕后开始理解。目前,国内外自然语言理解技术都是基于全文或完整的句子,静态地完成理解过程。本 项目是基于上文理解,动态的完成理解过程。
技术实现思路
本专利技术将中文词、短语分类,定义类的属性、类的接续关系和接续句法,通过接续判别 算法模拟人类理解过程。其根据句法按顺序每得到句中一个词时,计算出下一个词会是哪些和出现的概率,在所有中文词中,80%的词出现的概率为0, 15%的词出现的概率很小。本专利技术是一个中文理解的构件,可复用,构件的入口是一个句子(可以没有句子的后半 部分)和指定的句中的一个词C,构件的出口是一个值,该值给出词C的正确度。本专利技术适用 于中文理解领域不同的应用,例如(1) 入口参数是一段中文文章,调用该构件,得出的结果是一组位置信息和错误标 ...
【技术保护点】
一种中文语言理解的构件,其特征在于基于上文的动态理解机制,它可复用,构件的入口参数是一个句子(可以没有句子的后半部分)和指定的句中的一个词C,构件的出口参数是一个值,该值给出词C的正确度。
【技术特征摘要】
1. 一种中文语言理解的构件,其特征在于基于上文的动态理解机制,它可复用,构件的入口参数是一个句子(可以没有句子的后半部分)和指定的句中的一个词c,构件的出口参数 是一个值,该值给出词c的正确度。2. 根据权利要求1基于上文的动态理解机制,其特征在于包括知识库、判别方法和学习机制。3. 根据权利要求2知识库,其特征在于包括语义库和语法库。4. 根据权利要求3语义库,其特征在于包括词类的划分所有的词被划分成4096类,有同义词类、符号类、短语类、名称类和常用 词类;词类的属性对每个词类赋予的属性,有语法属性、语义属性、空间属性、时间属性、范 畴属性、所属属性、特征属性、描述属性。词的属性对词类中每个词类赋予的属...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。