可让计算机理解的自然语言句子的自动语义识别的方法技术

技术编号：7786413 阅读：628 留言：0更新日期：2012-09-21 07:29

可让计算机理解的自然语言句子的自动语义识别的方法，涉及到一种可以准确的识别汉语语言的方法。具体它包括以下步聚：a在某个领域建立本体库；b基于领域本体建立语义框架知识库;c基于语义框架的本体映射，实现自然语言句子到语义结构的直观匹配；根据框架模式进行匹配性识别。本发明专利技术与二代搜索引擎技术中主流切词方法有很大的区别，切出的词语有领域本体的概念标注，从而获得自然语言句子的精确语义匹配，计算机系统就能够进行本体知识的计算和推理，从而为深度人工智能问答提供了广泛的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种计算机识别人类语言的方法，特别涉及到一种可以准确的识别汉语语目的方法。
技术介绍
搜索引擎的工作原理就是基于关键字匹配，将用户的输入进行切词，把一句话变成短小的词语，然后进入后台数据库进行网页内容的关键字匹配。其捜索返回的结果中，只要带有这些关键字的都会返回，包含大量的无关信息，查准率低下，不能切中用户的真正意图。显然，基于关键字匹配的切词和搜索技术，限制了计算机在检索中的自动分析能力。对ー个句子进行关键词匹配切割，虽然很容易处理由关键字拼凑成的一句话，但是却很难理解自然语言形式的一句话。因为词库里存放的，是词语的大杂汇，标注出的结果词语，缺乏语义信息，缺乏知识的理解和推理能力。因此，对ー个自然语言句子的切分和标注，是搜索、推荐、人工智能等高科技领域迫切需要突破的基础技术。当前，这个领域的主要进展是，对于自然语言句子的标注方法，采用词典语料样本库进行句法分析，通过建立机器学习模型来实现自动的语义角色标注。但这类方法仍然存在很大的局限和缺点 1、句法分析以词库为基础，需要积累大規模的语料库才能实现初歩的语义标注，建设成本巨大； 2、词库不分领域，每个词只有语法上的意义，比如名词、动词、状语、主语、宾语等，却缺乏清晰的语义意义。3、由于语料库是ー个词语的大杂汇，所以在运用的时候，为了要适应不同的领域特性，需要繁琐的学习算法，重用度低，系统性能难以达到商业生产环境的实用要求，从而无法走出实验室；总之，这种基于语义角色的标注，粒度过粗，对于句子意义的理解无法适应深度人工智能问答的要求。
技术实现思路
本专利技术的专利技术目的是提供一种计算...

【技术保护点】

【技术特征摘要】
1.一种可让计算机理解的自然语言句子的自动语义识别的方法，它包括以下步聚 a在某个领域建立本体库；将某个领域内所有的精确描述的无歧义的词语归放到一起构成本体库； b基于领域本体建立语义框架知识库；对自然语言句子的理解，建立“语义框架=谓词+核心框架元素+非核心框架元素”的语义框架体系；形成有某种特定含义的框架知识库； c基于语义框架的本体映射，实现自然语言句子到语义结构的直观匹配；根据框架模式进行匹配性识别。2.根据权利要求I所述的可让计算机理解的自然语言句子的自动语义识别的方法，其特征在于所述的框架元素是由本体库内的无歧义的词语本体或本体组合构成。3.根据权利要求I所述的可让计算机理解的自然语言句子的自动语义识别的方法，其特征在于所述的本体库分为本领域知识本体库和通用词本体知识库；所述的领域本体知识库，也是一个词库，它里面主要包括实词和领域相关的有意义的词汇；所述的通用词本体知识库是也是ー个词库；它里面主要包括虚词、代词、形容词、数词、量词、介词、助词、语气词，这些词是独立于特定领域的，但却是针对特定语言表达的，利用通用词库匹配标注出来的词语，在后面的机器理解中，可以当作辅助分析的词语，对领域内的句式、语境产生补充作用。4.根据权利要求3所述的ー种可让计算机理解的自然语言句子的自动语义识别的方法，其特征在于所述的框...

【专利技术属性】
技术研发人员：陈绪平，楚秉智，李磊，余健，刘琨，段建刚，
申请(专利权)人：上海云叟网络科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人