一种基于形式语义推理和深度学习的自然语言知识挖掘系统技术方案

技术编号:14593600 阅读:133 留言:0更新日期:2017-02-08 22:49
本发明专利技术公开了一种基于形式语义推理和深度学习的自然语言知识挖掘系统,包括:机器学习模块,用于将形式语义推理和机器学习方法相结合,并进行包含语义的机器学习;意图学习模块,用于学习待挖掘的自然语言的描述意图;文本主题提取模块,用于根据LDA模型分析文本主题内容和段落内容描述意图;文档结构分类模型搭建模块,用于根据深度卷积神经网络进行模型训练,在训练过程中自动修饰完善该神经网络,并搭建自动文档结构分类器。本发明专利技术依靠自动化语义推理与深度学习技术与自然语言处理的结合,直接对以文献、语音等为代表的非结构化数据群进行处理并对意图进行推理,以了解文字描述的真实意图,将挖掘和检索到的知识用于新知识结构的分析和构造,从而实现高效、智能与可学习和自演化地进行知识挖掘与检索。

A natural language knowledge mining system based on formal semantic reasoning and deep learning

The invention discloses a mining system, the form of natural language semantic reasoning and deep learning based knowledge including: machine learning module for combining formal semantic reasoning and machine learning methods, and contains semantic learning; learning intention module for natural language learning to describe the mining intention; text extraction according to the model analysis module, LDA text content and paragraph description intention; document classification model construction module, used for model training according to the depth of the convolutional neural network, improve the automatic modification of neural network in the training process, and set up the automatic document structure classifier. The present invention relies on combining automatic semantic reasoning and deep learning technology and Natural Language Processing, directly on the unstructured data in the literature, such as voice on behalf of the group for processing and the inference of intention, in order to understand the real intention of the text description, data mining and information retrieval to knowledge to analyze and construct new knowledge structure, in order to achieve efficient intelligent, and learning and self evolution of knowledge mining and retrieval.

【技术实现步骤摘要】

本专利技术涉及知识挖掘领域,尤其涉及一种利用形式语义推理、深度学习技术对自然语言进行知识挖掘的系统。
技术介绍
随着人工智能的发展,生活中越来越需要对自然语言进行知识、语义的挖掘。现有技术中对自然语言进行挖掘时,通常采用词语分解的方式,例如当获取到自然语言时,通过将语句划分成多个词语,以这些词语作为关键词,进行知识构建,从而获取该自然语言的主要信息。然而上述语言挖掘方法并不能很好地体现自然语言的特点和内涵。人类语言具有多样化表达方式和复杂的结构特性,同样的含义可以有很多种表达,同一种表达在不同语境下还可以有很多种含义,有时甚至在一种语言中穿插多种其他语言。因此,在对一段自然语言进行挖掘时,由于整体文本的数据结构性较差,数据多源异构等问题,导致语言挖掘结果只能机械化地表达语义,而不能适应真实语言环境下的自然语言的知识内涵。此外,现有技术在对非结构化数据群进行处理时,通常使用常见数据库进行搜索分析,不能快速地进行精准定位,其处理过程不够高效,也无法实现智能化的知识挖掘。
技术实现思路
为了克服现有技术中的上述缺陷,本专利技术提出了一种基于形式语义推理和深度学习的自然语言知识挖掘系统。本专利本文档来自技高网...

【技术保护点】
一种基于形式语义推理和深度学习的自然语言知识挖掘系统,包括:机器学习模块,用于将形式语义推理和机器学习方法相结合,并进行包含语义的机器学习;意图学习模块,用于学习待挖掘的自然语言的描述意图;文本主题提取模块,用于根据LDA模型分析文本主题内容和段落内容描述意图;以及文档结构分类模型搭建模块,用于根据深度卷积神经网络进行模型训练,在训练过程中自动修饰完善该神经网络,并搭建自动文档结构分类器。

【技术特征摘要】
1.一种基于形式语义推理和深度学习的自然语言知识挖掘系统,包括:机器学习模块,用于将形式语义推理和机器学习方法相结合,并进行包含语义的机器学习;意图学习模块,用于学习待挖掘的自然语言的描述意图;文本主题提取模块,用于根据LDA模型分析文本主题内容和段落内容描述意图;以及文档结构分类模型搭建模块,用于根据深度卷积神经网络进行模型训练,在训练过程中自动修饰完善该神经网络,并搭建自动文档结构分类器。2.如权利要求1所述的基于形式语义推理和深度学习的自然语言知识挖掘系统,所述意图学习模块还包括,结合形式语义推理,对待挖掘的数据进行语法分析和语义推理,进行意图推理以了解文字描述的意图。3.如权利要求2所述的基于形式语义推理和深度学习的自然语言知识挖掘系统,所述意图包括定义、描述、否定。4.如权利要求1所述的基于形式语义推理和深度学习的自然语言知识挖掘系统,所述意图学习模块还包括,使用机器学习技术,学习文本数据的意图。5.如权利要求1所述的基于形式语义推理和深度学习的自然语言知识挖掘系统,所述文本主题提取模块还包括,根据LDA主题模型自动提...

【专利技术属性】
技术研发人员:史建琦吴双黄滟鸿王祥丰吴苑斌
申请(专利权)人:华东师范大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1