自动识别语句关系和实体的方法及装置制造方法及图纸

技术编号：15704829 阅读：257 留言：0更新日期：2017-06-26 09:54

本发明专利技术属于智能识别技术领域，提供了一种自动识别语句关系和实体的方法及装置。本发明专利技术的自动识别语句关系和实体的方法包括：将用户的输入语句投影到一个固定维度的空间中，得到所述输入语句在所述固定维度的空间中的句子向量；将所述句子向量输入预先训练好的深度学习分类器，得到所述输入语句的关系类别；若识别出关系类别，则识别所述输入语句中的实体。本发明专利技术提供的方法及系统，利用深度学习，从语义上对用户输入进行判断，可以精准识别关系；将实体识别建模为序列标注问题，利用条件随机场求解最优标注，从而精准识别实体；结合深度学习和条件随机场，实现了关系和实体的自动化抽取。

全部详细技术资料下载

【技术实现步骤摘要】
自动识别语句关系和实体的方法及装置
本专利技术涉及智能识别术领域，具体涉及一种自动识别语句关系和实体的方法及装置。
技术介绍
在人机对话系统中，我们常常要识别用户是否是在表达某些特定领域的信息，比如喜好、昵称等信息；如果用户是在表达这些信息，我们往往还需要能够精确提取到这些信息所指的具体对象。通常，这些信息可以通过关系和实体来进行表示。关系主要是指用户在表达什么样的信息，比如是否是喜好、昵称等；而实体则是指关系所指的具体对象。比如用户表达“我喜欢吃麻辣香锅”，对应的关系是“喜欢”，对应的实体是“麻辣香锅”。在对话系统中，如何自动识别这种特定领域的关系和实体是一个颇具挑战性的问题。最常用来识别关系和实体的方法主要有两种：基于关键词和基于正则表达式。基于关键词的方法主要是通过关键词来识别关系。以喜好为例，如果用户输入的句子中包含“喜欢”一词，就认为是在表达喜欢；如果包含“不喜欢”一词，就认为是在表达不喜欢。然后再结合语法依存分析或者语义角色标注(SRL)来提取该关系的实体。比如“我喜欢周杰伦”，其中包含喜欢，基于关键词的方法认为这句话是在表达“喜欢”；通过依存分析可以知道，“周杰伦”依存于核心词“喜欢”，因此喜欢的对象是“周杰伦”，即识别出的实体是“周杰伦”。基于关键词的方法的缺点是存在大量的误判，即包含某个关键词的句子并不一定必然表达该关系。拿上面的喜好为例，用户输入“我目前还说不好是不是喜欢周杰伦”，里面既包含关键词“喜欢”，表达的意思却是一种不确定的状态。如果根据里面包含“喜欢”，就认为是喜欢关系，就难免有失偏颇了。这个例子揭示了仅仅根据关键词本身还是无...
自动识别语句关系和实体的方法及装置

【技术保护点】
一种自动识别语句关系和实体的方法，其特征在于，包括：将用户的输入语句投影到一个固定维度的空间中，得到所述输入语句在所述固定维度的空间中的句子向量；将所述句子向量输入预先训练好的深度学习分类器，得到所述输入语句的关系类别；若识别出关系类别，则识别所述输入语句中的实体。

【技术特征摘要】
1.一种自动识别语句关系和实体的方法，其特征在于，包括：将用户的输入语句投影到一个固定维度的空间中，得到所述输入语句在所述固定维度的空间中的句子向量；将所述句子向量输入预先训练好的深度学习分类器，得到所述输入语句的关系类别；若识别出关系类别，则识别所述输入语句中的实体。2.根据权利要求1所述的方法，其特征在于，所述将用户的输入语句投影到一个固定维度的空间中，得到所述输入语句在所述固定维度的空间中的句子向量，包括：对用户的输入语句进行分词；通过查找word2vec词向量，将每个分词转换成对应的词向量；根据每个分词的词向量，得到所述输入语句在一个固定维度的空间中的句子向量。3.根据权利要求2所述的方法，其特征在于，所述将所述句子向量输入预先训练好的深度学习分类器，得到所述输入语句的关系类别，包括：将所述句子向量输入CNN层进行卷积操作，得到所述输入语句的局部特征；将所述局部特征输入LSTM层，得到所述输入语句中的前后词之间的关系编码；将所述关系编码输入ReLU层进行非线性变换；将非线性变换结果传递给输出层，得到所述输入语句的关系类别。4.根据权利要求3所述的方法，其特征在于，所述深度学习分类器包括多个CNN层。5.根据权利要求3所述的方法，其特征在于，所述深度学习分类器包括多个LSTM层。6.根据权利要求3所述的方法，其特征在于，所述深度学习分类器...

【专利技术属性】
技术研发人员：简仁贤，王海波，
申请(专利权)人：竹间智能科技上海有限公司，
类型：发明
国别省市：上海,31

全部详细技术资料下载我是这个专利的主人