自动识别语句关系和实体的方法及装置制造方法及图纸

技术编号:15704829 阅读:277 留言:0更新日期:2017-06-26 09:54
本发明专利技术属于智能识别技术领域,提供了一种自动识别语句关系和实体的方法及装置。本发明专利技术的自动识别语句关系和实体的方法包括:将用户的输入语句投影到一个固定维度的空间中,得到所述输入语句在所述固定维度的空间中的句子向量;将所述句子向量输入预先训练好的深度学习分类器,得到所述输入语句的关系类别;若识别出关系类别,则识别所述输入语句中的实体。本发明专利技术提供的方法及系统,利用深度学习,从语义上对用户输入进行判断,可以精准识别关系;将实体识别建模为序列标注问题,利用条件随机场求解最优标注,从而精准识别实体;结合深度学习和条件随机场,实现了关系和实体的自动化抽取。

【技术实现步骤摘要】
自动识别语句关系和实体的方法及装置
本专利技术涉及智能识别术领域,具体涉及一种自动识别语句关系和实体的方法及装置。
技术介绍
在人机对话系统中,我们常常要识别用户是否是在表达某些特定领域的信息,比如喜好、昵称等信息;如果用户是在表达这些信息,我们往往还需要能够精确提取到这些信息所指的具体对象。通常,这些信息可以通过关系和实体来进行表示。关系主要是指用户在表达什么样的信息,比如是否是喜好、昵称等;而实体则是指关系所指的具体对象。比如用户表达“我喜欢吃麻辣香锅”,对应的关系是“喜欢”,对应的实体是“麻辣香锅”。在对话系统中,如何自动识别这种特定领域的关系和实体是一个颇具挑战性的问题。最常用来识别关系和实体的方法主要有两种:基于关键词和基于正则表达式。基于关键词的方法主要是通过关键词来识别关系。以喜好为例,如果用户输入的句子中包含“喜欢”一词,就认为是在表达喜欢;如果包含“不喜欢”一词,就认为是在表达不喜欢。然后再结合语法依存分析或者语义角色标注(SRL)来提取该关系的实体。比如“我喜欢周杰伦”,其中包含喜欢,基于关键词的方法认为这句话是在表达“喜欢”;通过依存分析可以知道,“周杰伦”依存本文档来自技高网...
自动识别语句关系和实体的方法及装置

【技术保护点】
一种自动识别语句关系和实体的方法,其特征在于,包括:将用户的输入语句投影到一个固定维度的空间中,得到所述输入语句在所述固定维度的空间中的句子向量;将所述句子向量输入预先训练好的深度学习分类器,得到所述输入语句的关系类别;若识别出关系类别,则识别所述输入语句中的实体。

【技术特征摘要】
1.一种自动识别语句关系和实体的方法,其特征在于,包括:将用户的输入语句投影到一个固定维度的空间中,得到所述输入语句在所述固定维度的空间中的句子向量;将所述句子向量输入预先训练好的深度学习分类器,得到所述输入语句的关系类别;若识别出关系类别,则识别所述输入语句中的实体。2.根据权利要求1所述的方法,其特征在于,所述将用户的输入语句投影到一个固定维度的空间中,得到所述输入语句在所述固定维度的空间中的句子向量,包括:对用户的输入语句进行分词;通过查找word2vec词向量,将每个分词转换成对应的词向量;根据每个分词的词向量,得到所述输入语句在一个固定维度的空间中的句子向量。3.根据权利要求2所述的方法,其特征在于,所述将所述句子向量输入预先训练好的深度学习分类器,得到所述输入语句的关系类别,包括:将所述句子向量输入CNN层进行卷积操作,得到所述输入语句的局部特征;将所述局部特征输入LSTM层,得到所述输入语句中的前后词之间的关系编码;将所述关系编码输入ReLU层进行非线性变换;将非线性变换结果传递给输出层,得到所述输入语句的关系类别。4.根据权利要求3所述的方法,其特征在于,所述深度学习分类器包括多个CNN层。5.根据权利要求3所述的方法,其特征在于,所述深度学习分类器包括多个LSTM层。6.根据权利要求3所述的方法,其特征在于,所述深度学习分类器...

【专利技术属性】
技术研发人员:简仁贤王海波
申请(专利权)人:竹间智能科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1