【技术实现步骤摘要】
自动识别语句关系和实体的方法及装置
本专利技术涉及智能识别术领域,具体涉及一种自动识别语句关系和实体的方法及装置。
技术介绍
在人机对话系统中,我们常常要识别用户是否是在表达某些特定领域的信息,比如喜好、昵称等信息;如果用户是在表达这些信息,我们往往还需要能够精确提取到这些信息所指的具体对象。通常,这些信息可以通过关系和实体来进行表示。关系主要是指用户在表达什么样的信息,比如是否是喜好、昵称等;而实体则是指关系所指的具体对象。比如用户表达“我喜欢吃麻辣香锅”,对应的关系是“喜欢”,对应的实体是“麻辣香锅”。在对话系统中,如何自动识别这种特定领域的关系和实体是一个颇具挑战性的问题。最常用来识别关系和实体的方法主要有两种:基于关键词和基于正则表达式。基于关键词的方法主要是通过关键词来识别关系。以喜好为例,如果用户输入的句子中包含“喜欢”一词,就认为是在表达喜欢;如果包含“不喜欢”一词,就认为是在表达不喜欢。然后再结合语法依存分析或者语义角色标注(SRL)来提取该关系的实体。比如“我喜欢周杰伦”,其中包含喜欢,基于关键词的方法认为这句话是在表达“喜欢”;通过依存分析可以 ...
【技术保护点】
一种自动识别语句关系和实体的方法,其特征在于,包括:将用户的输入语句投影到一个固定维度的空间中,得到所述输入语句在所述固定维度的空间中的句子向量;将所述句子向量输入预先训练好的深度学习分类器,得到所述输入语句的关系类别;若识别出关系类别,则识别所述输入语句中的实体。
【技术特征摘要】
1.一种自动识别语句关系和实体的方法,其特征在于,包括:将用户的输入语句投影到一个固定维度的空间中,得到所述输入语句在所述固定维度的空间中的句子向量;将所述句子向量输入预先训练好的深度学习分类器,得到所述输入语句的关系类别;若识别出关系类别,则识别所述输入语句中的实体。2.根据权利要求1所述的方法,其特征在于,所述将用户的输入语句投影到一个固定维度的空间中,得到所述输入语句在所述固定维度的空间中的句子向量,包括:对用户的输入语句进行分词;通过查找word2vec词向量,将每个分词转换成对应的词向量;根据每个分词的词向量,得到所述输入语句在一个固定维度的空间中的句子向量。3.根据权利要求2所述的方法,其特征在于,所述将所述句子向量输入预先训练好的深度学习分类器,得到所述输入语句的关系类别,包括:将所述句子向量输入CNN层进行卷积操作,得到所述输入语句的局部特征;将所述局部特征输入LSTM层,得到所述输入语句中的前后词之间的关系编码;将所述关系编码输入ReLU层进行非线性变换;将非线性变换结果传递给输出层,得到所述输入语句的关系类别。4.根据权利要求3所述的方法,其特征在于,所述深度学习分类器包括多个CNN层。5.根据权利要求3所述的方法,其特征在于,所述深度学习分类器包括多个LSTM层。6.根据权利要求3所述的方法,其特征在于,所述深度学习分类器...
【专利技术属性】
技术研发人员:简仁贤,王海波,
申请(专利权)人:竹间智能科技上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。