智能问答方法、装置及系统制造方法及图纸

技术编号:13385805 阅读:76 留言:0更新日期:2016-07-22 00:12
一种智能问答方法、装置及系统,所述方法包括:接收用户输入信息;根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式及抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义包括一个或多个抽象语义表达式,所述抽象语义表达式包括缺少语义成分;当得到的所述类别符合预设类别时,根据抽象语义表达式中的缺失语义成分从所述用户输入信息中提取第一主体信息和第一属性信息;当存在与所述第一主体信息和所述第一属性信息匹配的外部数据源时,从所述外部数据源中提取相应的属性内容作为答案。上述方案可简化知识库的维护,并提高答案回复的准确性。

【技术实现步骤摘要】
智能问答方法、装置及系统
本专利技术涉及数据处理
,特别是涉及一种智能问答方法、装置及系统。
技术介绍
知识库,又称为智能数据库或人工智能数据库,在知识库中,信息被有效组织以便进行检索和利用。知识库广泛应用于人工智能领域,其中一个典型的应用就是智能问答系统,又称为自动问题系统。应用于智能问答系统的知识库中存储多个知识点,每个知识点包括一个或多个预设的问题以及对应的答案信息。当用户通过输入请求信息提出问题时,计算请求信息与预设问题的语义相似度,如果存在语义相似度大于预设阈值的预设问题,则将该问题对应的答案信息返回给用户。在用户提出的问题中,有一些问题是有关主体和属性的,主体是描述事务的对象,属性是主体的特征,例如用户输入问句为“刘德华的妻子是谁”,主体为刘德华,属性为妻子。在现有技术中,为了返回相应的答案信息,智能问答系统需要在知识库中建立一个“刘德华的妻子是谁”或类似问句的问题,以及相应的答案信息,在接收用户输入问句后,通过进行语义相似度计算,在自动问答系统中找到语义相似度大于预设阈值的问句,即存在相应的知识点,那么可将该知识点的对应答案信息作为答案。然而,这种有关主体和属性的问句中,主体的具体内容是千变万化的,按照现有的方法,当主体变化时,问句也相应变化,为了提供相应的答案,必须在智能问答系统中建立相应的知识点,这无疑增加了智能问答系统知识库的存储量,并且对不同的问题进行预设耗时耗力,知识库的维护也会十分繁杂。在现有技术中,也存在直接使用用户输入问句从外部数据源中爬取最接近答案的方法,但是这种方法获得的答案不够准确。
技术实现思路
本专利技术解决的技术问题是提供一种智能问答方法、装置及系统,简化知识库的维护,并提高答案回复的准确性。为解决上述技术问题,本专利技术实施例提供一种智能问答方法,所述方法包括:接收用户输入信息;根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式及抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义包括一个或多个抽象语义表达式,所述抽象语义表达式包括缺少语义成分;当得到的所述类别符合预设类别时,根据抽象语义表达式中的缺失语义成分从所述用户输入信息中提取第一主体信息和第一属性信息;当存在与所述第一主体信息和所述第一属性信息匹配的外部数据源时,从所述外部数据源中提取相应的属性内容作为答案。可选地,在进行抽象语义推荐处理之前,还包括:提供知识库,所述知识库包括多个知识点,每个知识点包括答案以及多个问题;当所述用户输入信息与所述知识库中问题的最高语义相似度值小于预设相似度阈值时,进行所述抽象语义推荐处理;否则,向用户提供所述最高语义相似度值对应的知识点中的答案。可选地,所述外部数据源包括多个词条,每个所述词条包括第二主体信息和多个第二属性信息;与所述第一主体信息和所述第一属性信息匹配的外部数据源指的是所述第一主体信息与所述外部数据源中一词条的第二主体信息属于同一词类且所述第一属性信息与所述词条中的第二属性信息属于同一词类。可选地,所述外部数据源为多个且各具有预设类别,所述方法还包括:预先设置所述多个外部数据源的优先级顺序;在进行抽象语义推荐处理后,当所述预设类别与所述抽象语义的类别符合的外部数据源有多个时,按照优先级从高到低的顺序选择外部数据源,当优先级较高的外部数据源无法提供答案时才选择剩余的外部数据源,直至得到答案为止。可选地,所述外部数据源为M个且各具有预设类别,所述方法还包括:当得到的所述类别符合N个预设类别,且N个外部数据源均与所述第一主体信息和所述第一属性信息匹配时,分别从N个所述外部数据源中提取相应的属性内容,并将提取的N个属性内容进行信息整合处理后的整合信息作为答案,所述N小于或等于M。可选地,所述智能问答方法,还包括:当存在仅与所述第一属性信息匹配的外部数据源,所述第一主体信息包括第三主体信息和第三属性信息,且所述外部数据源中存在与所述第三主体信息和第三属性信息匹配的属性内容时,将所述属性内容作为第四主体信息,从所述外部数据源中提取与所述第四主体信息和所述第一属性信息匹配的属性内容作为答案。可选地,所述抽象语义推荐处理包括:对所述用户输入信息进行分词处理,得到若干单独词;分别对每个单独词进行词性标注处理,得到每个单独词的词性信息;分别对每个单独词进行词类判断处理,得到每个单独词的词类信息;对抽象语义数据库进行搜索处理,得到与所述用户输入信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述用户输入信息匹配的抽象语义表达式。本专利技术实施例还提供一种智能问答装置,所述装置包括:接收单元,适于接收用户输入信息;抽象语义数据库,适于提供多个类别的抽象语义,每个类别的抽象语义包括一个或多个抽象语义表达式,所述抽象语义表达式包括缺少语义成分;抽象语义推荐单元,适于根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式及抽象语义的类别;提取单元,适于当得到的所述类别符合预设类别时,根据抽象语义表达式中的缺失语义成分从所述用户输入信息中提取第一主体信息和第一属性信息;第一答案查找单元,适于当存在与所述第一主体信息和所述第一属性信息匹配的外部数据源时,从所述外部数据源中提取相应的属性内容作为答案。可选地,所述智能问答装置,还包括:知识库,适于提供多个知识点,每个知识点包括答案以及多个问题;预处理单元,适于在进行抽象语义推荐处理之前,获取所述用户输入信息与所述知识库中问题的最高语义相似度值,并判断所述最高语义相似度值与预设相似度阈值的大小;所述抽象语义推荐单元还适于当所述用户输入信息与所述知识库中问题的最高语义相似度值小于预设相似度阈值时,进行所述抽象语义推荐处理;所述第一答案查找单元还适于当所述用户输入信息与所述知识库中问题的最高语义相似度值大于预设相似度阈值时,向用户提供所述最高语义相似度值对应的知识点中的答案。可选地,所述外部数据源包括多个词条,每个所述词条包括第二主体信息和多个第二属性信息;与所述第一主体信息和所述第一属性信息匹配的外部数据源指的是所述第一主体信息与所述外部数据源中一词条的第二主体信息属于同一词类且所述第一属性信息与所述词条中的第二属性信息属于同一词类。可选地,所述外部数据源为多个且各具有预设类别,所述装置还包括优先级设置单元,适于预先设置所述多个外部数据源的优先级顺序;所述第一答案查找单元还适于在进行抽象语义推荐处理后,当所述预设类别与所述抽象语义的类别符合的外部数据源有多个时,按照优先级从高到低的顺序选择外部数据源,当优先级较高的外部数据源无法提供答案时才选择剩余的外部数据源,直至得到答案为止。可选地,所述第一答案查找单元为多个,所述外部数据源为多个且各具有预设类别,所述装置还包括信息整合单元;当得到的所述类别符合N个预设类别,且N个外部数据源均与所述第一主体信息和所述第一属性信息匹配时,每个所述第一答案查找单元还适于分别从N个所述外部数据源中提取相应的属性内容,所述信息整合单元,适于将每个所述第一答案查找单元提取的N个属性内容进行信息整合处本文档来自技高网...

【技术保护点】
一种智能问答方法,其特征在于,包括:接收用户输入信息;根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式及抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义包括一个或多个抽象语义表达式,所述抽象语义表达式包括缺少语义成分;当得到的所述类别符合预设类别时,根据抽象语义表达式中的缺失语义成分从所述用户输入信息中提取第一主体信息和第一属性信息;当存在与所述第一主体信息和所述第一属性信息匹配的外部数据源时,从所述外部数据源中提取相应的属性内容作为答案。

【技术特征摘要】
1.一种智能问答方法,其特征在于,包括:接收用户输入信息;根据抽象语义数据库对所述用户输入信息进行抽象语义推荐处理,得到与所述用户输入信息对应的抽象语义表达式及抽象语义的类别,所述抽象语义数据库包括多个类别的抽象语义,每个类别的抽象语义包括一个或多个抽象语义表达式,所述抽象语义表达式包括缺少语义成分;所述抽象语义的类别表征了某一类用户问题所应对应答案的语义,所述类别包括:概念说明、行为方式、属性构成、行为原因或主体关系介绍;所述缺少语义成分包括表示主体或客体成份的词或短语、表示动作成份的词或短语、表示属性成份的词或短语;当得到的所述类别符合预设类别时,根据抽象语义表达式中的缺失语义成分从所述用户输入信息中提取第一主体信息和第一属性信息,所述预设类别是主体关系介绍或属性构成;当存在与所述第一主体信息和所述第一属性信息匹配的外部数据源时,从所述外部数据源中提取相应的属性内容作为答案;所述抽象语义推荐处理包括:对所述用户输入信息进行分词处理,得到若干单独词;分别对每个单独词进行词性标注处理,得到每个单独词的词性信息;分别对每个单独词进行词类判断处理,得到每个单独词的词类信息;所述词类判断处理包括:将每个单独词与词类库中的若干词类进行匹配,若某一词类中存在该单独词,则该单独词具有相应的词类;对抽象语义数据库进行搜索处理,得到与所述用户输入信息相关的抽象语义候选集,所述抽象语义候选集包括多个抽象语义表达式;根据所述词性信息和词类信息对抽象语义候选集中的抽象语义表达式进行匹配处理,得到与所述用户输入信息匹配的抽象语义表达式。2.如权利要求1所述的智能问答方法,其特征在于,在进行抽象语义推荐处理之前,还包括:提供知识库,所述知识库包括多个知识点,每个知识点包括答案以及多个问题;当所述用户输入信息与所述知识库中问题的最高语义相似度值小于预设相似度阈值时,进行所述抽象语义推荐处理;否则,向用户提供所述最高语义相似度值对应的知识点中的答案。3.如权利要求1所述的智能问答方法,其特征在于,所述外部数据源包括多个词条,每个所述词条包括第二主体信息和多个第二属性信息;与所述第一主体信息和所述第一属性信息匹配的外部数据源指的是所述第一主体信息与所述外部数据源中一词条的第二主体信息属于同一词类且所述第一属性信息与所述词条中的第二属性信息属于同一词类。4.如权利要求1所述的智能问答方法,其特征在于,所述外部数据源为多个且各具有预设类别,所述方法还包括:预先设置所述多个外部数据源的优先级顺序;在进行抽象语义推荐处理之后,当所述预设类别与所述抽象语义的类别符合的外部数据源有多个时,按照优先级从高到低的顺序选择外部数据源,当优先级较高的外部数据源无法提供答案时才选择剩余的外部数据源,直至得到答案为止。5.如权利要求1所述的智能问答方法,其特征在于,所述外部数据源为M个且各具有预设类别,所述方法还包括:当得到的所述类别符合N个预设类别,且N个外部数据源均与所述第一主体信息和所述第一属性信息匹配时,分别从N个所述外部数据源中提取相应的属性内容,并将提取的N个属性内容进行信息整合处理后的整合信息作为答案,所述N小于或等于M。6.如权利要求1所述的智能问答方法,其特征在于,还包括:当存在仅与所述第一属性信息匹配的外部数据源,所述第一主体信息包括第三主体信息和第三属性信息,且所述外部数据源中存在与所述第三主体信息和第三属性信息匹配的属性内容时,将所述属性内容作为第四主体信息,从所述外部数据源中提取与所述第四主体信息和所述第一属性信息匹配的属性内容作为答案。7.一种智能问答装置,其特征在于,包括:接收单元,适于接收用户输入信息;抽象语义数据库,适于提供多个类别的抽象语义,每个类别的抽象语义包括一个或多个抽象语义表达式,所述抽象语义表达式包括缺少语义成分;所述抽象语义的类别表征了某一类用户问题所应对应答案的语义,所述类别包括:概念说明、行为方式、属性构成、行为原因或主体关系介绍;所述缺少语义成分包括表示主体或客体成份的词或短语、表示动作成份的词或短语、表示属性成份的词或短语;抽象语义推荐单元,适于根据抽象语义数据库对所述用户输入...

【专利技术属性】
技术研发人员:曾永梅李波朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1