The present invention provides a question and answer method based on the knowledge map. A question and answer method based on knowledge atlas provided by this invention is realized by the matching of body entity, relationship matching and answer determination. Thematic entity matching mainly consists of two parts: named entity recognition and entity link. Named entity recognition aims to identify naming entities in the natural language question Q, such as the names of people, the place name, the name of the organization, and so on. A physical link entity named entity recognition that corresponds to the knowledge in the library, found that three tuples of the entities in the s, the match relationship through natural language understanding technology of semantic understanding question Q expression, and the three tuple in the search space (s, P, O) to match the relationship P in order to determine the corresponding semantic relations, the expression of the question and the knowledge base. The Candidate Theme entity by entity recognition and link relationship matching can be obtained from several candidate candidate relationships, three tuple, answer to determine the need according to the entity recognition score, matching the candidate three tuple ranking score and other characteristics, determine the answer.
【技术实现步骤摘要】
一种基于知识图谱的问答方法
本专利技术涉及一种检索方法,尤其涉及一种基于知识图谱的问答方法。
技术介绍
问答系统(QuestionAnsweringSystem,QA)是信息检索系统的一种高级形式。它能用准确、简洁的自然语言回答用户用自然语言提出的问题。其研究兴起的主要原因是人们对快速、准确地获取信息的需求。问答系统是目前人工智能和自然语言处理领域中一个倍受关注并具有广泛发展前景的研究方向。上世纪五六十年代计算机诞生的初期,人们对问答系统就有所研究与尝试。其中有代表性的包括Baseball和Lunar,但早期的系统多是针对特定领域设计,数据规模比较小,语义理解能力较弱。总体来说,系统功能有限,很难被广泛引用。随着大规模网络数据资源的出现,尤其是知识图谱的出现,使得基于知识图谱的问答系统更加智能化,知识库是一种储存复杂结构化信息的新型技术。知识库中存储了大量事实型知识,其内部使用知识图谱(knowledgegraph)模型对实体及实体间的关系间的关系信息进行建模。如今,知识库多以RDF(ResourceDescriptionFramework)的格式存储数据,一条事实(fact)被表示为一个(S,P,O)三元组,形如(subject,predicate,object),其中主体(subject)和客体(object)为命名实体,客体(object)有时会是属性值,述语(predicate)是主体(subject)和客体(object)间的关系。目前基于知识图谱的问答方法在国内外的研究中大致可以被分为两类,基于语义解析的知识库问答方法、基于信息抽取的知识库问答 ...
【技术保护点】
一种基于知识图谱的问答方法,其特征在于,所述方法包括以下步骤:步骤1:用户输入自然语言问句,经过字符串预处理;步骤2:通过命名实体模块获得问句中的命名实体词;步骤3:通过实体链接模块,利用命名实体词查询别名词典,返回候选主题实体及其根据知名度的排名;步骤4:得到使用实体类型代替命名实体词的问句模式(pattern),经过关系匹配模型配到问句所表达语义的知识库中的关系及其得分;步骤5:找到候选实体和候选关系后,根据关系得分和实体排序,及其在知识库中的查找确定答案。
【技术特征摘要】
1.一种基于知识图谱的问答方法,其特征在于,所述方法包括以下步骤:步骤1:用户输入自然语言问句,经过字符串预处理;步骤2:通过命名实体模块获得问句中的命名实体词;步骤3:通过实体链接模块,利用命名实体词查询别名词典,返回候选主题实体及其根据知名度的排名;步骤4:得到使用实体类型代替命名实体词的问句模式(pattern),经过关系匹配模型配到问句所表达语义的知识库中的关系及其得分;步骤5:找到候选实体和候选关系后,根据关系得分和实体排序,及其在知识库中的查找确定答案。2.如权利要求1所述的方法,其特征在于,主题实体匹配包括命名实体识别模块和实体链接模块两个部分,命名实体识别模块识别自然语言问句q中人名、地名、组织机构名等命名实体,实体链接模块将识别出的命名实体对应到知识库中的某一个实体上,即找到三元组中的实体s,关系匹配模型通过自然语言理解技术理解问句q所表达的语义,并且与搜索空间中三元组(s,p,o)中的关系p进行匹配,以此确定问句所表达的语义及其与知识库中对应的关系,通过命名实体识别模块和实体链接模块得到候选主题实体,关系匹配得到候选关系,由此得到若干候选三元组,最后根据实体识别得分,关系匹配得分特征对候选三元组进行排序,确定最后答案。3.如权利要求2所述的方法,其特征在于,所述命名实体识别模块采用基于字符和单词级别的GRU-CRF(融合条件随机场的循环神经网络)模型来识别问句q中的命名实体词,所述GRU-CRF(融合条件随机场的循环神经网络)模型中使用单词级别的向量和字符级别的向量相结合来共同构造词向量,作为序列标注模型的输入。4.如权利要求3所述的方法...
【专利技术属性】
技术研发人员:胡春明,许程,贺薇,张日崇,
申请(专利权)人:北京航空航天大学,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。