数据查询方法和装置、计算机设备及计算机可读存储介质制造方法及图纸

技术编号:17655270 阅读:36 留言:0更新日期:2018-04-08 08:31
本发明专利技术涉及一种数据查询方法和装置、计算机设备及计算机可读存储介质。该数据查询方法包括:接收用户的搜索语句;对搜索语句进行语义匹配,得到至少一个意图,其中,至少一个意图中的每个意图包括知识库中与每个意图匹配的意图知识点和与匹配的意图知识点相关的至少一个意图参数,知识库包括多个意图知识点,多个意图知识点包括对应的多个搜索答案提取指令模板;根据与匹配的意图知识点相关的至少一个意图参数和匹配的意图知识点对应的搜索答案提取指令模板,得到搜索答案提取指令;以及根据搜索答案提取指令从动态数据库提取对应数据作为搜索答案数据。本发明专利技术能够提高数据查询的效率及答案回复的准确率。

【技术实现步骤摘要】
数据查询方法和装置、计算机设备及计算机可读存储介质
本专利技术涉及人工智能领域,尤其涉及一种数据查询方法和装置、计算机设备及计算机可读存储介质。
技术介绍
人工智能(ArtificialIntelligence)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能系统可以是例如智能客服系统、语音控制系统等。智能问答系统是人工智能的一种典型应用。传统的智能问答系统的知识库中存储的一些知识点往往不是经常问到的问题,而是来自结构化的静态二维表或动态数据库表,因此,一旦对静态二维表或动态数据库表中的数据进行大批量修改,就要对知识点对应的答案一一进行变更,导致工作量非常大且容易出错,并由此导致答案回复的准确率低。因此,如何通过自然语言形式的搜索语句从动态的数据库中快速准确的查询到正确的数据是急需解决的问题。
技术实现思路
有鉴于此,本专利技术的一个目的在于提供一种数据查询方法和装置、计算机设备及计算机可读存储介质,能够提高数据查询的效率及答案回复的准确率。本专利技术的一个方面提供一种数据查询方法,包括:接收用户的搜索语句;对搜索语句进行语义匹配,得到至少一个意图,其中,至少一个意图中的每个意图包括知识库中与每个意图匹配的意图知识点和与匹配的意图知识点相关的至少一个意图参数,知识库包括多个意图知识点,多个意图知识点包括对应的多个搜索答案提取指令模板;根据与匹配的意图知识点相关的至少一个意图参数和匹配的意图知识点对应的搜索答案提取指令模板,得到搜索答案提取指令;以及根据搜索答案提取指令从动态数据库提取对应数据作为搜索答案数据。在本专利技术的一个实施例中,对搜索语句进行语义匹配,得到至少一个意图,包括:根据预设的分词规则和预设的分词词典对搜索语句进行分词处理,得到多个词语;将多个词语与知识库中的多个意图知识点进行相似度计算,得到匹配的至少一个意图知识点;获取至少一个意图知识点的搜索答案提取指令模板中所需的意图参数名;根据预设的分词词典从多个词语中获取属于特定的词类或命名实体的至少一个词语作为意图参数,其中特定的词类和/或命名实体与搜索答案提取指令模板中所需的意图参数名对应;以及根据至少一个意图知识点对应的搜索答案提取指令模板和意图参数得到至少一个意图。在本专利技术的一个实施例中,预设的分词词典中的词类和/或命名实体包括动态数据库中的表项名,预设的分词词典中词类的同类词和/或命名实体的同类词包括动态数据库中对应表项名的数据。在本专利技术的一个实施例中,将多个词语与知识库中的多个意图知识点进行相似度计算,得到匹配的至少一个意图知识点,包括:将多个词语与知识库中的多个意图知识点的问句分别进行语义相似度计算,其中多个意图知识点中的每个意图知识点包括多个问句;以及将语义相似度最高的意图知识点作为至少一个意图知识点;或者根据预设的分词词典对多个词语进行词类提取和/或命名实体识别,得到至少一个词类和/或至少一个命名实体;将至少一个词类和/或至少一个命名实体与知识库中的多个意图知识点的问句分别进行语义相似度计算;以及将语义相似度最高的意图知识点作为至少一个意图知识点。在本专利技术的一个实施例中,根据搜索答案提取指令从动态数据库提取对应数据作为搜索答案数据,包括:如果至少一个意图的数量为大于1的整数,则根据至少一个意图获取至少一个意图中的每个意图对应的搜索答案提取指令;根据搜索答案提取指令从动态数据库提取对应数据作为每个意图对应的搜索数据;以及对每个意图对应的搜索数据做交集,并将交集数据作为搜索答案数据。在本专利技术的一个实施例中,根据搜索答案提取指令从动态数据库提取对应数据作为搜索答案数据,包括:当本次搜索语句对应的搜索答案提取指令中有一个搜索答案提取指令为用于从某次历史搜索答案数据中提取相关数据作为本次搜索答案数据指令,则根据本次搜索语句的搜索答案提取指令从某次历史搜索答案数据中提取本次搜索语句的其他搜索答案提取指令的搜索目标数据作为搜索答案数据。在本专利技术的一个实施例中,动态数据库包括至少一种表格,至少一种表格中的每种表格由表别名标识表别名对应的字段名,搜索答案提取指令模板中包括表别名对应的字段名。在本专利技术的一个实施例中,至少一种表格中的每种表格的表项至少包括表项名和表项名对应的字段名,其中表项名为预设的分词词典中的词类名和/或命名实体名,搜索答案提取指令模板中包括表项名对应的字段名,搜索答案提取指令模板为结构化查询语言代码模板。在本专利技术的一个实施例中,至少一个意图知识点中还包括答案模板,该数据查询方法还包括:根据答案模板和搜索答案数据生成最终的搜索答案,其中答案模板中包括答案话术。在本专利技术的一个实施例中,搜索答案提取指令为结构化查询语言代码。在本专利技术的一个实施例中,该数据查询方法还包括:按照预设的时间间隔对动态数据库和预设分词词典中的数据进行更新,预设的分词词典中的词类和/或命名实体包括动态数据库中的表项名,预设的分词词典中词类的同类词和/或命名实体的同类词均包括动态数据库中对应表项名的数据。在本专利技术的一个实施例中,搜索语句包括文本消息、语音消息、图片消息、图像消息和视频消息中的一种或多种,该数据查询方法还包括:将搜索语句转换为文本消息。本专利技术的另一个方面提供一种数据查询装置,包括:接收模块,用于接收用户的搜索语句;匹配模块,用于对搜索语句进行语义匹配,得到至少一个意图,其中,至少一个意图中的每个意图包括知识库中与每个意图匹配的意图知识点和与匹配的意图知识点相关的至少一个意图参数,知识库包括多个意图知识点,多个意图知识点包括对应的多个搜索答案提取指令模板;获取模块,用于根据与匹配的意图知识点相关的至少一个意图参数和匹配的意图知识点对应的搜索答案提取指令模板,得到搜索答案提取指令;以及数据提取模块,用于根据搜索答案提取指令从动态数据库提取对应数据作为搜索答案数据。在本专利技术的一个实施例中,匹配模块包括:分词单元,用于根据预设的分词规则和预设的分词词典对搜索语句进行分词处理,得到多个词语;知识点匹配单元,用于将多个词语与知识库中的多个意图知识点进行相似度计算,得到匹配的至少一个意图知识点;意图参数名获取单元,用于获取至少一个意图知识点的搜索答案提取指令模板中所需的意图参数名;意图参数获取单元,用于根据预设的分词词典从多个词语中获取属于特定的词类或命名实体的至少一个词语作为意图参数,其中特定的词类和/或命名实体与搜索答案提取指令模板中所需的意图参数名对应;以及意图匹配单元,用于根据至少一个意图知识点对应的搜索答案提取指令模板和意图参数得到至少一个意图。在本专利技术的一个实施例中,预设的分词词典中的词类和/或命名实体包括动态数据库中的表项名,预设的分词词典中词类的同类词和/或命名实体的同类词包括动态数据库中对应表项名的数据。在本专利技术的一个实施例中,知识点匹配单元包括:第一相似度计算子单元,用于将多个词语与知识库中的多个意图知识点的问句分别进行语义相似度计算,其中多个意图知识点中的每个意图知识点包括多个问句;以及第一相似度比较子单元,用于将语义相似度最高的意图知识点作为至少一个意图知识点;或者,知识点匹配单元包括:预处理子单元,用于根据预设的分词词典对多个词语进行词类提取和/或命名实体识别,得到至少一个词类和/或至少一个命本文档来自技高网...
数据查询方法和装置、计算机设备及计算机可读存储介质

【技术保护点】
一种数据查询方法,其特征在于,包括:接收用户的搜索语句;对所述搜索语句进行语义匹配,得到至少一个意图,其中,所述至少一个意图中的每个意图包括知识库中与所述每个意图匹配的意图知识点和与所述匹配的意图知识点相关的至少一个意图参数,所述知识库包括多个意图知识点,所述多个意图知识点包括对应的多个搜索答案提取指令模板;根据与所述匹配的意图知识点相关的至少一个意图参数和所述匹配的意图知识点对应的搜索答案提取指令模板,得到搜索答案提取指令;以及根据所述搜索答案提取指令从动态数据库提取对应数据作为搜索答案数据。

【技术特征摘要】
1.一种数据查询方法,其特征在于,包括:接收用户的搜索语句;对所述搜索语句进行语义匹配,得到至少一个意图,其中,所述至少一个意图中的每个意图包括知识库中与所述每个意图匹配的意图知识点和与所述匹配的意图知识点相关的至少一个意图参数,所述知识库包括多个意图知识点,所述多个意图知识点包括对应的多个搜索答案提取指令模板;根据与所述匹配的意图知识点相关的至少一个意图参数和所述匹配的意图知识点对应的搜索答案提取指令模板,得到搜索答案提取指令;以及根据所述搜索答案提取指令从动态数据库提取对应数据作为搜索答案数据。2.根据权利要求1所述的数据查询方法,其特征在于,所述对所述搜索语句进行语义匹配,得到至少一个意图,包括:根据预设的分词规则和预设的分词词典对所述搜索语句进行分词处理,得到多个词语;将所述多个词语与所述知识库中的所述多个意图知识点进行相似度计算,得到匹配的所述至少一个意图知识点;获取所述至少一个意图知识点的搜索答案提取指令模板中所需的意图参数名;根据所述预设的分词词典从所述多个词语中获取属于特定的词类或命名实体的至少一个词语作为意图参数,其中所述特定的词类和/或命名实体与所述搜索答案提取指令模板中所需的意图参数名对应;以及根据所述至少一个意图知识点对应的搜索答案提取指令模板和所述意图参数得到所述至少一个意图。3.根据权利要求2所述的数据查询方法,其特征在于,所述预设的分词词典中的词类和/或命名实体包括所述动态数据库中的表项名,所述预设的分词词典中词类的同类词和/或命名实体的同类词包括所述动态数据库中对应所述表项名的数据。4.根据权利要求2所述的数据查询方法,其特征在于,所述将所述多个词语与所述知识库中的所述多个意图知识点进行相似度计算,得到匹配的所述至少一个意图知识点,包括:将所述多个词语与所述知识库中的所述多个意图知识点的问句分别进行语义相似度计算,其中所述多个意图知识点中的每个意图知识点包括多个问句;以及将语义相似度最高的意图知识点作为所述至少一个意图知识点;或者根据所述预设的分词词典对所述多个词语进行词类提取和/或命名实体识别,得到至少一个词类和/或至少一个命名实体;将所述至少一个词类和/或至少一个命名实体与所述知识库中的所述多个意图知识点的问句分别进行语义相似度计算;以及将语义相似度最高的意图知识点作为所述至少一个意图知识点。5.根据权利要求1所述的数据查询方法,其特征在于,所述根据所述搜索答案提取指令从动态数据库提取对应数据作为搜索答案数据,包括:如果所述至少一个意图的数量为大于1的整数,则根据所述至少一个意图获取所述至少一个意图中的每个意图对应的搜索答案提取指令;根据所述搜索答案提取指令从所述动态数据库提取对应数据作为所述每个意图对应的搜索数据;以及对所述每个意图对应的搜索数据做交集,并将交集数据作为所述搜索答案数据。6.根据权利要求1所述的数据查询方法,其特征在于,根据所述搜索答案提取指令从所述动态数据库提取对应数据作为所述搜索答案数据,包括:当本次搜索语句对应的搜索答案提取指令中有一个搜索答案提取指令为用于从某次历史搜索答案数据中提取相关数据作为本次搜索答案数据指令,则根据本次搜索语句的搜索答案提取指令从所述某次历史搜索答案数据中提取本次搜索语句的其他搜索答案提取指令的搜索目标数据作为所述搜索答案数据。7.根据权利要求1至6中任一项所述的数据查询方法,其特征在于,所述动态数据库包括至少一种表格,所述至少一种表格中的每种表格由表别名标识所述表别名对应的字段名,所述搜索答案提取指令模板中包括所述表别名对应的字段名。8.根据权利要求7所述的数据查询方法,其特征在于,所述至少一种表格中的每种表格的表项至少包括表项名和所述表项名对应的字段名,其中所述表项名为所述预设的分词词典中的词类名和/或命名实体名,所述搜索答案提取指令模板中包括所述表项名对应的字段名,所述搜索答案提取指令模板为结构化查询语言代码模板。9.根据权利要求8所述的数据查询方法,其特征在于,所述至少一个意图知识点中还包括答案模板,所述数据查询方法还包括:根据所述答案模板和所述搜索答案数据生成最终的搜索答案,其中所述答案模板中包括答案话术。10.根据权利要求1至6中任一项所述的数据查询方法,其特征在于,所述搜索答案提取指令为结构化查询语言代码。11.根据权利要求7所述的数据查询方法,其特征在于,还包括:按照预设的时间间隔对所述动态数据库和所述预设分词词典中的数据进行更新,所述预设的分词词典中的词类和/或命名实体包括所述动态数据库中的表项名,所述预设的分词词典中词类的同类词和/或命名实体的同类词均包括所述动态数据库中对应所述表项名的数据。12.根据权利要求1至6中任一项所述的数据查询方法,其特征在于,所述搜索语句包括文本消息、语音消息、图片消息、图像消息和视频消息中的一种或多种,所述数据查询方法还包括:将所述搜索语句转换为文本消息。13.一种数据查询装置,其特征在于,包括:接收模块,用于接收用户的搜索语句;匹配模块,用于对所述搜索语句进行语义匹配,得到至少一个意图,其中,所述至少一个意图中的每个意图包括知识库中与所述每个意图匹配的意图知识点和与所述匹配的意图知识点相关的至少一个意图参数,所述知识库包括多个...

【专利技术属性】
技术研发人员:李波曾永梅程洁朱频频
申请(专利权)人:上海智臻智能网络科技股份有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1