【技术实现步骤摘要】
本专利技术涉及一种检索技术,特别是涉及一种对结构化数据库进行全文检索的检索方法、检索系统以及自然语言理解系统。
技术介绍
在计算机的自然语言理解(Nature Language Understanding)中,通常会使用特定的语法来抓取用户的输入语句的意图或信息。因此,若数据库中储存有足够多的用户输入语句的数据,便能做到合理的判断。在现有的作法中,有一种是利用内置的固定词列表来抓取用户的输入语句,而固定词列表中包含了特定的意图或信息所使用的特定用语,而用户需依照此特定用语来表达其意图或信息,其意图或信息才能被系统正确识别。然而,迫使用户去记住固定词列表的每个特定用语是相当不人性化的作法。例如现有技术使用固定词列表的实施方式,要求用户在询问天气的时候必须说“上海(或北京)明天(或后天)天气如何? ”,而若用户使用其他比较自然的口语化表达也想询问天气状况时,比如是“上海明天怎么样啊?”,因为语句中未出现“天气”,所以现有技术就会理解成“上海有个叫明天的地方”,这样显然没有抓到用户的真正意图。另外,用户所使用的语句种类是十分复杂的,并且又时常有所变化,甚至有时用户可能 ...
【技术保护点】
一种检索系统,包括:一结构化数据库,用以储存具有一数据结构的多个记录;以及一搜寻引擎,用以对该结构化数据库进行一全文检索,其中该数据结构包括一标题栏,该标题栏内包括至少一分栏,每一分栏包括一指引栏以及一数值栏,该些记录的该指引栏储存一指引数据,该些记录的该数值栏储存一数值数据。
【技术特征摘要】
1.一种检索系统,包括 一结构化数据库,用以储存具有一数据结构的多个记录;以及 ー搜寻引擎,用以对该结构化数据库进行一全文检索, 其中该数据结构包括一标题栏,该标题栏内包括至少一分栏,每一分栏包括一指引栏以及ー数值栏,该些记录的该指引栏储存一指引数据,该些记录的该数值栏储存一数值数据。2.如权利要求1所述的检索系统,其中该数据结构还包括一内容栏,该些记录的该内容栏储存各该些记录的内容细节数据。3.如权利要求1所述的检索系统,其中当该些记录的该标题栏中储存有多个该分栏的数据时,于各该分栏的数据间储存ー第一特殊字符,用以分隔各该分栏的数据,于该指引栏与该数值栏的数据间储存ー第二特殊字符,用以分隔该指引栏与该数值栏的数据。4.如权利要求1所述的检索系统,其中该标题栏中的该分栏具有固定位数。5.如权利要求1所述的检索系统,还包括一检索接ロ単元,耦接该搜寻引擎,用以接收至少ー关键字来传送给该搜寻引擎,藉以让该搜寻引擎对该些记录的该标题栏进行该全文检索,以及反应该搜寻引擎的一匹配結果,输出该些记录中的至少ー检索匹配记录。6.如权利要求5所述的检索系统,其中该检索匹配记录为与该至少一关键字完全匹配的一全匹配记录或与该至少一关键字部分匹配的一部分匹配记录。7.如权利要求6所述的检索系统,其中当该检索接ロ单元输出多个检索匹配记录吋,其依序输出该全匹配记录及该部分匹配记录,其中该全匹配记录的优先顺序大于该部分匹配记录的优先顺序。8.ー种自然语言理解系统,包括 一自然语言处理器,用以将ー用户的一请求信息,分析成至少一可能意图语法数据,每一可能意图语法数据包括至少ー关键字及一意图数据; 一知识辅助理解模块,耦接该自然语言处理器,用以求得该至少一可能意图语法数据中的一确定意图语法数据,以表达该用户的该请求信息的意图;以及 一检索系统,包括 一结构化数据库,用以储存具有一数据结构的多个记录;以及 ー搜寻引擎,用以对该结构化数据库进行一全文检索,该数据结构包括ー标题栏,该标题栏内包括至少一分栏,每一分栏包括一指引栏以及一数值栏,该些记录的该指引栏储存一指引数据,该些记录的该数值栏储存ー数值数据, 其中,该知识辅助理解模块传送该关键字给该检索系统,藉由该检索系统的回应,以辅助求得该确定意图语法数据。9.如权利要求8所述的自然语言理解系统,其中该数据结构还包括一内容栏,该些记录的该内容栏储存各该些记录的内容细节数据。10.如权利要求8所述的自然语言理解系统,其中当该些记录的该标题栏中储存有多个该分栏的数据时,于各该分栏的数据间储存ー第一特殊字符,用以分隔各该分栏的数据,于该指引栏与该数值栏的数据间储存ー第二特殊字符,用以分隔该指引栏与该数值栏的数据。11.如权利要求8所述的自然语言理解系统,其中该标题栏中的该分栏具有固定位数。12.如权利要求8所述的自然语言理解系统,其中该检索系统还包括一检索接ロ単元,耦接该搜寻引擎以及该知识辅助理解模块,用以接收该关键字来传送给该搜寻引擎,藉以让该搜寻引擎对该些记录的该标题栏进行该全文检索,以及反应该搜寻引擎的一匹配结果,输出该些记录中的至少ー检索匹配记录,该知识辅助理解模块藉由比对该至少ー检索匹配记录中该标题栏所储存的该指引数据与该至少一可能意图语法数据所包括的该意图数据,从而判断出该用户的该请求信息的意图。13.如权利要求12所述的自然语言理解系统,其中该检索匹配记录为与该关键字完全匹配的一全匹配记录或与该关键字部分匹配的一部分匹配记录。1...
【专利技术属性】
技术研发人员:张国峰,朱逸斐,
申请(专利权)人:威盛电子股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。