基于人工智能的查询信息纠错构架生成方法和装置制造方法及图纸

技术编号:17994632 阅读:108 留言:0更新日期:2018-05-19 11:49
本发明专利技术公开了一种基于人工智能的查询信息纠错构架生成方法和装置,其中,基于人工智能的查询信息纠错构架生成方法包括:获取应用场景信息;根据应用场景信息确定纠错需求信息;根据纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。本发明专利技术实施例的基于人工智能的查询信息纠错构架生成方法和装置,通过获取应用场景信息,并根据应用场景信息确定纠错需求信息,以及根据纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架,能够针对不同应用场景,灵活地生成与其相对应的纠错框架,更加符合需求。

Method and device for generating query information correction framework based on Artificial Intelligence

The invention discloses a method and device for creating a query information error correcting frame based on artificial intelligence. Among them, the method of generating query information error correction frame generation based on artificial intelligence includes obtaining application scene information, determining the error correction requirement information according to the application scene information, and selecting the data from the database according to the error correction requirement information. The network layer and / or components of the corresponding functions are combined with neurons to generate query information correction architecture. The method and device for creating a query information error correcting frame based on artificial intelligence in the embodiment of the invention, by obtaining the information of the application scene, and determining the error correction requirement according to the application scene information, and selecting the network layer and / or component that can implement the corresponding function from the database according to the error correction requirement information, and combine the neurons, In order to generate the query information correction framework, it can flexibly generate the corresponding error correction framework for different application scenarios, which is more in line with the demand.

【技术实现步骤摘要】
基于人工智能的查询信息纠错构架生成方法和装置
本专利技术涉及信息处理
,尤其涉及一种基于人工智能的查询信息纠错构架生成方法和装置。
技术介绍
用户在使用搜索引擎进行检索时,经常会输入错误的查询词,比如“清华大学”输入成“情华大学”,或者输入成为“亲华大学”,或者输入成“清华学”。因此,需要搜索引擎能够对错误的查询词进行识别,并对其进行纠错。目前,在对查询词进行纠错时,主要通过先验指导完成错误片段识别,然后提供正确候选片段。上述构架是以固定的方式进行编码实现的。但是,针对不同的场景需求,相应的场景需求会不同。因此,针对不同的场景,采用的策略和资源是不同的,例如英文的纠错框架、针对APP端的纠错框架等,均需要独自开发对应的纠错框架。显然,现有的纠错框架无法满足多个场景的需求,不够灵活。
技术实现思路
本专利技术提供一种基于人工智能的查询信息纠错构架生成方法和装置,以解决上述技术问题中的至少一个。本专利技术实施例提供一种基于人工智能的查询信息纠错构架生成方法,包括:获取应用场景信息;根据所述应用场景信息确定纠错需求信息;根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。可选的,如果所述数据库中不包含能够实现对应功能的网络层和/或组件,则建立能够实现对应功能的新网络层和/或新组件。可选的,所述组件包括存储型组件和功能性组件。可选的,所述存储型组件包括通用键值查询组件KVCommonWeight、结果缓存查询组件ResultCacheWeight、变长短语替换表单表组件PhraseTableSingleWeight以及变长短语替换表多表组件PhraseTableConcatWeight。可选的,所述功能性组件包括编辑距离召回组件、归一化组件、切词组件、语言模型组件、注音组件、梯度提升决策树GBDT模型组件、一元错拼模型组件ErrorModel1Weight以及二元错拼模型组件ErrorModel2Weight。可选的,所述网络层包括流程相关网络层和训练测试相关网络层。可选的,所述流程相关网络层包括变量初始化网络层ClearLayer、输入归一化网络层NormLayer、规则确认网络层CheckLayer、分词网络层SegmentLayer、Deepcrf分词层DeepcrfSegmentLayer、预处理层PreprocessLayer、短语替换表单表召回层PtSingleRecallLayer、短语替换表多表召回层PtConcatRecallLayer、错误位置检测层ErrorDetectLayer、拼音编辑距离召回层EdRecallLayer、自身片段召回层SelfRecallLayer、特征抽取层FeatureExtractLayer、模型打分层RankingLayer、贪心搜索层GreedySearchLayer以及束搜索层BeamSearchLayer。可选的,所述训练测试相关网络层包括加载预测语料层LoadPredictCorpusLayer、加载训练语料层LoadTrainCorpusLayer、特征输出层DumpFullFeatureLayer以及短语替换特征输出层DumpPtFeatureLayer。可选的,所述神经元包括查询信息元、候选元、结果元以及指导元。本专利技术另一实施例提供一种基于人工智能的查询信息纠错构架生成装置,包括:获取模块,用于获取应用场景信息;确定模块,用于根据所述应用场景信息确定纠错需求信息;生成模块,用于根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。可选的,建立模块,用于如果所述数据库中不包含能够实现对应功能的网络层和/或组件,则建立能够实现对应功能的新网络层和/或新组件。可选的,所述组件包括存储型组件和功能性组件。可选的,所述存储型组件包括通用键值查询组件KVCommonWeight、结果缓存查询组件ResultCacheWeight、变长短语替换表单表组件PhraseTableSingleWeight以及变长短语替换表多表组件PhraseTableConcatWeight。可选的,所述功能性组件包括编辑距离召回组件、归一化组件、切词组件、语言模型组件、注音组件、梯度提升决策树GBDT模型组件、一元错拼模型组件ErrorModel1Weight以及二元错拼模型组件ErrorModel2Weight。可选的,所述网络层包括流程相关网络层和训练测试相关网络层。可选的,所述流程相关网络层包括变量初始化网络层ClearLayer、输入归一化网络层NormLayer、规则确认网络层CheckLayer、分词网络层SegmentLayer、Deepcrf分词层DeepcrfSegmentLayer、预处理层PreprocessLayer、短语替换表单表召回层PtSingleRecallLayer、短语替换表多表召回层PtConcatRecallLayer、错误位置检测层ErrorDetectLayer、拼音编辑距离召回层EdRecallLayer、自身片段召回层SelfRecallLayer、特征抽取层FeatureExtractLayer、模型打分层RankingLayer、贪心搜索层GreedySearchLayer以及束搜索层BeamSearchLayer。可选的,所述训练测试相关网络层包括加载预测语料层LoadPredictCorpusLayer、加载训练语料层LoadTrainCorpusLayer、特征输出层DumpFullFeatureLayer以及短语替换特征输出层DumpPtFeatureLayer。可选的,所述神经元包括查询信息元、候选元、结果元以及指导元。本专利技术还一实施例提供一种非临时性计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如本专利技术第一方面实施例所述的基于人工智能的查询信息纠错构架生成方法。本专利技术又一实施例提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器用于执行本专利技术第一方面实施例所述的基于人工智能的查询信息纠错构架生成方法。本专利技术实施例提供的技术方案可以包括以下有益效果:通过获取应用场景信息,并根据所述应用场景信息确定纠错需求信息,以及根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架,能够针对不同应用场景,灵活地生成与其相对应的纠错框架,更加符合需求。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:图1是根据本专利技术一个实施例的基于人工智能的查询信息纠错构架生成方法的流程图;图2是根据本专利技术一个实施例的纠错框架关系示意图;图3是一个具体应用场景的生成纠错框架的示意图;图4是根据本专利技术另一个实施例的基于人工智能的查询信息纠错构架生成方法的流程图;图5是根据本专利技术一个实施例的基于人工智能的查询信息纠错构架生成装置的结构框图;图6是根据本专利技术另一个实施例的本文档来自技高网...
基于人工智能的查询信息纠错构架生成方法和装置

【技术保护点】
一种基于人工智能的查询信息纠错构架生成方法,其特征在于,包括:获取应用场景信息;根据所述应用场景信息确定纠错需求信息;根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。

【技术特征摘要】
1.一种基于人工智能的查询信息纠错构架生成方法,其特征在于,包括:获取应用场景信息;根据所述应用场景信息确定纠错需求信息;根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。2.如权利要求1所述的方法,其特征在于,还包括:如果所述数据库中不包含能够实现对应功能的网络层和/或组件,则建立能够实现对应功能的新网络层和/或新组件。3.如权利要求1所述的方法,其特征在于,所述组件包括存储型组件和功能性组件。4.如权利要求3所述的方法,其特征在于,所述存储型组件包括通用键值查询组件KVCommonWeight、结果缓存查询组件ResultCacheWeight、变长短语替换表单表组件PhraseTableSingleWeight以及变长短语替换表多表组件PhraseTableConcatWeight。5.如权利要求3所述的方法,其特征在于,所述功能性组件包括编辑距离召回组件、归一化组件、切词组件、语言模型组件、注音组件、梯度提升决策树GBDT模型组件、一元错拼模型组件ErrorModel1Weight以及二元错拼模型组件ErrorModel2Weight。6.如权利要求1所述的方法,其特征在于,所述网络层包括流程相关网络层和训练测试相关网络层。7.如权利要求6所述的方法,其特征在于,所述流程相关网络层包括变量初始化网络层ClearLayer、输入归一化网络层NormLayer、规则确认网络层CheckLayer、分词网络层SegmentLayer、Deepcrf分词层DeepcrfSegmentLayer、预处理层PreprocessLayer、短语替换表单表召回层PtSingleRecallLayer、短语替换表多表召回层PtConcatRecallLayer、错误位置检测层ErrorDetectLayer、拼音编辑距离召回层EdRecallLayer、自身片段召回层SelfRecallLayer、特征抽取层FeatureExtractLayer、模型打分层RankingLayer、贪心搜索层GreedySearchLayer以及束搜索层BeamSearchLayer。8.如权利要求6所述的方法,其特征在于,所述训练测试相关网络层包括加载预测语料层LoadPredictCorpusLayer、加载训练语料层LoadTrainCorpusLayer、特征输出层DumpFullFeatureLayer以及短语替换特征输出层DumpPtFeatureLayer。9.如权利要求1所述的方法,其特征在于,所述神经元包括查询信息元、候选元、结果元以及指导元。10.一种基于人工智能的查询信息纠错构架生成装置,其特征在于,包括:获取模块,用于获取应用场景信息;确定模块,用于根据所述应用场景信息确定纠错需求信息;生成模块,用于根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层...

【专利技术属性】
技术研发人员:詹金波肖求根邓卓彬郑利群付志宏袁德璋何径舟
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1