The invention discloses a method and device for creating a query information error correcting frame based on artificial intelligence. Among them, the method of generating query information error correction frame generation based on artificial intelligence includes obtaining application scene information, determining the error correction requirement information according to the application scene information, and selecting the data from the database according to the error correction requirement information. The network layer and / or components of the corresponding functions are combined with neurons to generate query information correction architecture. The method and device for creating a query information error correcting frame based on artificial intelligence in the embodiment of the invention, by obtaining the information of the application scene, and determining the error correction requirement according to the application scene information, and selecting the network layer and / or component that can implement the corresponding function from the database according to the error correction requirement information, and combine the neurons, In order to generate the query information correction framework, it can flexibly generate the corresponding error correction framework for different application scenarios, which is more in line with the demand.
【技术实现步骤摘要】
基于人工智能的查询信息纠错构架生成方法和装置
本专利技术涉及信息处理
,尤其涉及一种基于人工智能的查询信息纠错构架生成方法和装置。
技术介绍
用户在使用搜索引擎进行检索时,经常会输入错误的查询词,比如“清华大学”输入成“情华大学”,或者输入成为“亲华大学”,或者输入成“清华学”。因此,需要搜索引擎能够对错误的查询词进行识别,并对其进行纠错。目前,在对查询词进行纠错时,主要通过先验指导完成错误片段识别,然后提供正确候选片段。上述构架是以固定的方式进行编码实现的。但是,针对不同的场景需求,相应的场景需求会不同。因此,针对不同的场景,采用的策略和资源是不同的,例如英文的纠错框架、针对APP端的纠错框架等,均需要独自开发对应的纠错框架。显然,现有的纠错框架无法满足多个场景的需求,不够灵活。
技术实现思路
本专利技术提供一种基于人工智能的查询信息纠错构架生成方法和装置,以解决上述技术问题中的至少一个。本专利技术实施例提供一种基于人工智能的查询信息纠错构架生成方法,包括:获取应用场景信息;根据所述应用场景信息确定纠错需求信息;根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。可选的,如果所述数据库中不包含能够实现对应功能的网络层和/或组件,则建立能够实现对应功能的新网络层和/或新组件。可选的,所述组件包括存储型组件和功能性组件。可选的,所述存储型组件包括通用键值查询组件KVCommonWeight、结果缓存查询组件ResultCacheWeight、变长短语替换表单表组件PhraseTableSingleWei ...
【技术保护点】
一种基于人工智能的查询信息纠错构架生成方法,其特征在于,包括:获取应用场景信息;根据所述应用场景信息确定纠错需求信息;根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。
【技术特征摘要】
1.一种基于人工智能的查询信息纠错构架生成方法,其特征在于,包括:获取应用场景信息;根据所述应用场景信息确定纠错需求信息;根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层和/或组件,结合神经元,以生成查询信息纠错构架。2.如权利要求1所述的方法,其特征在于,还包括:如果所述数据库中不包含能够实现对应功能的网络层和/或组件,则建立能够实现对应功能的新网络层和/或新组件。3.如权利要求1所述的方法,其特征在于,所述组件包括存储型组件和功能性组件。4.如权利要求3所述的方法,其特征在于,所述存储型组件包括通用键值查询组件KVCommonWeight、结果缓存查询组件ResultCacheWeight、变长短语替换表单表组件PhraseTableSingleWeight以及变长短语替换表多表组件PhraseTableConcatWeight。5.如权利要求3所述的方法,其特征在于,所述功能性组件包括编辑距离召回组件、归一化组件、切词组件、语言模型组件、注音组件、梯度提升决策树GBDT模型组件、一元错拼模型组件ErrorModel1Weight以及二元错拼模型组件ErrorModel2Weight。6.如权利要求1所述的方法,其特征在于,所述网络层包括流程相关网络层和训练测试相关网络层。7.如权利要求6所述的方法,其特征在于,所述流程相关网络层包括变量初始化网络层ClearLayer、输入归一化网络层NormLayer、规则确认网络层CheckLayer、分词网络层SegmentLayer、Deepcrf分词层DeepcrfSegmentLayer、预处理层PreprocessLayer、短语替换表单表召回层PtSingleRecallLayer、短语替换表多表召回层PtConcatRecallLayer、错误位置检测层ErrorDetectLayer、拼音编辑距离召回层EdRecallLayer、自身片段召回层SelfRecallLayer、特征抽取层FeatureExtractLayer、模型打分层RankingLayer、贪心搜索层GreedySearchLayer以及束搜索层BeamSearchLayer。8.如权利要求6所述的方法,其特征在于,所述训练测试相关网络层包括加载预测语料层LoadPredictCorpusLayer、加载训练语料层LoadTrainCorpusLayer、特征输出层DumpFullFeatureLayer以及短语替换特征输出层DumpPtFeatureLayer。9.如权利要求1所述的方法,其特征在于,所述神经元包括查询信息元、候选元、结果元以及指导元。10.一种基于人工智能的查询信息纠错构架生成装置,其特征在于,包括:获取模块,用于获取应用场景信息;确定模块,用于根据所述应用场景信息确定纠错需求信息;生成模块,用于根据所述纠错需求信息从数据库中选取能够实现对应功能的网络层...
【专利技术属性】
技术研发人员:詹金波,肖求根,邓卓彬,郑利群,付志宏,袁德璋,何径舟,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。