信息获取方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号:24756498 阅读:29 留言:0更新日期:2020-07-04 09:14
本申请提供了一种信息获取方法、装置、电子设备及计算机可读存储介质。所述方法包括:调用实体识别模型对获取的待解答问题进行识别处理,得到实体检索词;调用问题分类模型对所述待解答问题进行分类处理,确定所述待解答问题对应的目标问题类别;根据问题类别与查询模板之间的对应关系,获取所述目标问题类别对应的目标查询模板;调用所述目标查询模板根据所述实体检索词在预置数据库中进行信息检索,获取所述实体检索词对应的检索信息。本申请能够提升海量提问的准确率。

Information acquisition method, device, electronic equipment and computer-readable storage medium

【技术实现步骤摘要】
信息获取方法、装置、电子设备及计算机可读存储介质
本申请涉及信息检索
,特别是涉及一种信息获取方法、装置、电子设备及计算机可读存储介质。
技术介绍
知识图谱(KnowledgeGraph)又称为科学知识图谱,在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。为学科研究提供切实的、有价值的参考。当前知识图谱领域的一个重大问题是应用落地,一般分为两个方面:推荐系统和问答系统,问答系统往往需要大量的人工标注,确定其中包含的实体和意图,当前模型仅仅依赖字典和单意图识别的方式是不能够满足知识图谱问答需求的。
技术实现思路
本申请提供一种信息获取方法、装置、电子设备及计算机可读存本文档来自技高网...

【技术保护点】
1.一种信息获取方法,其特征在于,包括:/n调用实体识别模型对获取的待解答问题进行识别处理,得到实体检索词;/n调用问题分类模型对所述待解答问题进行分类处理,确定所述待解答问题对应的目标问题类别;/n根据问题类别与查询模板之间的对应关系,获取所述目标问题类别对应的目标查询模板;/n调用所述目标查询模板根据所述实体检索词在预置数据库中进行信息检索,获取所述实体检索词对应的检索信息。/n

【技术特征摘要】
1.一种信息获取方法,其特征在于,包括:
调用实体识别模型对获取的待解答问题进行识别处理,得到实体检索词;
调用问题分类模型对所述待解答问题进行分类处理,确定所述待解答问题对应的目标问题类别;
根据问题类别与查询模板之间的对应关系,获取所述目标问题类别对应的目标查询模板;
调用所述目标查询模板根据所述实体检索词在预置数据库中进行信息检索,获取所述实体检索词对应的检索信息。


2.根据权利要求1所述的方法,其特征在于,所述实体识别模型通过以下方式训练得到:
获取包含多个问题的问题集合;
对所述问题集合中的多个问题分别进行标注处理,生成标注问题集合;
采用所述标注问题集合对预训练实体识别模型进行实体抽取和词性训练,得到所述实体识别模型。


3.根据权利要求2所述的方法,其特征在于,在所述根据问题类别与查询模板之间的对应关系,获取所述目标问题类别对应的目标查询模板之前,还包括:
对所述标注问题集合中的多个标注问题进行范化处理,生成范化问题集合;
将所述范化问题集合中的多个范化问题进行分类处理,得到多个所述范化问题的问题类别,生成分类问题集合;
根据所述分类问题集合中的多个所述问题类别,编写得到多个所述问题类别对应的查询模板。


4.根据权利要求3所述的方法,其特征在于,所述将所述范化问题集合中的多个范化问题进行分类处理,得到多个所述范化问题的问题类别,生成分类问题集合,包括:
采用预置分类模型对所述多个范化问题进行分类处理,得到置信度大于设定阈值的一级问题类别;
获取所述多个范化问题中置信度小于或者等于所述设定阈值的至少一个范化问题;
对所述至少一个范化问题进行二次分类处理,得到至少一个二级问题类别;
根据所述多个范化问题、所述一级问题类别和所述至少一个二级问题类别,生成所述分类问题集合。


5.根据权利要求1-4任一项所述的方法,其特征在于,所述调用所述目标查询模板根据所述实体检索词在预置数据库中进行信息检索,获取所述实体检索词对应的检索信息,包括:
响应于所述实体检索词有多个,在调用所述目标查询模板根据所述实体检索词在预置数据库中进行信息检索的过程中,在每获得预置个数的检索信息时,...

【专利技术属性】
技术研发人员:梁天新
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1