当前位置: 首页 > 专利查询>内蒙古大学专利>正文

知识库问答方法、电子设备及可读存储介质技术

技术编号:31023663 阅读:30 留言:0更新日期:2021-11-30 03:20
本发明专利技术公开了一种知识库问答方法、电子设备及可读存储介质,包括以下步骤:步骤1,面向特定领域构建语料库;步骤2,训练MA

【技术实现步骤摘要】
知识库问答方法、电子设备及可读存储介质


[0001]本专利技术属于信息处理
,特别是涉及一种知识库问答方法、电子设备及可读存储介质。

技术介绍

[0002]自动问答主要包括基于传统搜索引擎的问答、基于社区的问答和基于知识库的问答,知识库实现了对客观世界从字符串描述到结构化的语言描述,反映了客观世界的知识映射,因其更加精确的回答,得到了研究者们的广泛关注,也成为了目前问答系统最主要的方式;目前,已经有一些面向英语和汉语的大规模知识库,如Freebase、YAGO、DBpedia、百度知心和搜狗知立方等,知识库的构建取决于实体的识别和关系的抽取,实体识别有基于规则的和基于统计的,基于统计的有最大熵、条件随机场以及神经网络的方法,其中基于神经网络的性能最好,关系抽取主要包括基于模式匹配的和基于统计的,比较有代表性的有:车万翔等人提出的基于特征向量的SVM方法、陈宇等人提出的基于深度信念网络的关系抽取方法、甘丽新等人提出的基于句法语义特征的实体关系抽取方法。
[0003]随着深度学习技术的飞速发展,越来越多的研究者开始将目光转向利用深度神本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.知识库问答方法,其特征在于,包括以下步骤:步骤1,采集领域相关的用户问题及其涉及的领域标识构成语料库,所述语料库还包括所述用户问题的扩展问题和对应的答案;步骤2,训练MA

B模型,对预处理后的待回答问题q进行分类,获得待回答问题q的领域标识;步骤3,从语料库中抽取领域标识与待回答问题q相同的用户问题Q,训练BERT模型,分别提取待回答问题q与各用户问题Q的语义特征表示,计算待回答问题q与各用户问题Q的相似性分数;步骤4,基于相似性分数确定待回答问题q的相似问题,将相似问题对应的答案作为候选答案A;步骤5,计算各候选答案A与待回答问题q的相关性分数,确定与待回答问题q最接近的相似问题,将其对应的答案作为最终答案输出。2.根据权利要求1所述的知识库问答方法,其特征在于,所述领域标识包括贪污受贿类、债券债务类、劳动纠纷类、刑事辩护类、合同纠纷类、侵权类、劳动法、行政诉讼类、建设工程类、法律法规类。3.根据权利要求1所述的知识库问答方法,其特征在于,所述MA

B模型包括依次连接的输入层、BiLSTM层、多头注意力机制和分类层;所述输入层用于输入待回答问题的字符嵌入和语素嵌入;所述BiLSTM层用于提取输入序列的上下文信息;所述多头注意力机制用于对上下文信息进行多self attention计算,并将计算结果拼接获得待回答问题的特征表示;所述分类层用于对特征表示进行分类获得待回答问题的领域标识。4.根据权利要求1所述的知识库问答方法,其特征在于,所述预处理包括对待回答问题的文本进行分句,清洗无效数据和HTML标...

【专利技术属性】
技术研发人员:王炜华飞龙王广义李彬高光来
申请(专利权)人:内蒙古大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1