【技术实现步骤摘要】
基于BERT模型的智能问答方法、装置及相关设备
[0001]本申请涉及人工智能
,具体涉及一种基于BERT模型的智能问答方法、装置及相关设备。
技术介绍
[0002]自动问答系统是自然语言处理领域中一个非常重要的研究热点,具有重大的应用价值,传统的技术将自然语言问题翻译成一个类似SQL的数据库查询语句,然后执行该SQL查询语句以提供答案。
[0003]然而,该方法通常需要大量的数据工程来生成数据库查询语句,并且很难扩展到任意的表格或问题上,导致问题答案反馈效率低。
技术实现思路
[0004]鉴于以上内容,有必要提出一种基于BERT模型的智能问答方法、装置及相关设备,通过将第三词嵌入向量输入至预先训练好的BERT模型中,得到目标问题的答案,提高了智能问答答案的反馈效率。
[0005]本申请的第一方面提供一种基于BERT模型的智能问答方法,所述方法包括:
[0006]响应于接收的智能问答请求,获取标识有聚合操作的目标问题及所述目标问题的关联表;
[0007]获取所述目标问题的
【技术保护点】
【技术特征摘要】
1.一种基于BERT模型的智能问答方法,其特征在于,所述方法包括:响应于接收的智能问答请求,获取标识有聚合操作的目标问题及所述目标问题的关联表;获取所述目标问题的第一词嵌入向量;获取所述关联表的第二词嵌入向量;对所述第一词嵌入向量和第二词嵌入向量进行拼接,得到第三词嵌入向量;将所述第三词嵌入向量输入至预先训练好的BERT模型中,输出每个聚合操作的概率值和所述关联表的每个单元格的概率值;根据多个聚合操作的概率值和多个单元格的概率值,获取所述目标问题的答案。2.如权利要求1所述的基于BERT模型的智能问答方法,其特征在于,所述获取所述目标问题的第一词嵌入向量包括:对所述目标问题进行分词处理,得到每个词的词编码;获取每个词在所述目标问题中的位置编码;获取每个词的句子标号编码和秩排序编码;获取每个词的列编码和行编码;将所述词编码、所述位置编码、所述句子标号编码叠、所述列编码、所述行编码和所述秩排序编码叠加形成第一词嵌入向量。3.如权利要求1所述的基于BERT模型的智能问答方法,其特征在于,所述获取所述关联表的第二词嵌入向量包括:将所述关联表划分为表头文本和表格文本;分别对所述表头文本和表格文本进行分词处理,得到每个词的词编码、位置编码、句子标号编码、列编码、行编码和秩排序编码;将所述表头文本对应的所述词编码、所述位置编码、所述句子标号编码、所述列编码、所述行编码和所述秩排序编码叠加形成第一子嵌入向量;将所述表格文本对应的所述词编码、所述位置编码、所述句子标号编码、所述列编码、所述行编码和所述秩排序编码叠加形成第二子嵌入向量;将所述第一子嵌入向量和所述第二子嵌入向量进行拼接,得到第二词嵌入向量。4.如权利要求1所述的基于BERT模型的智能问答方法,其特征在于,在将所述第三词嵌入向量输入至预先训练好的BERT模型中,输出每个聚合操作的概率值和所述关联表的每个单元格的概率值之前,所述方法还包括:创建预训练BERT模型,其中,所述预训练BERT模型中包括词嵌入层、位置嵌入层、句子标号嵌入层、列索引嵌入层、行索引嵌入层和秩排序嵌入层,所述BERT模型的第一标记输出位置连接有softmax输出层;从预设的数据源中获取带有聚合操作标识的历史问题集及每个历史问题的关联表;将所述历史问题集和所述历史问题集的关联表作为训练集;基于所述训练集训练所述预训练BERT模型,得到BERT模型。5.如权利要求4所述的基于BERT模型的智能问答方法,其特征在于,所述将所述历史问题集和所述历史问题集的关联表作为训练集包括:获取每个历史问题及每个历史问题的关联表;
从每个历史问题中随机选取预设数量的单词片...
【专利技术属性】
技术研发人员:姜鹏,谯轶轩,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。