【技术实现步骤摘要】
一种基于深度学习的开放域问答预测方法
[0001]本专利技术涉及自然语言处理领域,尤其是涉及一种基于深度学习的开放域问答预测方法。
技术介绍
[0002]机器阅读理解(MRC)旨在教机器阅读和理解人类语言,这是自然语言理解(NLP)领域的长期目标,随着深度学习的蓬勃发展,机器阅读理解任务也取得了极大的突破。
[0003]类似IBM的DeepQA这样的大型QA系统依赖与多个知识源来回答问题,除了维基百科,它还使用了知识库(knowledge base),新闻以及图书等,但是这样的系统过度依赖冗余的信息来正确回答问题。
技术实现思路
[0004]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于深度学习的开放域问答预测方法。
[0005]本专利技术的目的可以通过以下技术方案来实现:
[0006]一种基于深度学习的开放域问答预测方法,该方法包括以下步骤:
[0007]S1:获取维基百科训练语料并对其建立索引;
[0008]S2:根据问题通过检索获得相关性最高的多 ...
【技术保护点】
【技术特征摘要】
1.一种基于深度学习的开放域问答预测方法,其特征在于,该方法包括以下步骤:S1:获取维基百科训练语料并对其建立索引;S2:根据问题通过检索获得相关性最高的多篇文章,并切分成段落,最终输出多个得分最高的段落;S3:使用SQuAD数据集训练一个机器阅读理解模型;S4:以多个得分最高的段落以及问题作为输入,通过机器阅读理解模型预测答案在段落中的起始位置和结束位置。2.根据权利要求1所述的一种基于深度学习的开放域问答预测方法,其特征在于,所述的步骤S1具体包括以下步骤:S11:获取维基百科语料作为知识库;S12:对维基百科语料进行分词预处理;S13:对维基百科文章建立索引。3.根据权利要求1所述的一种基于深度学习的开放域问答预测方法,其特征在于,所述的步骤S2中,根据问题从维基百科的文章中检索获得相关性最高的5篇文章。4.根据权利要求1所述的一种基于深度学习的开放域问答预测方法,其特征在于,所述的步骤S2具体包括以下步骤:S21:对问题进行预处理,得到问题的bag-of-words信息;S22:通过TF-IDF算法在建完索引的数据库中检索出相关性最高的5篇文章。5.根据权利要求1所述的一种基于深度学习的开放域问答预测方法,其特征在于,所述的步骤S3具体包括以下步骤:S31:段落编码:首次将段落p中的每一个段落token p
i
表示为一个特征向量并且其作为多层LSTM网络的输入,则有:其中,下标m为段落token的总数;S32:问题编码:以问题的每一个问题token q
i
的词向量作为另一个LSTM网络输入,并且将隐藏单元拼接成一个向量{q1,...,q
l
}
→
q,通过q=∑
j
b
j
q
j
计算得到问题的编码,其中,b
j
为问题中第j个词的重要程度。6.根据权利要求5所述的一种基于深度学习的开放域问答预测方法,其特征在于,所述的步骤S32中,问题中第j个词的重要程度b
j
的计算...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。