基于图网络的答案句选择方法及装置制造方法及图纸

技术编号:23625048 阅读:31 留言:0更新日期:2020-03-31 22:46
本发明专利技术涉及自然语言处理技术领域,具体涉及一种基于图网络的答案句选择方法和装置。为了解决现有技术未考虑候选句之间的关联度导致答案选择错误的问题,本发明专利技术提出一种基于图网络的答案句选择方法,该方法包括对预先获取的多个第一句子,分别获取对应的第一向量;根据第一句子和第一向量构建多个第一句子的关系图;基于关系图以及第一向量,通过图网络获取第二向量,其中,图网络基于神经网络构建,第二向量为多个第一句子的上下文信息融合后的向量;基于第二向量,通过问答句预测器从第一句子中选择答案句,其中,问答句预测器用于获取第二向量对应的第一句子的预测分数。利用本发明专利技术的方法能够提高从候选句中选择正确答案的概率。

Method and device of answer sentence selection based on graph network

【技术实现步骤摘要】
基于图网络的答案句选择方法及装置
本专利技术涉及自然语言处理
,具体涉及一种基于图网络的答案句选择方法及装置。
技术介绍
随着社会的发展、科技的进步,人工智能领域近年来取得了快速地发展。在人工智能领域,语言智能更是受到广泛的关注。语言是信息的载体,让机器理解语言也被认为是强人工智能的一个重要体现。问答正是检验机器理解语言能力的一个重要手段,同时问答系统的研究也能直接推动社交、医疗、金融等多个领域的智能化进程。问答句选择是问答任务的一个子任务,同时也是问答系统中重要的组成部分。问答句选择通常是给定一个问题以及多个候选句子,要求系统从多个候选句子中找出能够回答给定问题的答案句。现有的答案句选择任务的候选句有两种构成方式,一种是从不同篇章中抽取多个句子作为候选句,另一种是将一个篇章中的所有句子看作候选句。对于第一种构成方式,候选句之间的关联程度较低,而第二种构成方式中,因为选自同一篇章,所以候选句之间的关联程度较高。传统的答案句选择模型大多忽略了候选句之间的语义关联,通过对每个候选句单独建模,并单独计算每个候选句作为答案本文档来自技高网...

【技术保护点】
1.一种基于图网络的答案句选择方法,所述方法应用于基于图网络的答案句选择装置,所述装置包括问答句预测器,其特征在于,所述方法包括:/n对预先获取的多个第一句子,分别获取对应的第一向量,其中,所述第一句子作为所述答案句的候选句子;/n根据所述第一句子和所述第一向量构建多个所述第一句子的关系图,其中,所述关系图用于获取多个所述第一句子之间的关系;/n基于所述关系图以及所述第一向量,通过所述图网络获取第二向量,其中,所述图网络基于神经网络构建,所述第二向量为多个所述第一句子的上下文信息融合后的向量;/n基于所述第二向量,通过所述问答句预测器从所述第一句子中选择答案句,其中,所述问答句预测器用于获取所...

【技术特征摘要】
1.一种基于图网络的答案句选择方法,所述方法应用于基于图网络的答案句选择装置,所述装置包括问答句预测器,其特征在于,所述方法包括:
对预先获取的多个第一句子,分别获取对应的第一向量,其中,所述第一句子作为所述答案句的候选句子;
根据所述第一句子和所述第一向量构建多个所述第一句子的关系图,其中,所述关系图用于获取多个所述第一句子之间的关系;
基于所述关系图以及所述第一向量,通过所述图网络获取第二向量,其中,所述图网络基于神经网络构建,所述第二向量为多个所述第一句子的上下文信息融合后的向量;
基于所述第二向量,通过所述问答句预测器从所述第一句子中选择答案句,其中,所述问答句预测器用于获取所述第二向量对应的第一句子的预测分数。


2.根据权利要求1所述的方法,其特征在于,所述关系图包括第一关系图和第二关系图;
“根据所述第一向量以及所述第一句子构建所述第一句子的关系图”,其方法包括:
根据所述第一句子并通过第一策略构建所述第一关系图,
根据所述第一向量并通过第二策略构建所述第二关系图,
其中,所述第一策略用于根据所述第一句子并基于第一工具、第二工具以及第三工具构建所述第一关系图,所述第一工具用于连接含有相同实体的第一句子,所述第二工具用于根据所述第一句子之间的距离计算所述第一句子之间的权重,所述第三工具用于计算所述第一句子之间的语义相似度;
所述第二策略用于根据所述第一向量并基于自注意力机制构建所述第二关系图。


3.根据权利要求1所述的方法,其特征在于,“根据所述关系图以及所述第一向量并基于所述图网络获取第二向量”,其方法包括:
根据所述关系图并基于图卷积网络按照如下公式所示的方法更新所述第一向量:



根据更新后的第一向量并基于门控循环单元按照如下公式所示的方法获取所述第二向量:
Hmpge=GRU([H0;Hent;Hdist;Hsimi])
其中,所述H(t+1)表示所述图卷积网络的输出,所述σ表示激活函数,所述表示A的度量矩阵,所述A表示某一句子的关系图,所述H(t)表示所述图卷积网络的输入,所述W(t)表示权重参数,所述Hmpge表示所述第二向量,所述GRU表示门控循环单元,所述H0表示初始第一向量,所述Hent表示根据第一工具构建的关系图更新后的第一向量,所述Hdist表示根据第二工具构建的关系图更新后的第一向量,所述Hsimi表示根据第三工具构建的关系图更新后的第一向量。


4.根据权利要求1所述的方法,其特征在于,“根据所述第二向量并基于所述问答句预测器从所述第一句子中选择答案句”,其方法包括:
根据所述第二向量、所述第一句子并基于所述问答句预测器获取每一个所述第一句子的预测分数,将预测分数最高的第一句子作为所述答案句。


5.根据权利要求4所述的方法,其特征在于,“根据所述第二向量并基于所述问答句预测器获取每一个所述第一句子的预测分数”,其方法包括:
根据所述第二向量并基于所述问答句预测器按照如下公式所示的方法获取每一个所述第一句子的预测分数:
Score=Softmax(MLP(Hmpge))
其中,所述S...

【专利技术属性】
技术研发人员:赵军张元哲刘康田志兴
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1