【技术实现步骤摘要】
一种文本匹配方法、装置、系统以及存储介质
[0001]本专利技术主要涉及语言处理
,具体涉及一种文本匹配方法、装置、系统以及存储介质。
技术介绍
[0002]文本匹配是自然语言处理领域中一项重要且富有挑战性的任务,旨在描述两段文本之间的关系,可以应用于搜索引擎、推荐系统、问答系统等场景。在现有的文本匹配方法中,大多数的文本编码器主要实现文本的通用向量表示,仅仅利用了文本对的纯语义信息,这样的做法忽略了其他可利用的丰富信息,因此导致文本匹配的准确率不够高。
技术实现思路
[0003]本专利技术所要解决的技术问题是针对现有技术的不足,提供一种文本匹配方法、装置、系统以及存储介质。
[0004]本专利技术解决上述技术问题的技术方案如下:一种文本匹配方法,包括如下步骤:
[0005]导入多个句子对以及与各个所述句子对一一对应的关键字信息对和意图信息对,并对各个所述句子对、各个所述句子对所对应的关键字信息对以及意图信息对进行编码,得到各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对;
[0006]根据各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对进行交互向量的分析,得到各个所述句子对的交互向量;
[0007]根据各个所述句子对的交互向量进行得分向量的计算,得到各个所述句子对的多个得分向量;
[0008]根据各个所述句子对的多个得分向量进行文本匹配准确率的分析,得到文本匹配准确率,并将所述文本匹配准确率 ...
【技术保护点】
【技术特征摘要】
1.一种文本匹配方法,其特征在于,包括如下步骤:导入多个句子对以及与各个所述句子对一一对应的关键字信息对和意图信息对,并对各个所述句子对、各个所述句子对所对应的关键字信息对以及意图信息对进行编码,得到各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对;根据各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对进行交互向量的分析,得到各个所述句子对的交互向量;根据各个所述句子对的交互向量进行得分向量的计算,得到各个所述句子对的多个得分向量;根据各个所述句子对的多个得分向量进行文本匹配准确率的分析,得到文本匹配准确率,并将所述文本匹配准确率作为文本匹配的结果。2.根据权利要求1所述的文本匹配方法,其特征在于,所述句子对包括第一句子和第二句子,所述关键字信息对包括与所述第一句子对应的关键字信息以及与所述第二句子对应的关键字信息,所述意图信息对包括与所述第一句子对应的意图信息以及与所述第二句子对应的意图信息;所述对各个所述句子对、各个所述句子对所对应的关键字信息对以及意图信息对进行编码,得到各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对的过程包括:通过文本编码器对各个所述第一句子、各个所述第二句子、各个所述第一句子所对应的关键字信息和意图信息以及各个所述第二句子所对应的关键字信息和意图信息进行编码,对应得到各个所述第一句子的句子原始向量、各个所述第二句子的句子原始向量、各个所述第一句子所对应的关键字向量和意图向量以及各个所述第二句子所对应的关键字向量和意图向量;所述句子对的句子原始向量对包括所述第一句子的句子原始向量和所述第二句子的句子原始向量;所述句子对所对应的关键字向量包括所述第一句子所对应的关键字向量和所述第二句子所对应的关键字向量;所述句子对所对应的意图向量对包括所述第一句子所对应的意图向量和所述第二句子所对应的意图向量。3.根据权利要求2所述的文本匹配方法,其特征在于,所述根据各个所述句子对的句子原始向量对、各个所述句子对所对应的关键字向量对以及意图向量对进行交互向量的分析,得到各个所述句子对的交互向量的过程包括:根据各个所述第一句子的句子原始向量、各个所述第二句子的句子原始向量、各个所述第一句子所对应的关键字向量和意图向量以及各个所述第二句子所对应的关键字向量和意图向量进行聚合分析,得到各个所述第一句子的聚合向量以及各个所述第二句子的聚合向量;对各个所述第一句子的句子原始向量和聚合向量以及各个所述第二句子的句子原始向量和聚合向量进行拼接,对应得到各个所述第一句子的融合向量以及各个所述第二句子的融合向量;
基于第一式,根据各个所述第一句子的融合向量以及各个所述第二句子的融合向量进行交互向量的计算,得到各个所述句子对的交互向量,所述第一式为:output_crossing
i
=CrossingLayer(output_con_a
i
,output_con_b
i
),其中,output_crossing
i
为第i个句子对的交互向量,CrossingLayer()为交叉层函数,output_con_a
i
为第i个第一句子的融合向量,output_con_b
i
为第i个第二句子的融合向量。4.根据权利要求3所述的文本匹配方法,其特征在于,所述根据各个所述第一句子的句子原始向量、各个所述第二句子的句子原始向量、各个所述第一句子所对应的关键字向量和意图向量以及各个所述第二句子所对应的关键字向量和意图向量进行聚合分析,得到各个所述第一句子的聚合向量以及各个所述第二句子的聚合向量的过程包括:根据各个所述第一句子的句子原始向量、各个所述第二句子的句子原始向量、各个所述第一句子所对应的关键字向量和意图向量以及各个所述第二句子所对应的关键字向量和意图向量进行相关系数的计算,得到各个所述第一句子的关键字信息相关系数和意图信息相关系数以及各个所述第二句子的关键字信息相关系数和意图信息相关系数;对各个所述第一句子的关键字信息相关系数和意图信息相关系数以及各个所述第二句子的关键字信息相关系数和意图信息相关系数进行归一化处理,对应得到各个所述第一句子的关键字信息注意力系数和意图信息注意力系数以及各个所述第二句子的关键字信息注意力系数和意图信息注意力系数;基于第二式,根据各个所述第一句子的关键字信息注意力系数和意图信息注意力系数以及各个所述第一句子所对应的关键字向量和意图向量进行第一聚合向量的计算,得到各个所述第一句子的聚合向量,所述第二式为:其中,output_agg_a
i
为第i个第一句子的聚合向量,σ{}为LeakyReLU激活函数,为第i个第一句子的关键字信息注意力系数,output_Kw_a
i
为第i个第一句子所对应的关键字向量,为第i个第一句子的意图信息注意力系数,output_It_a
i
为第i个第一句子所对应的意图向量;基于第三式,根据各个所述第二句子的关键字信息注意力系数和意图信息注意力系数以及各个所述第二句子所对应的关键字向量和意图向量进行第二聚合向量的计算,得到各个所述第二句子的聚合向量,所述第三式为:其中,output_agg_b
i
为第i个第二句子的聚合向量,σ{}为LeakyReLU激活函数,为第...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。