文本匹配方法、装置、设备及存储介质制造方法及图纸

技术编号:29789947 阅读:26 留言:0更新日期:2021-08-24 18:08
本申请公开了一种文本匹配方法、装置、设备及存储介质,所述方法包括:在进行文本匹配时,先将待匹配文本输入至预训练模型中,得到待匹配文本对应的第一向量表示,并根据待匹配文本中词汇之间的依存关系,确定的待匹配文本对应的第二向量表示,再结合第一向量和第二向量表示共同确定待匹配文本对应的目标向量表示,充分考虑到了待匹配文本中词汇之间的依存关系,提高了用于描述待匹配文本的向量表示的准确度;这样再根据准确度较高的目标向量表示,确定待匹配文本的匹配结果,提高了文本匹配结果的准确度。

【技术实现步骤摘要】
文本匹配方法、装置、设备及存储介质
本申请涉及数据处理
,尤其涉及一种文本匹配方法、装置、设备及存储介质。
技术介绍
文本匹配在越来越多的领域内都得到的广泛的应用,例如,智能问答领域或者文本领域。现有技术中,在进行文本匹配时,先在待匹配文本的首位增加CLS标志位,并将增加后的待匹配文本输入至预训练模型,并将预训练模型输出结果中最后一层CLS标志位的向量,确定为用于描述该待匹配文本的目标向量,再计算该目标向量与预先存储的文本对应的向量之间的相似度,从而根据相似度确定该待匹配文本与数据库中的文本是否匹配。但是,采用现有的匹配方法,将预训练模型输出结果中最后一层CLS标志位的向量,确定为用于描述该待匹配文本的目标向量,会导致文本匹配的准确度较低。
技术实现思路
本申请的主要目的在于提供一种文本匹配方法、装置、设备及存储介质,旨在提高文本匹配的准确度。为实现上述目的,本申请提供了一种文本匹配方法,所述文本匹配方法包括:获取待匹配文本。将所述待匹配文本输入至预训练模型中,得到所述待匹配文本对应的第一向量表示,并根据所述待匹配文本中词汇之间的依存关系,确定所述待匹配文本对应的第二向量表示。根据所述第一向量表示和所述第二向量表示,确定所述待匹配文本对应的目标向量表示。根据所述目标向量表示,确定所述待匹配文本的匹配结果。在一种可能的实现方式中,所述根据所述待匹配文本中词汇之间的依存关系,确定所述待匹配文本对应的第二向量表示,包括:将所述待匹配文本输入至预先训练的依存句法分析模型中,得到所述待匹配文本中词汇之间的依存关系。根据所述待匹配文本中词汇之间的依存关系,确定所述待匹配文本中的至少一个核心词汇。根据所述至少一个核心词汇中,各核心词汇对应的向量表示,确定所述第二向量表示。在一种可能的实现方式中,所述核心词汇的数量为至少两个,所述根据所述至少一个核心词汇中,各核心词汇对应的向量表示,确定所述第二向量表示,包括:对所述各核心词汇对应的向量表示进行加权平均;将加权平均结果确定为所述第二向量表示。在一种可能的实现方式中,所述根据所述第一向量表示和所述第二向量表示,确定所述待匹配文本对应的目标向量表示,包括:对所述第一向量表示和所述第二向量表示进行拼接处理,得到拼接处理后的向量表示。将所述拼接处理后的向量表示,确定为所述目标向量表示。在一种可能的实现方式中,所述将所述待匹配文本输入至预训练模型中,得到所述待匹配文本对应的第一向量表示,包括:将所述待匹配文本输入至所述预训练模型中,得到所述待匹配文本对应的输出结果。对所述输出结果中最后两层的向量进行加权平均,得到所述第一向量表示。在一种可能的实现方式中,所述根据所述目标向量表示,确定所述待匹配文本的匹配结果,包括:确定所述目标向量表示和预设文本对应的预设向量表示之间的余弦相似度。根据所述余弦相似度确定所述待匹配文本的匹配结果;其中,所述匹配结果包括所述待匹配文本与所述预设文本匹配;或者,所述待匹配文本与所述预设文本不匹配。在一种可能的实现方式中,所述方法还包括:若所述匹配结果为所述待匹配文本与所述预设文本匹配,则确定所述预设文本对应的响应信息。输出所述响应信息。本申请还提供了一种文本匹配装置,该文本匹配装置可以包括:获取单元,用于获取待匹配文本。处理单元,用于将所述待匹配文本输入至预训练模型中,得到所述待匹配文本对应的第一向量表示,并根据所述待匹配文本中词汇之间的依存关系,确定所述待匹配文本对应的第二向量表示。确定单元,用于根据所述第一向量表示和所述第二向量表示,确定所述待匹配文本对应的目标向量表示,并根据所述目标向量表示,确定所述待匹配文本的匹配结果。本申请还提供了一种电子设备,所述电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的文本匹配程序,所述文本匹配程序被所述处理器执行时实现如上述第一方面任一种可能的实现方式所述的文本匹配方法的步骤。本申请还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有文本匹配程序,所述文本匹配程序被处理器执行时实现如上述第一方面任一种可能的实现方式所述的文本匹配方法的步骤。本申请还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述第一方面任一种可能的实现方式所述的文本匹配方法。本申请中,在进行文本匹配时,先将待匹配文本输入至预训练模型中,得到待匹配文本对应的第一向量表示,并根据待匹配文本中词汇之间的依存关系,确定的待匹配文本对应的第二向量表示,再结合第一向量和第二向量表示共同确定待匹配文本对应的目标向量表示,充分考虑到了待匹配文本中词汇之间的依存关系,提高了用于描述待匹配文本的向量表示的准确度;这样再根据准确度较高的目标向量表示,确定待匹配文本的匹配结果,提高了文本匹配结果的准确度。附图说明图1为本申请实施例提供的一种应用场景的框架示意图;图2为本申请实施例提供的一种文本匹配方法的流程示意图;图3为本申请实施例提供的一种确定待匹配文本对应的第二向量表示的方法的流程示意图;图4为本申请实施例提供的一种文本匹配装置的结构示意图;图5为本申请实施例提供的一种电子设备的结构示意图。本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。本申请实施例提供的文本匹配方法可以应用于智能语音问答场景、也可以应用于文本匹配场景。以应用于智能语音问答场景为例,例如,用户对着智能设备输入“您好,请问明天天气如何?”,若智能设备具有足够的计算能力,则在采集到用户输入的语音信息后,可以先将语音信息转换为文本信息,并以该文本信息作为匹配依据,从问答库中查找与该语音信息匹配的预设文本信息,若通过文本匹配,确定问答库中存在预设文本信息“明天天气怎么样”,则将该预设文本信息对应的响应消息,即预设文本信息“明天天气怎么样”对应的答案“明天天气晴朗,适合户外活动”,并将答案“明天天气晴朗,适合户外活动”输出给用户,以完成本次的语音问答操作。可以理解的是,若智能设备的计算能力较弱,则在将语音信息转换为文本信息后,可以将该文本信息作为匹配依据,发送给用于进行文本匹配等操作的电子设备,例如,终端或者服务器,示例的,请参见图1所示,图1为本申请实施例提供的一种应用场景的框架示意图,电子设备从问答库中查找与该语音信息匹配的预设文本信息,若通过文本匹配,确定问答库中存在预设文本信息“明天天气怎么样”,则将预设文本信息“明本文档来自技高网...

【技术保护点】
1.一种文本匹配方法,其特征在于,包括:/n获取待匹配文本;/n将所述待匹配文本输入至预训练模型中,得到所述待匹配文本对应的第一向量表示,并根据所述待匹配文本中词汇之间的依存关系,确定所述待匹配文本对应的第二向量表示;/n根据所述第一向量表示和所述第二向量表示,确定所述待匹配文本对应的目标向量表示;/n根据所述目标向量表示,确定所述待匹配文本的匹配结果。/n

【技术特征摘要】
1.一种文本匹配方法,其特征在于,包括:
获取待匹配文本;
将所述待匹配文本输入至预训练模型中,得到所述待匹配文本对应的第一向量表示,并根据所述待匹配文本中词汇之间的依存关系,确定所述待匹配文本对应的第二向量表示;
根据所述第一向量表示和所述第二向量表示,确定所述待匹配文本对应的目标向量表示;
根据所述目标向量表示,确定所述待匹配文本的匹配结果。


2.根据权利要求1所述的方法,其特征在于,所述根据所述待匹配文本中词汇之间的依存关系,确定所述待匹配文本对应的第二向量表示,包括:
将所述待匹配文本输入至预先训练的依存句法分析模型中,得到所述待匹配文本中词汇之间的依存关系;
根据所述待匹配文本中词汇之间的依存关系,确定所述待匹配文本中的至少一个核心词汇;
根据所述至少一个核心词汇中,各核心词汇对应的向量表示,确定所述第二向量表示。


3.根据权利要求2所述的方法,其特征在于,所述核心词汇的数量为至少两个,所述根据所述至少一个核心词汇中,各核心词汇对应的向量表示,确定所述第二向量表示,包括:
对所述各核心词汇对应的向量表示进行加权平均;
将加权平均结果确定为所述第二向量表示。


4.根据权利要求1-3任一项所述的方法,其特征在于,所述根据所述第一向量表示和所述第二向量表示,确定所述待匹配文本对应的目标向量表示,包括:
对所述第一向量表示和所述第二向量表示进行拼接处理,得到拼接处理后的向量表示;
将所述拼接处理后的向量表示,确定为所述目标向量表示。


5.根据权利要求1-3任一项所述的方法,其特征在于,所述将所述待匹配文本输入至预训练模型中,得到所述待匹配文本对应的第一向量表示,包括:
将所述待匹配文本输入至所述预训练模型中,得到所述待匹配文本对应的输出结果;
...

【专利技术属性】
技术研发人员:周楠楠汤耀华杨海军徐倩
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1