【技术实现步骤摘要】
文本匹配、文本匹配模型训练、文本预测方法以及装置
[0001]本说明书实施例涉及计算机
,特别涉及一种文本匹配方法。本说明书一个或者多个实施例同时涉及一种文本匹配模型训练方法,一种文本预测方法,一种文本匹配装置,一种文本匹配模型训练装置,一种文本预测装置,一种计算设备,一种计算机可读存储介质以及一种计算机程序。
技术介绍
[0002]随着计算机技术的发展,越来越多的工作和学习任务可以自动化处理,计算机技术已经逐步应用于各种日常的教育、学习活动中,例如利用计算机技术对文本进行匹配预测,从而大大节省人力资源。
[0003]目前,通常由人工对待匹配文本进行处理,获得相应的匹配结果。然而由于待匹配文本的数量是海量的,人工处理效率极低。并且,人工势必会引入大量不确定因素,导致待匹配文本的匹配结果准确度极差。因此,亟需一种高效、准确的文本匹配方案。
技术实现思路
[0004]有鉴于此,本说明书实施例提供了一种文本匹配方法。本说明书一个或者多个实施例同时涉及一种文本匹配模型训练方法,一种文本预测方法,一种文本 ...
【技术保护点】
【技术特征摘要】
1.一种文本匹配方法,包括:获取初始文本对;利用引导模板,对所述初始文本对进行格式转换,获得符合所述引导模板对应文本格式的转换文本;合并所述转换文本和预设提示文本,生成待识别文本,其中,所述预设提示文本包括掩码字符,所述掩码字符为对表征是否匹配的字符进行掩码得到;根据所述待识别文本,对所述掩码字符进行预测,获得所述初始文本对的文本匹配结果。2.根据权利要求1所述的方法,所述利用引导模板,对所述初始文本对进行格式转换,获得符合所述引导模板对应文本格式的转换文本的步骤之前,还包括:识别所述初始文本对的文本类型;根据所述文本类型,确定所述初始文本对对应的引导模板。3.根据权利要求1所述的方法,所述引导模板包括第一子模板和第二子模板;所述利用引导模板,对所述初始文本对进行格式转换,获得符合所述引导模板对应文本格式的转换文本的步骤,包括:识别所述初始文本对的文本属性,确定所述初始文本对中具有第一文本属性的第一子文本和具有第二文本属性的第二子文本;将所述第一子文本填充至所述第一子模板,并将所述第二子文本填充至所述第二子模板,获得符合所述引导模板对应文本格式的转换文本。4.根据权利要求2所述的方法,所述文本类型包括问答类型,所述引导模板包括问题子模板和答案子模板;所述利用引导模板,对所述初始文本对进行格式转换,获得符合所述引导模板对应文本格式的转换文本的步骤,包括:识别所述初始文本对的文本属性,确定所述初始文本对中的问题文本以及答案文本;将所述问题文本填充至所述问题子模板,并将所述答案文本填充至所述答案子模板,获得符合所述引导模板对应文本格式的多个转换文本。5.根据权利要求1所述的方法,所述根据所述待识别文本,对所述掩码字符进行预测,获得所述初始文本对的文本匹配结果的步骤,包括:将所述待识别文本输入预先训练的文本匹配模型,经所述文本匹配模型,对所述掩码字符进行预测,获得所述初始文本对的文本匹配结果。6.一种文本匹配模型训练方法,包括:获取样本集,其中,所述样本集包括多组样本文本对;利用引导模板,分别对各样本文本对进行格式转换,获得符合所述引导模板对应文本格式的多个转换样本文本;获取针对各样本文本对的提示文本,其中,所述提示文本包括表征所述样本文本对是否匹配的匹配字符;对所述提示文本中的匹配字符进行掩码,获得多个掩码训练样本;合并各转换样本文本和所述各转换样本文本对应的掩码训练样本,获得多个训练样本;利用所述多个训练样本,对掩码语言模型进行训练,获得完成训练的文本匹配模型。
7.根据权利要求6所述的方法,所述引导模板包括第一子模板和第二子模板;所述利用引导模板,分别对各样本文本对进行格式转换,获得符合所述引导模板对应文本格式的多个转换样本文本的步骤之后,还包括:根据所述第一子模板和所述第二子模板,分别确定各转换样本文本中与所述第一子模板对应的第一转换样本子文本,以及与所述第二子模板对应的第二转换样本子文本;按照预设掩码比例,分别对所述第一转换样本子文本和/或所述第二转换样本子文本进行掩码,获得多个掩码后的转换样本文本;所述合并各转换...
【专利技术属性】
技术研发人员:李鹤,
申请(专利权)人:阿里巴巴中国有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。