【技术实现步骤摘要】
本专利技术涉及基于检索增强和知识蒸馏的汉越跨语言查询扩展方法,属于自然语言处理。
技术介绍
1、汉越跨语言查询扩展旨在增加与中文查询语句语义相同的术语和概念,并将扩展后的中文查询语句转换为越南语查询语句。汉越跨语言查询扩展是解决查询主题漂移、词不匹配等问题的核心技术之一。同时,有效的汉越跨语言查询扩展为汉越跨语言问答、汉越跨语言信息检索等下游任务提供了坚实的基础。
2、本专利技术涉及一种特定的跨语言查询扩展技术,即汉越跨语言查询扩展。近年来,该
已取得了显著的研究进展,主流方法涵盖基于机器翻译的技术、基于多语言预训练语言模型的方法,以及运用大语言模型生成的方法。在基于机器翻译的方法中,通过神经机器翻译技术,原始查询语句被转换成目标语言,随后根据翻译后的内容实施查询扩展。然而,该方法的效能深受机器翻译准确度的影响。对于资源丰富的语言,由于翻译误差相对较小,其效果较为理想;但对于如越南语等低资源语言,可能会因翻译不准确而影响扩展后的检索效果。为了解决上述问题,有研究者提出了基于多语言预训练语言模型的方法。此方法的核心理念是 ...
【技术保护点】
1.基于检索增强和知识蒸馏的汉越跨语言查询扩展方法,其特征在于:所述基于检索增强和知识蒸馏的汉越跨语言查询扩展方法的具体步骤如下:
2.根据权利要求1所述的基于检索增强和知识蒸馏的汉越跨语言查询扩展方法,其特征在于:所述Step1的具体步骤为:
3.根据权利要求2所述的基于检索增强和知识蒸馏的汉越跨语言查询扩展方法,其特征在于:所述Step2包括三个新的查询扩展任务模块:思维链生成模块、检索增强模块和跨语言查询扩展模块;具体步骤为:
4.根据权利要求3所述的基于检索增强和知识蒸馏的汉越跨语言查询扩展方法,其特征在于:所述步骤Step
...【技术特征摘要】
1.基于检索增强和知识蒸馏的汉越跨语言查询扩展方法,其特征在于:所述基于检索增强和知识蒸馏的汉越跨语言查询扩展方法的具体步骤如下:
2.根据权利要求1所述的基于检索增强和知识蒸馏的汉越跨语言查询扩展方法,其特征在于:所述step1的具体步骤为:
3.根据权利要求2所述的基于检索增强和知识蒸馏的汉越跨语言查询扩展方法,其特征在于:所述step2包括三个新的查询扩展任务模块:思维链生成模块、检索增强模块和跨语言查询扩展模块;具体步骤为:
4.根据权利要求3所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。