信息查询方法和信息生成模型的训练方法、装置制造方法及图纸

技术编号：37435872 阅读：8 留言：0更新日期：2023-05-06 09:07

本公开提供了一种信息查询方法和信息生成模型的训练方法、装置，涉及人工智能领域，具体涉及深度学习和自然语言处理等技术领域，可应用于智能搜索、智能查询和智能对话等场景。信息查询方法的具体实现方案为：采用第一预训练语言模型对查询文本进行处理，生成与查询文本对应的预测答复文本；采用第二预训练语言模型对预测答复文本进行处理，生成与预测答复文本对应的定位标识信息；以及确定预定文本库中与定位标识信息具有映射关系的目标文本，作为根据查询文本查询得到的答复文本。根据查询文本查询得到的答复文本。根据查询文本查询得到的答复文本。

全部详细技术资料下载

【技术实现步骤摘要】
信息查询方法和信息生成模型的训练方法、装置

[0001]本公开涉及人工智能领域，具体涉及深度学习和自然语言处理等
，可应用于智能搜索、智能查询和智能对话等场景。

技术介绍

[0002]随着计算机技术和电子技术的发展，深度学习技术在自然语言处理等领域得到了广泛应用。预训练语言模型(Pre
‑
trained Language Model，简称为PLM)通过从大规模语料学习普适性的语义表征，可以在应用于不同下游应用时仅进行微调，而无需大量训练，提高了深度学习技术的应用便利性。

技术实现思路

[0003]本公开旨在提供一种可解释性高且能充分利用语义信息的信息查询方法和信息生成模型的训练方法、装置、设备、介质。
[0004]根据本公开的第一方面，提供了一种信息查询方法，包括：采用第一预训练语言模型对查询文本进行处理，生成与查询文本对应的预测答复文本；采用第二预训练语言模型对预测答复文本进行处理，生成与预测答复文本对应的定位标识信息；以及确定预定文本库中与定位标识信息具有映射关系的目标文本，作为根据查询文本查询得到的答复文本。
[0005]根据本公开的第二方面，提供了一种信息生成模型的训练方法，其中，信息生成模型包括第一预训练语言子模型和第二预训练语言子模型，训练方法包括：采用第一训练样本对第一预训练语言子模型进行训练；每个第一训练样本包括预定文本库中的目标文本及与目标文本对应的查询文本；以及采用第二训练样本对第二预训练语言子模型进行训练；每个第二训练样本包括目标文本及与目...

【技术保护点】

【技术特征摘要】
1.一种信息查询方法，包括：采用第一预训练语言模型对查询文本进行处理，生成与查询文本对应的预测答复文本；采用第二预训练语言模型对所述预测答复文本进行处理，生成与所述预测答复文本对应的定位标识信息；以及确定预定文本库中与所述定位标识信息具有映射关系的目标文本，作为根据所述查询文本查询得到的答复文本。2.根据权利要求1所述的方法，其中，所述采用第一预训练语言模型对查询文本进行处理，生成与查询文本对应的预测答复文本包括：将所述预测答复文本中的在前文本单元和所述查询文本的文本单元序列输入所述第一预训练语言模型，生成与所述预测答复文本中的当前文本单元对应的概率向量；所述概率向量包括多个预定文本单元分别为所述当前文本单元的概率值；以及采用束搜索的方法，根据所述概率向量更新所述在前文本单元，以生成与所述查询文本对应的多个预测答复文本，其中，所述在前文本单元的初始值为空值。3.根据权利要求2所述的方法，其中，所述将所述预测答复文本中的在前文本单元和所述查询文本的文本单元序列输入所述第一预训练语言模型，生成与所述预测答复文本中的当前文本单元对应的概率向量包括：响应于所述在前文本单元包括的文本单元的数量小于预定数量，将所述在前文本单元和所述文本单元序列输入所述第一预训练语言模型，生成与所述预测答复文本中的当前文本单元对应的概率向量。4.根据权利要求2所述的方法，其中，所述采用第二预训练语言模型对所述预测答复文本进行处理，生成与所述预测答复文本对应的定位标识信息包括：采用所述第二预训练语言模型对多个所述预测答复文本中的每个文本进行处理，生成与多个所述预测答复文本分别对应的多个定位标识信息。5.根据权利要求3所述的方法，还包括：采用第一预训练语言模型对查询文本进行处理，生成表示所述预测答复文本的主题信息的文本；其中，所述采用第二预训练语言模型对所述预测答复文本进行处理，生成与所述预测答复文本对应的定位标识信息包括：将表示所述主题信息的文本和所述预测答复文本输入所述第二预训练语言模型，生成与所述预测答复文本对应的定位标识信息。6.一种信息生成模型的训练方法，其中，所述信息生成模型包括第一预训练语言子模型和第二预训练语言子模型；所述方法包括：采用第一训练样本对所述第一预训练语言子模型进行训练；每个所述第一训练样本包括预定文本库中的目标文本及与所述目标文本对应的查询文本；以及采用第二训练样本对所述第二预训练语言子模型进行训练；每个所述第二训练样本包括所述目标文本及与所述目标文本具有映射关系的定位标识信息。7.根据权利要求6所述的方法，还包括：
根据所述预定文本库中所述目标文本的数量，确定所述第一预训练语言子模型和所述第二预训练语言子模型的网络结构，其中，所述网络结构包括的网络参数的数量与所述预定文本库中所述目标文本的数量正相关。8.根据权利要求6所述的方法，还包括：针对所述预定文本库中的每个目标文本，采用预定查询文本生成模型对每个所述目标文本进行处理，生成与每个所述目标文本对应的多个查询文本；以及根据所述多个查询文本中的每个查询文本和每个所述目标文本，生成与所述每个查询文本对应的第一训练样本。9.根据权利要求8所述的方法，其中，所述根据所述多个查询文本中的每个查询文本和每个所述目标文本，生成与所述每个查询文本对应的第一训练样本包括：根据每个所述目标文本的文本属性，确定表示每个所述目标文本的主题信息的文本；拼接表示所述主体信息的文本和每个所述目标文本，得到拼接文本；以及将所述拼接文本作为所述每个查询文本的标注信息，得到与所述每个查询文本对应的第一训练样本。10.一种信息查询装置，包括：文本生成模块，用于采用第一预训练语言模型对查询文本进行处理，生成与查询文本对应的预测答复文本；标识信息生成模块，用于采用第二预训练语言模型对所述预测答复文本进行处理，生成与所述预测答复文本对应的定位标识信息；以及...

【专利技术属性】
技术研发人员：任瑞阳，曲瑛琪，刘璟，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人