改进BERT的文本语义匹配设备、系统、方法及存储介质技术方案

技术编号：29615245 阅读：17 留言：0更新日期：2021-08-10 18:30

改进BERT的文本语义匹配设备、系统、方法及存储介质，尤其涉及文本语义匹配、BER、词粒度、相对位置编码和注意力池化的匹配设备、系统、方法及存储介质，属于自然语言处理领域；目的是解决BERT模型训练时间较长、绝对位置编码未能表明句子中词与词间的相对位置和输出文本表示不能完全利用BERT模型输出的文本表示序列的问题；本发明专利技术通过建立所述传输层中的词嵌入机制、所述编码层的相对位置编码机制以及通过所述输出层对池化后的注意力机制处理文本，完成后续文本语义匹配；本发明专利技术不仅提高了文本匹配的准确率，更加准确体现句子的不同位置和不同位置间的信息，并采用注意力池化方式，得到降维后的文本表示包含更多的语义信息。

全部详细技术资料下载

【技术实现步骤摘要】
改进BERT的文本语义匹配设备、系统、方法及存储介质
本专利技术改进BERT的文本语义匹配方法，尤其涉及文本语义匹配、BER、词粒度、相对位置编码和注意力池化的匹配设备、系统、方法及存储介质，属于自然语言处理领域。
技术介绍
文本语义匹配是自然语言处理领域(NLP)的基本任务之一，旨在对两个文本的语义进行建模，并对它们之间的关系进行分类。文本语义匹配的研究可应用在自动问答、机器翻译、对话系统和复述等自然语言处理任务中，这些任务在一定程度上都可以抽象为文本匹配任务。文本语义匹配任务面临的首要问题是文本表示问题，文本表示是指将文本中的字词映射为词向量表示，使得计算机能够对文本进行处理。近年来，随着大规模预训练模型的发展，文本表示技术得到了巨大的发展，多种基于大规模文本预料的预训练模型如雨后春笋般涌现，如ELMo、OpenAIGPT、BERT、XLNet等。自从BERT预训练模型取得巨大成功之后，基于BERT预训练模型的改进也被不断提出，如RoBERTa、ALBERT等。尽管上述模型已经取得了不错的成绩，但是仍存在很多不足之处，以往的降维的三种方法为提取[CLS]向量、平均池化和最大池化；上述三种方法过于片面的应用输出的三维文本表示序列，因此提出的方法融合了[CLS]向量与其余向量之间的关系，得到更加准确体现文本语义的文本表示。对预训练模型从文本中所提取到的输出文本序列进行池化操作生成文本表示是文本语义匹配模型的重要一步。Collobert等提出一种全局最大池化方法，通过文本表示序列中各向量对应元素...

【技术保护点】
1.改进BERT的文本语义匹配系统，其特征在于：该系统包括数据预处理子系统、BERT子系统；数据预处理子系统负责将获取的文本进行整理后传输到BERT模型子系统，由BERT模型子系统进行模型建立以及模型输出，最终由输出层子系统将模型进行改进后输出匹配结果。/n

【技术特征摘要】
1.改进BERT的文本语义匹配系统，其特征在于：该系统包括数据预处理子系统、BERT子系统；数据预处理子系统负责将获取的文本进行整理后传输到BERT模型子系统，由BERT模型子系统进行模型建立以及模型输出，最终由输出层子系统将模型进行改进后输出匹配结果。

2.根据权利要求1所述的改进BERT的文本语义匹配系统，其特征在于：所述的数据预处理子系统包括文本获取模块、拼接模块和分词模块；所述BERT模型子系统包括输入表示层、编码层和输出层；所述输出层包括注意力池化模块和分类器。

3.改进BERT的文本语义匹配方法，区别于现有BERT的文本语义匹配，是根据权利要求1-2中任一一项所述的系统为基础实现的，其特征在于：该方法通过建立所述传输层中的词嵌入机制、所述编码层的相对位置编码机制以及通过所述输出层对池化后的注意力机制处理文本，完成后续文本语义匹配；该方法具体步骤如下：
步骤一，通过将所述文本获取模块输入文本并插入特殊元素向量，完成文本匹配任务的初始化操作；
步骤二，所述拼接模块利用自注意力机制拼接主要向量；
步骤三，所述分词模块利用词嵌入机制根据词粒度对切分文本向量，作为最后的分词结果；
步骤四，利用相对位置编码机制对文本进行编码输出模型学习到的相对位置；
步骤五，利用步骤一插入的特殊元素向量，与输出文本序列中其余输出向量序列进行注意力的池化方式计算；
步骤六，利用分类器所包含的函数计算，完成文本语义匹配。

4.根据权利要求3所述的改进BERT的文本语义匹配方法，其特征在于：在步骤一中，文本匹配任务具体包含两部分：
第一部分，将文本对进行拼接，对文本对中的第一个句子前加入特殊符号[CLS]，在第一句话结尾加入特殊符号[SEP]，再接入第二个句子，在第二句话结尾加入特殊符号[SEP]，将拼接好的句子以字粒度对句子进行切分；
第二部分，将每一个字的词向量、分段向量和位置向量进行作和作为最终输入BERT模型的向量表示。

5.根据权利要求3所述的改进BERT的文本语义匹配方法，其特征在于：步骤二中，所述自注意力机制，具体步骤如下：
步骤二一，将当前字词的查询集合Q和每个键K进行相似度计算得到权重；
步骤二二，使用Softmax函数对这些权重进行归一化处理；
步骤二三，将权重和相应的值V进行加权求和得到最后的注意力结果。

6.根据权利要求3所述的改进BERT的文本语义匹配方法，其特征在于：步骤三中，所述自注...

【专利技术属性】
技术研发人员：王庆岩，顾金铭，殷楠楠，谢金宝，梁欣涛，沈涛，
申请(专利权)人：哈尔滨理工大学，
类型：发明
国别省市：黑龙江;23

全部详细技术资料下载我是这个专利的主人