基于多任务孪生网络的语义匹配方法、装置、设备和介质制造方法及图纸

技术编号：26172237 阅读：50 留言：0更新日期：2020-10-31 13:48

本申请涉及人工智能领域，尤其是一种基于多任务孪生网络的语义匹配方法、装置、设备和介质。该方法包括：获取待处理文本及标准文本；将待处理文本输入至第一特征抽取器中得到待处理文本对应的字量、词向量及字词组合向量，将标准文本输入至第二特征抽取器中得到标准文本对应的字向量、词向量及字词组合向量；第一特征抽取器及第二特征抽取器互为孪生网络；将得到字向量、词向量及字词组合向量输入至预先训练完成的目标语义匹配模型中，以得到待处理文本和标准文本的目标相似度；根据目标相似度输出与待处理文本对应的标准文本。此外，本申请还涉及区块链技术，标准文本和目标语义匹配模型可存储于区块链中。采用本方法能够提高准确性。

全部详细技术资料下载

【技术实现步骤摘要】
基于多任务孪生网络的语义匹配方法、装置、设备和介质
本申请涉及人工智能
，特别是涉及一种基于多任务孪生网络的语义匹配方法、装置、设备和介质。
技术介绍
随着人工智能技术的发展，出现了自然语言处理技术，其中涉及到语义匹配，即判断两个句子是否为相同的意思，通过语义匹配来完成语义匹配任务，即对用户表达的自然语言进行数据分析处理，识别出用户实际想表达的深层含义，这样能够准确的识别客户想询问的内容、了解客户需要，从而能够帮助企业快速反应，及时解决客户问题，从而提高客户满意度。传统语义匹配采用one-hot编码或采用预训练词向量的方式。但是one-hot编码在词袋大小的空间中只有少数维度为1，高维稀疏的空间难以代表句子的语义信息。预训练词向量的方式是将词语映射到低维度稠密空间中，词语的语义表示方式更加成熟，但是在语言模型任务中训练出来的语义表征难以适应语义匹配任务的需要，从而导致语义匹配任务的结果不准确。
技术实现思路
基于此，有必要针对上述技术问题，提供一种能够提高准确性的基于多任务孪生网络的语义匹配...

【技术保护点】
1.一种基于多任务孪生网络的语义匹配方法，其特征在于，所述方法包括：/n获取待处理文本以及标准文本；/n将所述待处理文本输入至第一特征抽取器中，以得到所述待处理文本对应的字量、词向量以及字词组合向量，将所述标准文本输入至第二特征抽取器中，以得到所述标准文本对应的字向量、词向量以及字词组合向量；所述第一特征抽取器以及所述第二特征抽取器互为孪生网络；/n将所述待处理文本和所述标准文本对应的字向量、词向量以及字词组合向量输入至预先训练完成的目标语义匹配模型中，以通过所述目标语义匹配模型计算所述待处理文本和所述标准文本的目标相似度；/n根据所述目标相似度输出与所述待处理文本对应的标准文本。/n

【技术特征摘要】
1.一种基于多任务孪生网络的语义匹配方法，其特征在于，所述方法包括：
获取待处理文本以及标准文本；
将所述待处理文本输入至第一特征抽取器中，以得到所述待处理文本对应的字量、词向量以及字词组合向量，将所述标准文本输入至第二特征抽取器中，以得到所述标准文本对应的字向量、词向量以及字词组合向量；所述第一特征抽取器以及所述第二特征抽取器互为孪生网络；
将所述待处理文本和所述标准文本对应的字向量、词向量以及字词组合向量输入至预先训练完成的目标语义匹配模型中，以通过所述目标语义匹配模型计算所述待处理文本和所述标准文本的目标相似度；
根据所述目标相似度输出与所述待处理文本对应的标准文本。

2.根据权利要求1所述的方法，其特征在于，所述获取待处理文本以及标准文本，包括：
获取待处理文本以及初始标准文本；
按照预设规则提取所述待处理文本的预设数量的字符，并根据所提取的字符进行文本识别确定抽取参数；
根据所述抽取参数从所述初始标准文本中选取标准文本。

3.根据权利要求2所述的方法，其特征在于，所述抽取参数为关键字，所述根据所述抽取参数从所述初始标准文本中选取标准文本包括：
将所述关键词与多个业务类型对应的标准关键词进行匹配；
获取关键词匹配成功的个数大于预设个数的业务类型作为所述待处理文本对应的业务类型；
根据所述业务类型从所述初始标准文本中选取标准文本。

4.根据权利要求1所述的方法，其特征在于，所述将所述待处理文本输入至第一特征抽取器中，以得到所述待处理文本对应的字量、词向量以及字词组合向量，将所述标准文本输入至第二特征抽取器中，以得到所述标准文本对应的字向量、词向量以及字词组合向量，包括：
将所述待处理文本输入至第一特征抽取器中，以通过所述第一特征抽取器对所述待处理文本进行分词处理和分字处理，得到与所述待处理文本对应的子序列和词序列；
根据与所述待处理文本对应的子序列和词序列生成所述待处理文本对应的字量、词向量以及字词组合向量；
将所述标准文本输入至第二特征抽取器中，以通过所述第二特征抽取器对所述标准文本进行分词处理和分字处理，得到与所述标准文本对应的子序列和词序列；
根据与所述标准文本对应的子序列和词序列生成所述标准文本对应的字量、词向量以及字词组合向量。

5.根据权利要求4所述的方法，其特征在于，所述根据与所述待处理文本对应的子序列和词序列生成所述待处理文本对应的字量、词向量以及字词组合向量，包括：
并行将与所述待处理文本对应的子序列和词序列输入至预设神经网络中得到所述待处理文本对应的字向量、词向量以及字词组合向量；
所述根...

【专利技术属性】
技术研发人员：陆林炳，刘志慧，金培根，何斐斐，林加新，李炫，
申请(专利权)人：中国平安人寿保险股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人