一种无监督或少量数据下的深度学习问答机器人构建系统技术方案

技术编号：36817665 阅读：13 留言：0更新日期：2023-03-12 00:34

本发明专利技术涉及自然语言处理领域，具体公开了一种无监督或少量数据下的深度学习问答机器人构建系统，包括预训练模块、相似计算模块、交互处理模块以及最终匹配度计算模块，预训练模块、相似计算模块、交互处理模块、最终匹配度计算模块依次连接；所述预训练模块用于输入文本的上下文建模，所述相似计算模块计算输入问题和问题库问题之间的语义相似度，所述交互处理模块帮助识别输入问题中的一些特定含义，并与问题库中的相应问题产生交互分数；所述最终匹配度计算模块输出包含语义、词顺序以及特定词交互结果后的匹配分数；仅需要少量的标注数据，对数据积累的要求更低，适用场景更多；可根据业务的发展情况和数据的积累程度去适配不同的解决方案。同的解决方案。同的解决方案。

全部详细技术资料下载

【技术实现步骤摘要】
一种无监督或少量数据下的深度学习问答机器人构建系统

[0001]本专利技术涉及自然语言处理领域，具体为一种无监督或少量数据下的深度学习问答机器人构建系统。

技术介绍

[0002]用户在使用产品的过程中往往会遇到各类问题，客服是用户寻求解决方案的首要渠道。随着人工智能技术的发展，尤其是深度学习的兴起让自然语言处理技术日趋成熟，越来越多的企业开始采用智能客服机器人。智能客服可以提供7*24小时、质量稳定的服务。有效降低人工成本，提高客服效率。而智能问答又是智能客服的最主要和核心的场景。
[0003]打造智能客服目前业界的最先进的解决方案是深度学习。在要构建的问答系统场景，常见的深度模型架构有两种：一是交互式、端到端的，直接将两段文本(用户的问题和常见问题库中的问题)连接起来作为输入，深度模型将交互学习并输出两者之间的相关度评分。另一种是将深度模型作为一种表示学习方法，从可变长度的文本中学习固定长度的特征表示，再通过特征表示计算相关度。这种方法也有另外一种直观理解，就是将用户查询语句和问题库的问题语句映射到同一个特征空间，而它们在特征空间的某种距离代表它们之间的相似度。
[0004]然而即使是上述SOTA方法，在实际生产过程中落地应用时仍发现一些特定问题无法得到很好的解决：
[0005]一、交互式模型架构针对性更强，通常预测精度更高，但需要大量标注数据，而在某些场景或业务开展初期，通常都没有数据积累，无法提供足够于训练的标注数据
[0006]二、实际生产中存在语料和语料之间的差异问题，容易导...

【技术保护点】

【技术特征摘要】
1.一种无监督或少量数据下的深度学习问答机器人构建系统，其特征在于：包括预训练模块(1)、相似计算模块(2)、交互处理模块(3)以及最终匹配度计算模块(4)，预训练模块(1)、相似计算模块(2)、交互处理模块(3)、最终匹配度计算模块(4)依次连接；所述预训练模块(1)用于输入文本的上下文建模，所述相似计算模块(2)计算输入问题和问题库问题之间的语义相似度，所述交互处理模块(3)帮助识别输入问题中的一些特定含义，并与问题库中的相应问题产生交互分数；所述最终匹配度计算模块(4)输出包含语义、词顺序以及特定词交互结果后的匹配分数。2.根据权利要求1所述的一种无监督或少量数据下的深度学习问答机器人构建系统，其特征在于：所述预训练模块(1)先从大量公开的中文语料库的上下文中学习语义信息，再迁移使用到系统的特定场景任务上。3.根据权利要求1所述的一种无监督或少量数据下的深度学习问答机器人构建系统，其特征在于：所述预训练模型(1)选取了业界SOTA的BERT模型架构，其中的postition encoding技术引入了顺序的信息，使用最后一层的CLS对应的输出作为query和question的表示。4.根据权利要求1所述的一种无监督或少量数据下的深度学习问答机器人构建系统，其特征在于：所述相似计算模块(2)基于预训练模块(1)的输出选取了余弦相似度计算匹配分数，计算公式为：其中，Score(query,question)为匹配分数，query和question作为预训练...

【专利技术属性】
技术研发人员：张慧，张光胜，余梦璐，薛卫芳，张剑，
申请(专利权)人：天翼电子商务有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人