基于文本检索和阅读理解技术的智能对话机器人系统技术方案

技术编号:37962577 阅读:33 留言:0更新日期:2023-06-30 09:37
本发明专利技术涉及聊天机器人技术领域,具体涉及基于文本检索和阅读理解技术的智能对话机器人系统。系统包括信息检索模块,用于通过双塔模型Colbert,从文档中定位出与问题相关的段落并排序;对话流程管理模块,用于根据信息检索模块定位出的信息,判定是否需要调用实体识别模型与对话流程管理系统,并得到与问题对应的答案;文本生成模块,用于从定位到的文档中生成答案。本发明专利技术具有通过结合深度学习语义检索技术以及精准排序方法,在大量文本内容中精准匹配出问题所在段落,然后将问题与段落信息输入至训练好的预训练模型中生成问题答案并进行回复的特点。进行回复的特点。进行回复的特点。

【技术实现步骤摘要】
基于文本检索和阅读理解技术的智能对话机器人系统


[0001]本专利技术涉及聊天机器人
,具体涉及基于文本检索和阅读理解技术的智能对话机器人系统。

技术介绍

[0002]聊天机器人(以下简称Chatbot)本质上就是程式化的输入与输出系统。即根据对话者的输入匹配对应的输出。其最基本的形式是通过文本的方式与人类进行交互。比如对其发送“明天杭州天气如何?”,Chatbot就会根据关键信息进行相关数据检索并返回信息。尤其是近些年电子商务以及线上业务的普及,人们也越来越离不开Chatbot所带来的便利。比如在电子商务行业,买家在购买前会有大量的问题需要咨询,在购买之后可能也会存在一些售后相关的问题。又比如现在一些城市的政务服务中心,都提供线上的预先咨询服务来避免老百姓因为不熟悉业务流程而跑空的情况,进而提升服务质量。但是由于咨询量的庞大以及实效性的要求,使得人工客服是一笔极大的投入。
[0003]鉴于以上需求,越来越多的行业使用Chatbot来协助甚至取代人类来完成一些重复性的客服工作。商家可以根据自身店铺情况定制化的设置相关问题与回复来达本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于文本检索和阅读理解技术的智能对话机器人系统,其特征在于,包括;信息检索模块,用于通过双塔模型Colbert,从文档中定位出与问题相关的段落并排序;对话流程管理模块,用于根据信息检索模块定位出的信息,判定是否需要调用实体识别模型与对话流程管理系统,并得到与问题对应的答案;文本生成模块,用于从定位到的文档中生成答案。2.根据权利要求1所述的基于文本检索和阅读理解技术的智能对话机器人系统,其特征在于,所述双塔模型Colbert在传统双塔模型的基础上,加入后期交互部分,即加入Maxsim得分函数进行后期交互;具体计算公式为;其中,q是query的缩写,指用户的问询;d为document的缩写,指用户上传至文档库中的某一段文本;为用户输入的q和其中一段文本d的相似度得分;和分别是检索文本库和问题在BERT模型生成的上下文编码;使用和,双塔模型Colbert通过后期交互计算q和d之间的相关性分数。3.根据权利要求2所述的基于文本检索和阅读理解技术的智能对话机器人系统,其特征在于,所述使用和,双塔模型Colbert通过后期交互计算q和d之间的相关性分数的具体过程为:找到中的每个向量编码vector和中向量的最大余弦相似度,并通过求和合并输出。4.根据权利要求3所述的基于文本检索和阅读理解技术的智能对话机器人系统,其特征在于,双塔模型Colbert在训练阶段,被训练在包含以下三元组的数据集上:[query, positive_document, negative_document];其中,query指想要检索的文档的查询,即问题;positive_document指与查询相关且包含查询答案的文档;negative_document指与查询无关且不包含查询答案的文档。5.根据权利要求4所述的基于文本检索和阅读理解技术的智能对话机器人系统,其特...

【专利技术属性】
技术研发人员:汪东瑶
申请(专利权)人:杭州实在智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1