一种基于语义匹配与生成模型的会话智能生成方法技术

技术编号：38005174 阅读：14 留言：0更新日期：2023-06-30 10:20

本申请公开的属于智能会话技术领域，具体为一种基于语义匹配与生成模型的会话智能生成方法，包括模型准备阶段、数据传输、话术库向量检索、语义匹配、话术生成、结果展示与发送等多个步骤，本发明专利技术通过AI模型辅助人工客服自动匹配到话术库中的问题，降低对人工专业能力的要求，并通过生成多种不同表达方式的答案，让人工只需要通过简单判断，就可以通过一键点击返回个性化的答案服务，同时基于一个可以同时响应中文语义匹配与生成任务的语义模型，可以大幅度降低模型训练、微调、上线部署、实时预测等这些都需要很高成本的资源消耗。等这些都需要很高成本的资源消耗。等这些都需要很高成本的资源消耗。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于语义匹配与生成模型的会话智能生成方法

[0001]本申请涉及智能会话
，具体为一种基于语义匹配与生成模型的会话智能生成方法。

技术介绍

[0002]智能会话主要是指售前、售中、售后等完整销售过程中的沟通场景，通过AI模型对整个过程进行辅助，比如话术智能匹配、AI质检、标签自动提取等功能，智能客服返回的结果，过于冰冷僵化，缺少人性化的服务，非常影响用户体验。除此之外，如果基于人工提供人性化的服务，会非常依赖人工的专业能力，且需要消耗大量的精力去个性化的回复问题。语义匹配与生成模型指的是可以同时解决中文语义匹配与生成任务的模型，支持中文文本匹配和文本生成两类任务，对于需要同时解决这两个任务的场景，可以实现一次训练即可部署响应，对于语义匹配和语义生成来说，一般需要分别基于两个模型去完成对应的功能，这样对于训练、微调、上线部署、实时预测等这些过程都需要重复消耗对应的资源，对于AI模型从训练到部署的场景，无论是对人员的要求，还是对硬件GPU的要求，所消耗的资源成本是很高的，同时已有的一些多任务模型，比如PALM模型，会存在一些缺陷，比如降噪自编码器的任务缺陷，或者不支持中文等，使得效果达不到可商用的前提。

技术实现思路

[0003]本申请的目的在于提供一种基于语义匹配与生成模型的会话智能生成方法，以解决上述
技术介绍
中提出的依赖人工的专业能力，且需要消耗大量的精力去个性化的回复问题，需要重复消耗对应的资源、存在一些缺陷的问题。
[0004]为实现上述目的，本申请提供如下技术方案：一种基于语义...

【技术保护点】

【技术特征摘要】
1.一种基于语义匹配与生成模型的会话智能生成方法，其特征在于：包括以下步骤：步骤1：模型准备阶段：在PALM模型的基础上新增一个单独的浅层解码器，基于CLUE的新闻和百科数据集，在每个训练批次中，使用1/4的数据做双向优化，使用1/4的数据做Seq2Seq语言模型优化，使用1/4的数据做从右向左的单向优化，使用1/4的数据做从左向右的单向优化，用掩码掩盖掉句子中20％的词语，最终得到一个拥有语义匹配和生成任务的模型；步骤2：数据传输：由于销售过程中沟通的手段会多种多样，所以对于客户实时发送的内容进行预处理：如果客户发送的音频，通过语音识别转化成文字，再通过语义分割把连续的文字转换成可以理解的句子；如果客户发送的是文本，通过语义分割和文字纠错的处理，将上述内容转化成步骤1中模型可以处理的文本格式；步骤3：话术库向量检索：将已有的话术库中的问题，分批输入到步骤1中的的语义匹配和生成模型中，分别得到对应问题的语义向量，并交由对应的向量检索引擎进行建立索引管理；步骤4：语义匹配：将步骤2模块处理后的文本问题，输入到语义匹配和生成模型中，输出文本对应的文本向量，再将这段文本向量，通过步骤3中的向量检索引擎，找到话术库中语义相似度最高的问题；步骤5：话术生成：将步骤4找到的...

【专利技术属性】
技术研发人员：李翔，李柯辰，汪凡，曾炜，
申请(专利权)人：深圳市惟客数据科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人