一种基于人工智能的保险客服服务方法与系统技术方案

技术编号:38499515 阅读:7 留言:0更新日期:2023-08-15 17:07
本发明专利技术涉及客服服务的技术领域,揭露了一种基于人工智能的保险客服服务方法与系统,所述方法包括:对用户问答数据依次进行向量化处理、基于文本编码模型的编码处理以及自注意力加权处理,得到用户问答数据的加权后编码向量序列;获取保险客服参考服务对话数据的加权后编码向量序列,构造保险客服对话模型并基于优化目标函数进行模型优化求解。本发明专利技术通过基于词的位置信息进行词向量表示,实现词向量的位置信息捕捉,并提高句中位置的自注意力权重,结合每句词向量序列的上文有效信息,对词向量序列进行编码表示以及自注意力加权处理,实现保险客服对话模型对用户问答信息的有效捕捉,并基于不同保险客服参考回答数据的出现概率进行客服服务。进行客服服务。进行客服服务。

【技术实现步骤摘要】
一种基于人工智能的保险客服服务方法与系统


[0001]本专利技术涉及客服服务
,尤其涉及一种基于人工智能的保险客服服务方法与系统。

技术介绍

[0002]随着自然语言技术的快速发展,基于“编码

解码”结构的自动对话机器人日趋成熟。由于保险行业术语的严谨性,现有的对话机器人无法区分相近表达但是含义不同的词语表达方式,更趋于产生低信息量的对话内容,造成较差的用户体验。针对该问题,本专利技术提出一种基于人工智能的保险客服服务方法与系统,通过参考规范指导下的文本生成任务要求自动生成的文本满足与参考规范的语义相关性和知识点匹配性,达到用户体验更优的保险客服服务效果。

技术实现思路

[0003]有鉴于此,本专利技术提供一种基于人工智能的保险客服服务方法,目的在于:1)基于保险客服参考服务对话数据中每个分词结果在句中的位置进行词向量表示,其中分词结果在句中的位置即为词向量表示权重,越靠近句中位置的词向量表示的权重越大,实现词向量的位置信息捕捉,并提高句中位置的自注意力权重,使得保险客服对话模型可以更为有效捕捉句中位置信息,并结合每句词向量序列的上文有效信息,对词向量序列进行编码表示以及自注意力加权处理,得到包含上文有效信息以及主要信息注意力加权后的编码向量序列,实现保险客服对话模型对用户问答信息的有效捕捉;2)通过以最小化优化目标函数为目标,求解得到使得保险客服对话模型所输出不同保险客服参考回答数据的概率分布与所采集保险客服参考服务对话数据中保险客服参考回答数据的概率分布相似的模型参数,并据此构建得到保险客服对话模型,根据用户的每句问答数据,自动选取该句对话主要信息在保险客服参考服务对话数据中所对应出现概率最高的保险客服参考服务对话进行输出,实现自动保险客服服务。
[0004]为实现上述目的,本专利技术提供的一种基于人工智能的保险客服服务方法,包括以下步骤:S1:采集保险客服参考服务对话数据,并对参考服务对话数据中的每一个词进行向量化处理形成对话词向量序列;S2:将对话词向量序列输入到文本编码模型,得到每一个对话词向量对应的编码向量,并形成编码向量序列;S3:对编码向量序列进行自注意力加权处理得到加权后的编码向量序列;S4:计算加权后的编码向量序列中每一个编码向量出现的概率;S5:构造保险客服对话模型,并基于上述编码向量的出现概率确定优化目标函数,所述保险客服对话模型为神经网络模型;S6:基于优化目标函数对保险客服对话模型进行优化求解,利用求解得到的保险
客服对话模型进行保险客服对话。
[0005]作为本专利技术的进一步改进方法:可选地,所述S1步骤中采集保险客服参考服务对话数据,并对参考服务对话数据中的每一个词进行向量化处理,包括:采集N组保险客服参考服务对话数据,所述保险客服参考服务对话数据的形式为:;其中:表示第n组保险客服参考服务对话数据,表示第n组保险客服参考服务对话数据中的用户问题数据,表示对的保险客服参考回答数据;在本专利技术实施例中,对话数据均为文本数据;对参考服务对话数据中的每一个词进行向量化处理,其中对参考服务对话数据的向量化处理流程为:S11:预构建保险常用词分词词表,对于参考服务对话数据中的任意一句文本,截取前e个文本字符与保险常用词分词词表中的常用词进行比对,若比对不成功,则截取前e

1个文本字符与保险常用词分词词表中的常用词进行比对,依此类推,直到比对成功或待比对文本字符仅剩一个文本字符,并将该字符从该句文本删除,若比对成功则记录用于比对的文本字符,并将用于比对的文本字符从该句文本中删除,并重复当前步骤,直到该句文本全部被拆分为词语形式,将所记录的所有文本字符作为分词结果;在本专利技术实施例中,以逗号、分号以及句号对参考服务对话数据进行文本句数划分;其中的分词结果为:;;其中:表示分词得到的中第句文本中的第个词,表示中的文本句数,表示中第句文本的分词词数;表示分词得到的中第句文本中的第个词,表示中的文本句数,表示中第句文本的分词词数;S12:构建长度位数为E的状态寄存器,其中E为保险常用词分词词表中常用词的总数,并为每一个寄存器位与保险常用词分词词表中常用词建立对应关系,状态寄存器的每一位初始值为0;S13:将每个分词结果与状态寄存器中的每个寄存器位所对应的常用词进行匹配,将匹配成功的寄存器位调整为1,得到分词结果的编码结果,其中分词结果的编码结果为;
S14:对分词结果的编码结果进行向量化表示,其中编码结果的向量化表示公式为:;其中:表示的向量化表示结果;S15:将参考服务对话数据的每句文本中的所有分词结果的向量化表示结果构成一组词向量序列,得到每组参考服务对话数据的对话词向量序列,其中的对话词向量序列为:;;其中:表示的对话词向量序列,表示的对话词向量序列;表示中第句文本的词向量序列。
[0006]可选地,所述S2步骤中将对话词向量序列输入到文本编码模型,得到每一个对话词向量对应的编码向量,包括:将对话词向量序列输入到文本编码模型,得到每一个对话词向量对应的编码向量,并形成编码向量序列,其中基于文本编码模型的对话词向量的编码流程为:S21:文本编码模型接收对话词向量;S22:对对话词向量中的任意词向量序列进行编码处理,其中的编码处理公式为:;;其中:表示用于编码处理的的权重参数,表示用于编码处理的偏置参数;表示激活函数,;在本专利技术实施例中,将设置为函数;表示对话词向量中的编码向量;
表示从中提取到的有用特征信息,;S23:构成对话词向量的编码向量序列: ;其中:表示对话词向量的编码向量序列。
[0007]可选地,所述S3步骤中对编码向量序列进行自注意力加权处理,包括:生成任意编码向量的自注意力权重向量,其中编码向量序列的自注意力权重向量为:;其中:表示编码向量序列的自注意力权重向量;基于自注意力权重向量对编码向量序列进行自注意力加权处理,其中自注意力加权处理公式为:;其中:表示的自注意力加权结果;则加权后的编码向量序列为:;其中:表示编码向量序列的自注意力加权结果。
[0008]可选地,所述S4步骤中计算每一个加权后编码向量序列出现的概率,包括:计算N组保险客服参考服务对话数据中任意两组用户问题数据所对应加权后编码向量序列的余弦相似度,若余弦相似度高于预设置的相似阈值,则将两组加权后编码向量序列作为同一加权后编码向量序列;计算N组保险客服参考服务对话数据中任意两组保险客服参考回答数据所对应加权后编码向量序列的余弦相似度,若余弦相似度高于预设置的相似阈值,则将两组加权后编码向量序列作为同一加权后编码向量;
计算得到任意加权后编码向量序列以及同一加权后编码向量序列出现的条件下,加权后编码向量序列以及同一加权后编码向量序列出现的概率:其中表示任意加权后编码向量序列以及的同一加权后编码向量序列的集合,表示加权后编码向量序列以及的同一加权后编码向量序列的集合。
[0009]可选地,所述S5步骤中构造保险客服对话模型,并基于上述编码向量的出现概率确定优化目标函数,包括:构造保险客服对话模型,并基于上述编码向量的出现概率确定优化目标本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于人工智能的保险客服服务方法,其特征在于,所述方法包括:S1:采集保险客服参考服务对话数据,并对参考服务对话数据中的每一个词进行向量化处理形成对话词向量序列;S2:将对话词向量序列输入到文本编码模型,得到每一个对话词向量对应的编码向量,并形成编码向量序列;S3:对编码向量序列进行自注意力加权处理得到加权后的编码向量序列;S4:计算加权后的编码向量序列中每一个编码向量出现的概率;S5:构造保险客服对话模型,并基于上述编码向量的出现概率确定优化目标函数,所述保险客服对话模型为神经网络模型;S6:基于优化目标函数对保险客服对话模型进行优化求解,利用求解得到的保险客服对话模型进行保险客服对话;所述S5步骤中构造保险客服对话模型,并基于上述编码向量的出现概率确定优化目标函数,包括:构造保险客服对话模型,并基于上述编码向量的出现概率确定优化目标函数,其中保险客服对话模型包括输入层,概率计算层以及输出层,输入层用于接收用户问答数据的加权后编码向量序列,概率计算层中包括卷积层以及归一化层,用于计算得到不同保险客服参考回答数据所对应加权后编码向量序列的出现概率,输出层选取出现概率最高的保险客服参考回答数据进行输出;保险客服对话模型的优化目标函数为:;;其中:表示保险客服对话模型的优化目标函数,表示保险客服对话模型中概率计算层的卷积计算参数,即卷积层中的权重参数,表示卷积层;表示将输入到基于的保险客服对话模型中,保险客服对话模型中概率计算层所计算得到的的出现概率之和,表示归一化处理;表示概率计算层所计算得到的中加权后编码向量序列的出现概率之和。2.如权利要求1所述的一种基于人工智能的保险客服服务方法,其特征在于,所述S1步骤中采集保险客服参考服务对话数据,并对参考服务对话数据中的每一个词进行向量化处理,包括:采集N组保险客服参考服务对话数据,所述保险客服参考服务对话数据的形式为:;
其中:表示第n组保险客服参考服务对话数据,表示第n组保险客服参考服务对话数据中的用户问题数据,表示对的保险客服参考回答数据;对参考服务对话数据中的每一个词进行向量化处理,其中对参考服务对话数据的向量化处理流程为:S11:预构建保险常用词分词词表,对于参考服务对话数据中的任意一句文本,截取前e个文本字符与保险常用词分词词表中的常用词进行比对,若比对不成功,则截取前e

1个文本字符与保险常用词分词词表中的常用词进行比对,依此类推,直到比对成功或待比对文本字符仅剩一个文本字符,并将该字符从该句文本删除,若比对成功则记录用于比对的文本字符,并将用于比对的文本字符从该句文本中删除,并重复当前步骤,直到该句文本全部被拆分为词语形式,将所记录的所有文本字符作为分词结果;其中的分词结果为:;;其中:表示分词得到的中第句文本中的第个词,表示中的文本句数,表示中第句文本的分词词数;表示分词得到的中第句文本中的第个词,表示中的文本句数,表示中第句文本的分词词数;S12:构建长度位数为E的状态寄存器,其中E为保险常用词分词词表中常用词的总数,并为每一个寄存器位与保险常用词分词词表中常用词建立对应关系,状态寄存器的每一位初始值为0;S13:将每个分词结果与状态寄存器中的每个寄存器位所对应的常用词进行匹配,将匹配成功的寄存器位调整为1,得到分词结果的编码结果,其中分词结果的编码结果为;S14:对分词结果的编码结果进行向量化表示,其中编码结果的向量化表示公式为:;其中:
表示的向量化表示结果;S15:将参考服务对话数据的每句文本中的所有分词结果的向量化表示结果构成一组词向量序列,得到每组参考服务对话数据的对话词向量序列,其中的对话词向量序列为:;;其中:表示的对话词向量序列,表示的对话词向量序列;表示中第句文本的词向量序列。3.如权利要求2所述的一种基于人工智能的保险客服服务方法,其特征在于,所述S2步骤中将对话词向量序列输入到文本编码模型,得到每一个对话词向量对应的编码向量,包括:将对话词向量序列输入到文本编码模型,得到每一个对话词向量对应的编码向量,并形成编码向...

【专利技术属性】
技术研发人员:刮俊杰朱明智宋澄城邓晨曦史文
申请(专利权)人:湖南元数科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1