一种用于保险配置意图识别的方法技术

技术编号:27292632 阅读:12 留言:0更新日期:2021-02-06 12:02
本发明专利技术公开了一种用于保险配置意图识别的方法,该方法为:首先,选取一些标准句子,对这些句子进行扩充,得到一个更大的标准句子集;然后对于实际的发言句子与这些句子进行相似度的计算,大于某一个阈值就算匹配成功,并打上提出了保险配置思路的标签。相似度的计算是利用孪生神经网络对用户发言的文本信息进行建模,其中使用NLP领域的Bert模型,将句子转换为一个向量,并经过池化层和全连接层,输出的2个向量进行相似度计算,得到两个句子的相似度。本发明专利技术提供了一种算法,通过计算文本的相似度,来为用户打上标签,识别用户发言的文本信息里是否有关保险配置思路,从而为用户提供更有针对性的服务打下基础。供更有针对性的服务打下基础。供更有针对性的服务打下基础。

【技术实现步骤摘要】
一种用于保险配置意图识别的方法


[0001]本专利技术涉及一种机器学习和NLP领域的关于保险配置意图识别的算法,具体地,涉及一种用于保险配置意图识别的方法。

技术介绍

[0002]机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识,近似理论知识和复杂算法知识,使用计算机作为工具并致力于真实实时的模拟人类学习方式,并将现有内容进行知识结构划分来有效提高学习效率。
[0003]机器学习有下面几种定义:
[0004](1)机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。
[0005](2)机器学习是对能通过经验自动改进的计算机算法的研究。
[0006](3)机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。
[0007]自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。因此,这一领域的研究将涉及自然语言,即人们日常使用的语言,所以它与语言学的研究有着密切的联系,但又有重要的区别。自然语言处理并不是一般地研究自然语言,而在于研制能有效地实现自然语言通信的计算机系统,特别是其中的软件系统。因而它是计算机科学的一部分。
[0008]自然语言处理(NLP,Natural Language Processing)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。
[0009]在自然语言处理过程中,经常会涉及到如何度量两个文本之间的相似性,文本是一种高维的语义空间,如何对其进行抽象分解,从而能够站在数学角度去量化其相似性。而有了文本之间相似性的度量方式,便可以利用划分法的K-means、基于密度的DBSCAN或者是基于模型的概率方法进行文本之间的聚类分析;另一方面,也可以利用文本之间的相似性对大规模语料进行去重预处理,或者找寻某一实体名称的相关名称(模糊匹配)。而衡量两个字符串的相似性有很多种方法,如最直接的利用hashcode,以及经典的主题模型或者利用词向量将文本抽象为向量表示,再通过特征向量之间的欧式距离或者皮尔森距离进行度量。
[0010]将机器学习和NLP用于识别用户发言的文本信息,特别是通过相似度的计算,判断其中是否存在有关保险配置的意图,能够为用户提供更有针对性的服务。

技术实现思路

[0011]本专利技术的目的是提供一种关于保险配置意图识别的算法,通过计算文本的相似度,来为用户打上标签,识别用户发言的文本信息里是否有关保险配置思路,从而为用户提供更有针对性的服务打下基础。
[0012]本专利技术提供了一种用于保险配置意图识别的方法,其中,所述的方法为:首先,选取一些标准句子,对这些句子进行扩充,得到一个更大的标准句子集;然后对于实际的发言句子与这些句子进行相似度的计算,大于某一个阈值就算匹配成功,并打上提出了保险配置思路的标签。
[0013]上述的用于保险配置意图识别的方法,其中,所述的进行相似度的计算是利用孪生神经网络对用户发言的文本信息进行建模,其中使用NLP领域的Bert模型,将句子转换为一个向量,并经过池化层和全连接层,输出的2个向量进行相似度计算,得到两个句子的相似度。
[0014]上述的用于保险配置意图识别的方法,其中,所述的方法包含:步骤1、取得具有标准配置思路的若干句子;步骤2、利用此前已有的一期用户的对话数据,采用默认模型,并选择参数度量,从这期数据里找到与步骤1中的若干句子相类似的句子,作为候选的标准句提交,然后经过再标注,得到与步骤1中的若干句子经确认的相似的句子;步骤3、将步骤2所得的句子作为正样本,并从未匹配上的句子中选择一部分作为负样本,构成训练集;步骤4、训练模型;步骤5、利用新一期的用户对话数据,预测其结果,经判断,得到相似与否的结果。
[0015]上述的用于保险配置意图识别的方法,其中,所述的步骤2是采用默认的sentence-Bert模型,并用余弦相似度作为度量。
[0016]上述的用于保险配置意图识别的方法,其中,所述的步骤4是针对数据集,采用孪生网络算法,对标准句和需要评估的句子分别用Bert模型,得到向量,并经池化和全连接层,得到两个向量,计算相似度。
[0017]上述的用于保险配置意图识别的方法,其中,所述的步骤4还包含:计算相似度后,根据已有的标注(y),反向传播,不断地更新参数,训练完成,得到一个经数据集微调的模型。
[0018]本专利技术提供的用于保险配置意图识别的方法具有以下优点:
[0019]该方法是一种关于保险配置意图识别的算法,通过选取一些标准句子,对这些句子进行扩充,得到一个更大的标准句子集;然后对于实际的发言句子与这些句子进行相似度的计算,大于某一个阈值就算匹配成功,并打上提出了保险配置思路的标签。相似度的计算是利用孪生神经网络对用户发言(文本信息)进行建模,其中用到了NLP领域的Bert模型,将句子转换为一个向量,并经过池化层和全连接层,输出的2个向量进行相似度计算,得到两个句子的相似度。使用本专利技术提供的方法还具有:不需要对句子进行过多的标注,能够快速的得到结果,结果较为符合实际结果等优点。
附图说明
[0020]图1为本专利技术的用于保险配置意图识别的方法的示意图。
具体实施方式
[0021]以下结合附图对本专利技术的具体实施方式作进一步地说明。
[0022]本专利技术提供了一种用于保险配置意图识别的方法,该方法为:首先,选取一些标准句子,对这些句子进行扩充,得到一个更大的标准句子集;然后对于实际的发言句子与这些句子进行相似度的计算,大于某一个阈值就算匹配成功,并打上提出了保险配置思路的标
签。
[0023]相似度的计算是利用孪生神经网络对用户发言的文本信息进行建模,其中使用NLP领域的Bert模型,将句子转换为一个向量,并经过池化层和全连接层,输出的2个向量进行相似度计算,得到两个句子的相似度。
[0024]优选地,该方法包含:步骤1、取得具有标准配置思路的若干句子;步骤2、利用此前已有的一期用户或学员的对话数据,采用默认模型,并选择参数度量,从这期数据里找到与步骤1中的若干句子相类似的句子,作为候选的标准句提交,然后经过再标注,得到与步骤1中的若干句子经确认的相似的句子;步骤3、将步骤2所得的句子作为正样本,并从未匹配上的句子中选择一部分作为负样本,构成训练集;步骤4、训练模型;步骤5、利用再新一期的用户或学员的对话数据,通过训练后的模型预测其结果,经判断,得到相似与否的结果。
[0025]步骤2是采用默认的sentence-Bert模型,并用余弦相似度作为度量。
[0026]步骤4是针对数据集,采用孪生网络算法,对标准句和需要评估的句子分别用Bert模型,得到向量,并经池化和全连接层,得到两个向量,计算相似度。
[0027]步骤4还包含:计算相似度本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于保险配置意图识别的方法,其特征在于,所述的方法为:首先,选取一些标准句子,对这些句子进行扩充,得到一个更大的标准句子集;然后对于实际的发言句子与这些句子进行相似度的计算,大于某一个阈值就算匹配成功,并打上提出了保险配置思路的标签。2.如权利要求1所述的用于保险配置意图识别的方法,其特征在于;所述的进行相似度的计算是利用孪生神经网络对用户发言的文本信息进行建模,其中使用NLP领域的Bert模型,将句子转换为一个向量,并经过池化层和全连接层,输出的2个向量进行相似度计算,得到两个句子的相似度。3.如权利要求2所述的用于保险配置意图识别的方法,其特征在于,所述的方法包含:步骤1、取得具有标准配置思路的若干句子;步骤2、利用此前已有的一期用户的对话数据,采用默认模型,并选择参数度量,从这期数据里找到与步骤1中的若干句子相类似的句子,作为候选的标准句提交,然后经过再...

【专利技术属性】
技术研发人员:巩乐
申请(专利权)人:上海昌投网络科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1