一种基于BERT的意图数据层次聚类方法及系统技术方案

技术编号:24208664 阅读:81 留言:0更新日期:2020-05-20 15:49
本发明专利技术公开了一种基于BERT的意图数据层次聚类方法,包括以下步骤:S1:确定访客的数据;S2:通过BERT获取每条数据的向量;S3:使用层次聚类算法将步骤S2的向量进行聚类;S4:调整层次聚类算法的参数,使得聚类的结果符合标准。通过本发明专利技术的方案可快速确定某个领域访客的意图。

A hierarchical clustering method and system of intention data based on Bert

【技术实现步骤摘要】
一种基于BERT的意图数据层次聚类方法及系统
本专利技术涉及医疗领域以及数据计算
,尤其是一种基于BERT的意图数据层次聚类方法及系统。
技术介绍
在做医疗领域机器人初期,经常需要人工去看大量的对话数据来确定访客常见的意图,或者询问熟悉这个行业的专家。这样就会出现一个严重的问题,在搭建机器人初期会耗费大量时间和人力在确定访客意图这件事上。语言模型是根据语言客观事实而进行的语言抽象数学建模,是一种对应关系。语言模型与语言客观事实之间的关系,如同数学上的抽象直线与具体直线之间的关系。BERT是目前最先进的语言模型之一。相比之前的语言模型word2vec,BERT在11个NLP任务的表现上都优于word2vec,最直观的感觉就是BERT更加“理解”自然语言。层次聚类(HierarchicalClustering)是聚类算法的一种,通过计算不同类别数据点间的相似度来创建一棵有层次的嵌套聚类树。在聚类树中,不同类别的原始数据点是树的最低层,树的顶层是一个聚类的根节点。创建聚类树有自下而上合并和自上而下分裂两种方法。比如,作为本文档来自技高网...

【技术保护点】
1.一种基于BERT的意图数据层次聚类方法,其特征在于,包括以下步骤:/nS1:确定访客的数据;/nS2:通过BERT获取每条数据的向量;/nS3:使用层次聚类算法将步骤S2的向量进行聚类;/nS4:调整层次聚类算法的参数,使得聚类的结果符合标准。/n

【技术特征摘要】
1.一种基于BERT的意图数据层次聚类方法,其特征在于,包括以下步骤:
S1:确定访客的数据;
S2:通过BERT获取每条数据的向量;
S3:使用层次聚类算法将步骤S2的向量进行聚类;
S4:调整层次聚类算法的参数,使得聚类的结果符合标准。


2.根据权利要求1所述的一种基于BERT的意图数据层次聚类方法,其特征在于,步骤S2进一步通过BERT将输入的句子转化为向量。


3.根据权利要求1...

【专利技术属性】
技术研发人员:陈鑫肖龙源蔡振华李稀敏刘晓葳谭玉坤
申请(专利权)人:厦门快商通科技股份有限公司
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1