一种基于大模型的数据聚类的优化方法技术

技术编号:44491805 阅读:27 留言:0更新日期:2025-03-04 17:57
本发明专利技术涉及一种基于大模型的数据聚类的优化方法,属于数据处理技术领域,包括如下步骤:步骤1):获取第一数据和第二数据,判断第一数据和第二数据的主题是否相似,分别找出第一数据的中心点和第二数据的中心点;步骤2):连接第一数据的中心点与第二数据的中心点;步骤3):让第一数据的中心点与第二数据的中心点重合,在第一数据的中心点和第二数据的中心点重合后,采用质点重合法计算第一数据的中心点和第二数据的中心点的重合度;步骤4):将第一数据和第二数据聚类合并;本发明专利技术的有益效果:通过线连接法使第一数据的中心点与第二数据的中心点相互靠近,通过质点重合法判断第一数据的中心点与第二数据的中心点重合的稳性,对数据聚类进行了优化。

【技术实现步骤摘要】

本专利技术属于数据处理,特别涉及一种基于大模型的数据聚类的优化方法


技术介绍

1、数据是数字时代的基础性战略资源和革命性关键要素,是驱动数字经济发展的核心动力,是构建数字世界的“钢筋水泥”。深挖数据“富矿”,厚植数字化生产力的意义重大、前景广阔,但目前面临数据基础制度不完善、数据质量不高,缺乏有效聚类的数据管理,数据处理过程中也存在安全风险隐患。

2、数据聚类是将具有相似主题的文本数据聚集在一起,形成一类。数据聚类技术的主要目的是挖掘文本数据中的潜在主题结构,从而有助于分析大规模文本数据。未来数据聚类技术的发展趋势包括以下几个方面:提高聚类效果:通过优化聚类算法和模型,提高话题聚类的准确性和稳定性。实时数据检测与追踪:研究实时检测和追踪话题的方法,以便快速响应社会热点和突发事件。跨平台数据聚类:整合不同平台、不同类型的文本数据,进行跨平台、跨领域的话题聚类分析。融合多模态数据:结合文本、图像、音频等多模态数据,提升话题聚类的效果和应用价值。


技术实现思路

1、本专利技术所要解决的技术问题是如何使本文档来自技高网...

【技术保护点】

1.一种基于大模型的数据聚类的优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤1)中,判断所述第一数据和所述第二数据的主题是否相似,采用如下步骤:

3.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤1)中,标识出所述第一数据的中心点或所述第二数据的中心点,采用如下步骤:

4.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤2)中,采用所述线连接法连接所述第一数据的中心点与所述第二数据的中心点,为如下步骤:

5...

【技术特征摘要】

1.一种基于大模型的数据聚类的优化方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤1)中,判断所述第一数据和所述第二数据的主题是否相似,采用如下步骤:

3.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤1)中,标识出所述第一数据的中心点或所述第二数据的中心点,采用如下步骤:

4.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤2)中,采用所述线连接法连接所述第一数据的中心点与所述第二数据的中心点,为如下步骤:

5.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤2)中,所述线连接法,为如下...

【专利技术属性】
技术研发人员:欧智坚刘岩赵贤宇孙磊许小丹
申请(专利权)人:它思科技天津有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1