【技术实现步骤摘要】
本专利技术属于数据处理,特别涉及一种基于大模型的数据聚类的优化方法。
技术介绍
1、数据是数字时代的基础性战略资源和革命性关键要素,是驱动数字经济发展的核心动力,是构建数字世界的“钢筋水泥”。深挖数据“富矿”,厚植数字化生产力的意义重大、前景广阔,但目前面临数据基础制度不完善、数据质量不高,缺乏有效聚类的数据管理,数据处理过程中也存在安全风险隐患。
2、数据聚类是将具有相似主题的文本数据聚集在一起,形成一类。数据聚类技术的主要目的是挖掘文本数据中的潜在主题结构,从而有助于分析大规模文本数据。未来数据聚类技术的发展趋势包括以下几个方面:提高聚类效果:通过优化聚类算法和模型,提高话题聚类的准确性和稳定性。实时数据检测与追踪:研究实时检测和追踪话题的方法,以便快速响应社会热点和突发事件。跨平台数据聚类:整合不同平台、不同类型的文本数据,进行跨平台、跨领域的话题聚类分析。融合多模态数据:结合文本、图像、音频等多模态数据,提升话题聚类的效果和应用价值。
技术实现思路
1、本专利技术所要解
...【技术保护点】
1.一种基于大模型的数据聚类的优化方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤1)中,判断所述第一数据和所述第二数据的主题是否相似,采用如下步骤:
3.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤1)中,标识出所述第一数据的中心点或所述第二数据的中心点,采用如下步骤:
4.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤2)中,采用所述线连接法连接所述第一数据的中心点与所述第二数据的中心点,为如下步
5...
【技术特征摘要】
1.一种基于大模型的数据聚类的优化方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤1)中,判断所述第一数据和所述第二数据的主题是否相似,采用如下步骤:
3.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤1)中,标识出所述第一数据的中心点或所述第二数据的中心点,采用如下步骤:
4.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤2)中,采用所述线连接法连接所述第一数据的中心点与所述第二数据的中心点,为如下步骤:
5.根据权利要求1所述的一种基于大模型的数据聚类的优化方法,其特征在于,在所述步骤2)中,所述线连接法,为如下...
【专利技术属性】
技术研发人员:欧智坚,刘岩,赵贤宇,孙磊,许小丹,
申请(专利权)人:它思科技天津有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。