【技术实现步骤摘要】
基于改进构造性覆盖聚类算法的数字文化可视化方法
[0001]本专利技术涉及计算机
,具体涉及一种基于改进构造性覆盖聚类算法的数字文化可视化方法。
技术介绍
[0002]自20世纪60年代以来,在计算机媒介支撑下,人文知识的获取、分析、集成和展示方式都在发生重大变化。海量的图书、报纸、期刊、照片、绘本、乐曲、视频等资料被数字化,并上传到互联网供大众获取和使用,随之出现了许多优秀的历史信息化项目,例如中国历代人物传记数据库(ChinaBiographical Database Project,CBDB)提取、整理了与近百万名历史人物相关的时空事件和关系信息。面对这种日益强化的数字化现状,2016年IEEE VIS 会议将数字人文和可视化两个领域的专家聚在一起进行研讨,打破了传统文理学科与技术之间的壁垒,为可视化技术在数字人文领域的应用开辟了新的思路。
[0003]相关技术中,申请公布号为CN105740341A的中国专利技术专利申请公开了一种基于GIS网络拓扑结构的历史名人事件年谱方法,实现步骤包括:确定输入多类型 ...
【技术保护点】
【技术特征摘要】
1.一种基于改进构造性覆盖聚类算法的数字文化可视化方法,其特征在于,所述方法包括:采集包含名人信息的数据,构建初始未学习数据集;基于所述初始未学习数据集进行初始划分,获得初始聚类结果;针对所述初始聚类结果,计算每个类的标准差和各类中心间的相似度值,并基于标准差和相似度调整聚类数目,得到最优的聚类结果;利用可视化技术,将所述最优的聚类结果进行可视化展示。2.如权利要求1所述的基于改进构造性覆盖聚类算法的数字文化可视化方法,其特征在于,所述包含名人信息的数据包括结构化数据和非结构化数据。3.如权利要求1所述的基于改进构造性覆盖聚类算法的数字文化可视化方法,其特征在于,所述采集包含名人信息的数据,构建初始未学习数据集,包括:采集包含名人信息的数据;对所述数据进行预处理,得到预处理后数据;根据预处理后的数据,构建所述初始未学习数据集。4.如权利要求1所述的基于改进构造性覆盖聚类算法的数字文化可视化方法,其特征在于,所述基于所述初始未学习数据集进行初始划分,获得初始聚类结果,包括:分别求出所述初始未学习数据集中的样本点x与簇类中心点c的距离r
x
,x∈D,D为所述初始未学习数据集;将各样本点x对应的距离r
x
求和,得到求和结果r
D
→
c
;基于距离r
x
和求和结果r
D
→
c
,计算每个未学习样本x的权重:基于基于赋予权重后的样本点,获得簇类中心点c所属覆盖的半径,确定所述初始聚类结果,所述初始聚类结果包括聚类数目N
c
和初始聚类中心点集合。5.如权利要求1所述的基于改进构造性覆盖聚类算法的数字文化可视化方法,其特征在于,所述针对所述初始聚类结果,计算每个类的标准差和各类中心间的相似度值,并基于标准差和相似度调整聚类数目,得到最优的聚类结果,包括:计算各类内样本到类中心的标准向量差,并基于所述标准向量差对所述初始聚类结果进行分裂处理,得到分裂后的聚类结果;基于所述分裂后的聚类结果,计算各类中心间的相似度值;基于所述各类中心间的相似度值,对各类进行聚合处理,得到所述最优的聚类结果。6.如权利要求5所述的基于改进构造性覆盖聚类算法的数字文化可视化方法,其特征在于,所述计算各类内样本到类中心的标准向量差,并基于所述标准向量差对所述初始聚类结果进行分裂处理,得到分裂后的聚类结果,包括:对于所述初始聚类结果,计算各类内样本到类中心的标准向量差:σ
i
=(σ
1i
,σ
2i
,...,σ
ni
)
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。