【技术实现步骤摘要】
本专利技术涉及文本分类,尤其涉及一种基于k均值聚类算法的单词分类方法及系统。
技术介绍
1、英语是一种拼写语言,其单词组成过程是由字母构成音素,再由音素构成词素,最后由词素构成单词,但是学习者在面对拼写相似的单词时,从视觉上往往容易混淆,从而造成记忆上的困难,影响学习效率。
2、公开号cn 110909161 b的专利公开了一种基于密度聚类和视觉相似度的英文单词分类方法,其步骤为:英文单词预处理;计算所选英文单词与每个英文单词的视觉相似度和距离;若邻域集中单词个数大于或等于2,则将所选单词加入空簇后选择未分类英文单词;处理未访问的未分类英文单词;对已访问的未分类英文单词,直接将其加入簇;判断是否有未分类英文单词,若有则选择未分类英文单词,否则将簇作为新一类单词标记为已访问;若单词均已访问,输出各类。
3、该专利利用对所选英文单词与原始待分类单词集合中的每个英文单词进行预处理,计算所选英文单词与原始待分类单词集合中的每个英文单词的视觉相似度,计算所选英文单词与原始待分类单词集合中的每个英文单词的距离,克服了在计算英
...【技术保护点】
1.基于K均值聚类算法的单词分类方法,其特征在于,将单词按照构造分类,所述将单词按照构造分类包括以下步骤:
2.根据权利要求1所述的基于K均值聚类算法的单词分类方法,其特征在于,在步骤5之后还包括:
3.根据权利要求1所述的基于K均值聚类算法的单词分类方法,其特征在于,步骤4中,所述相似度的计算方法如下:
4.根据权利要求3所述的基于K均值聚类算法的单词分类方法,其特征在于,所述相似的字母为“u”与“v”、“c”与“o”、“p”与“q”、“b”与“d”。
5.根据权利要求3所述的基于K均值聚类算法的单词分类方法,其特征在
...【技术特征摘要】
1.基于k均值聚类算法的单词分类方法,其特征在于,将单词按照构造分类,所述将单词按照构造分类包括以下步骤:
2.根据权利要求1所述的基于k均值聚类算法的单词分类方法,其特征在于,在步骤5之后还包括:
3.根据权利要求1所述的基于k均值聚类算法的单词分类方法,其特征在于,步骤4中,所述相似度的计算方法如下:
4.根据权利要求3所述的基于k均值聚类算法的单词分类方法,其特征在于,所述相似的字母为“u”与“v”、“c”与“o”、“p”与“q”、“b”与“d”。
5.根据权利要求3所述的基于k均值聚类算法的单词分类方法,其特征在于,步骤2中,所述预设的k...
【专利技术属性】
技术研发人员:龚立玲,高源,王樊,罗姚,黄万里,朱军,黄杨,张东,
申请(专利权)人:重庆思途元景科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。