两英语单词外观相似度的智能计算方法、系统、设备和介质技术方案

技术编号：29704095 阅读：18 留言：0更新日期：2021-08-17 14:32

本发明专利技术涉及一种两英语单词外观相似度的智能计算方法、系统、设备和介质，包括以下步骤：(1)对26个英语字母进行重新排序，并给出每个字母的编码及代表符号；(2)根据编码，得两英语单词的编码序列；(3)依据排码组合公式，得两英语单词的排码序列；(4)根据排码序列及编码序列，计算两英语单词的相关系数值p；(5)计算两英语单词的相差系数x；(6)计算两英语单词的外观相似度s＝p+x，基于外观相似度计算数值，判断两个英语单词的相似程度。本发明专利技术的优点是：基于对字母数量一样多的两个英语单词进行外观相似度进行计算，得出一个客观的相似度值，不用需要神经网络训练方法；同时无需存储相似单词，并且步骤简短并有限，所以方便和有效。

全部详细技术资料下载

【技术实现步骤摘要】
两英语单词外观相似度的智能计算方法、系统、设备和介质
本专利技术涉及一种两英语单词外观相似度的智能计算方法、系统、设备和介质，涉及人工智能、英语、计算机、数学、大数据、教学认知领域。
技术介绍
外观相似的英语单词(样子相似的单词)会影响人的记忆、阅读和理解，因此计算出两单词间外观相似度的方法非常重要。有了这个方法，除了在英语教学和学习中有帮助外，在人工智能中，对英语单词的智能纠错、智能提示、自然语言理解等十分有用，在大数据中，对大量英语单词进行分类也是一个重要的方法。现有技术所存在的弊端为：(1)现在对外观相近英语单词的判断，大部分是主观的判断，包括现在一些关于这方面的信息和材料都是经过长时间的人为的发掘，这种人为的发掘不客观，并且只发掘相似的单词，没有提供单词间的相似度。(2)也有一些公开的算法，是通过模糊神经网络的方法来存储相似单词匹配对，不是我们直接使用数学的方法，我们直接使用数学的方法效率是比较高的，因为模糊神经需要训练，而训练并不是几分钟就能解决的问题。(3)还有一些公开的方法，他们是针对汉字的方法。
技术实现思路
为克服现有技术的缺陷，本专利技术提供一种两英语单词外观相似度的智能计算方法、系统、设备和介质，本专利技术的技术方案是：一种两英语单词相似度的智能计算方法，包括以下步骤：(1)对26个英语字母进行重新排序，并给出每个字母的编码及代表符号；(2)根据编码，得两英语单词的编码序列，分别为DS1和DS2；(3)依据排码组

【技术保护点】
1.一种两英语单词相似度的智能计算方法，其特征在于，包括以下步骤：/n(1)对26个英语字母进行重新排序，并给出每个字母的编码及代表符号；/n(2)根据编码，得两英语单词的编码序列，分别为DS1和DS2；/n(3)依据排码组合公式，得两英语单词的排码序列，分别为PM1和PM2；/n(4)根据排码序列及编码序列，使用位置变化相关系数公式计算两英语单词的相关系数值p；/n(5)计算两英语单词的相差系数x；/n(6)计算两英语单词的外观相似度s＝p+x，基于外观相似度计算数值，判断两个英语单词的相似程度。/n

【技术特征摘要】
1.一种两英语单词相似度的智能计算方法，其特征在于，包括以下步骤：
(1)对26个英语字母进行重新排序，并给出每个字母的编码及代表符号；
(2)根据编码，得两英语单词的编码序列，分别为DS1和DS2；
(3)依据排码组合公式，得两英语单词的排码序列，分别为PM1和PM2；
(4)根据排码序列及编码序列，使用位置变化相关系数公式计算两英语单词的相关系数值p；
(5)计算两英语单词的相差系数x；
(6)计算两英语单词的外观相似度s＝p+x，基于外观相似度计算数值，判断两个英语单词的相似程度。

2.根据权利要求1所述的一种两英语单词相似度的智能计算方法，其特征在于，所计算的两个英语单词，分别为第一英语单词和第二英语单词，且第一英语单词和第二英语单词的字母数量相同，字母数量大于等于5个，均为小写字母。

3.根据权利要求1或2所述的一种两英语单词相似度的智能计算方法，其特征在于，所述的步骤(1)具体为：对26个英语字母进行重新排序，并给出每个字母的编码及代表符号，其中，所述的排序表格如下：

其中，设集合C的代表符号如下：C＝{c1,c2,c3……cm……c26}；cm代表第m个字母的编码；

4.根据权利要求1或2所述的一种两英语单词相似度的智能计算方法，其特征在于，所述的步骤(3)具体为：依据排码组合公式，得第一英语单词的排码序列PM1，第二英语单词的排码序列PM2，所述的排码组合公式如下：
N＝COUNT(DSk)
PMk[0]＝MAX(DSk)

5.根据权利要求1或2所述的一种两英语单词相似度的智能计算方法，其特征在于，所述的步骤(4)具体为：根据排码序列及编码序列，使用位置变化相关系数公式计算两单词的相关系数值p，位置变化相关系数p公式如下：公式中，di表示排码位置差，n为第一英语单词或第二英语单词的字母数量。<...

【专利技术属性】
技术研发人员：阮春颜，熊绍丽，骆剑锋，
申请(专利权)人：东莞理工学院城市学院，阮春颜，熊绍丽，骆剑锋，东莞职业技术学院，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人