两英语单词外观相似度的智能计算方法、系统、设备和介质技术方案

技术编号:29704095 阅读:18 留言:0更新日期:2021-08-17 14:32
本发明专利技术涉及一种两英语单词外观相似度的智能计算方法、系统、设备和介质,包括以下步骤:(1)对26个英语字母进行重新排序,并给出每个字母的编码及代表符号;(2)根据编码,得两英语单词的编码序列;(3)依据排码组合公式,得两英语单词的排码序列;(4)根据排码序列及编码序列,计算两英语单词的相关系数值p;(5)计算两英语单词的相差系数x;(6)计算两英语单词的外观相似度s=p+x,基于外观相似度计算数值,判断两个英语单词的相似程度。本发明专利技术的优点是:基于对字母数量一样多的两个英语单词进行外观相似度进行计算,得出一个客观的相似度值,不用需要神经网络训练方法;同时无需存储相似单词,并且步骤简短并有限,所以方便和有效。

【技术实现步骤摘要】
两英语单词外观相似度的智能计算方法、系统、设备和介质
本专利技术涉及一种两英语单词外观相似度的智能计算方法、系统、设备和介质,涉及人工智能、英语、计算机、数学、大数据、教学认知领域。
技术介绍
外观相似的英语单词(样子相似的单词)会影响人的记忆、阅读和理解,因此计算出两单词间外观相似度的方法非常重要。有了这个方法,除了在英语教学和学习中有帮助外,在人工智能中,对英语单词的智能纠错、智能提示、自然语言理解等十分有用,在大数据中,对大量英语单词进行分类也是一个重要的方法。现有技术所存在的弊端为:(1)现在对外观相近英语单词的判断,大部分是主观的判断,包括现在一些关于这方面的信息和材料都是经过长时间的人为的发掘,这种人为的发掘不客观,并且只发掘相似的单词,没有提供单词间的相似度。(2)也有一些公开的算法,是通过模糊神经网络的方法来存储相似单词匹配对,不是我们直接使用数学的方法,我们直接使用数学的方法效率是比较高的,因为模糊神经需要训练,而训练并不是几分钟就能解决的问题。(3)还有一些公开的方法,他们是针对汉字的方法。
技术实现思路
为克服现有技术的缺陷,本专利技术提供一种两英语单词外观相似度的智能计算方法、系统、设备和介质,本专利技术的技术方案是:一种两英语单词相似度的智能计算方法,包括以下步骤:(1)对26个英语字母进行重新排序,并给出每个字母的编码及代表符号;(2)根据编码,得两英语单词的编码序列,分别为DS1和DS2;(3)依据排码组合公式,得两英语单词的排码序列,分别为PM1和PM2;(4)根据排码序列及编码序列,使用位置变化相关系数公式计算两英语单词的相关系数值p;(5)计算两英语单词的相差系数x;(6)计算两英语单词的外观相似度s=p+x,基于外观相似度计算数值,判断两个英语单词的相似程度。所计算的两个英语单词,分别为第一英语单词和第二英语单词,且第一英语单词和第二英语单词的字母数量相同,字母数量大于等于5个,均为小写字母。所述的步骤(1)具体为:对26个英语字母进行重新排序,并给出每个字母的编码及代表符号,其中,所述的排序表格如下:其中,设集合C的代表符号如下:C={c1,c2,c3……cm……c26};cm代表第m个字母的编码;所述的步骤(3)具体为:依据排码组合公式,得第一英语单词的排码序列PM1,第二英语单词的排码序列PM2,所述的排码组合公式如下:N=COUNT(DSk)PMk[0]=MAX(DSk)所述的步骤(4)具体为:根据排码序列及编码序列,使用位置变化相关系数公式计算两单词的相关系数值p,位置变化相关系数p公式如下:公式中,di表示排码位置差,n为第一英语单词或第二英语单词的字母数量。所述的步骤(5)具体为:计算第一单词和第二单词的相差系数x,该相差系数公式中,n′为第一单词或第二单词的字母数量;第一个英语单词的第1个字母的编码表示为c11,第二个英语单词的第1个字母的编码表示为c21,同理ci1和ci2分别表示为第一个英语单词第i个字母的编码和第二个英语单词第i个字母的编码。所述的步骤(6)具体为:计算第一英语单词和第二英语单词的外观相似度数值s=p+x,基于外观相似度计算数值,判断第一英语单词和第二英语单词的相似度。一种两英语单词外观相似度的智能计算系统,包括排序模块,用于对26个英语字母进行重新排序,并给出每个字母的编码及代表符号;编码序列生成模块,用于根据编码,得两英语单词的编码序列,分别为DS1和DS2;排码序列生成模块,用于依据排码组合公式,得两英语单词的排码序列,分别为PM1和PM2;相关系数值计算模块,用于根据排码序列及编码序列,使用位置变化相关系数公式计算两英语单词的相关系数值p;相差系数计算模块,用于计算两英语单词的相差系数x;相似度计算模块,用于计算两英语单词的外观相似度s=p+x,基于外观相似度计算数值,判断两个英语单词的相似程度。一种电子设备,包括存储器以及一个或多个处理器;其中,所述存储器与所述一个或多个处理器通信连接,所述存储器中存储有可被所述一个或多个处理器执行的指令,所述指令被所述一个或多个处理器执行时,所述电子设备用于实现两英语单词相似度的智能计算方法。一种计算机可读存储介质,其上存储有计算机可执行指令,当所述计算机可执行指令被计算装置执行时,可用来实现两英语单词相似度的智能计算方法。本专利技术的优点是:基于对字母数量一样多的两个英语单词进行外观相似度进行计算,得出一个客观的相似度值(具体的一个数值),这个方法直接用数学方法,不用需要神经网络训练方法;同时无需存储相似单词,并且步骤简短并有限,所以方便和有效。附图说明图1是本专利技术的智能计算系统的结构框图。图2是本专利技术实施例第一英语单词daily的排码位置数据图。图3是本专利技术实施例第二英语单词diary的排码位置数据图。图4是本专利技术实施例第一英语单词daily和第二英语单词diary的排码位置差数据图。图5是本专利技术实施例第一英语单词daily和第二英语单词diary相差系数计算数据图。具体实施方式下面结合具体实施例来进一步描述本专利技术,本专利技术的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本专利技术的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本专利技术的精神和范围下可以对本专利技术技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本专利技术的保护范围内。参见图1,本专利技术涉及一种两英语单词相似度的智能计算方法,包括以下步骤:(1)对26个英语字母进行重新排序,并给出每个字母的编码及代表符号;(2)根据编码,得两英语单词的编码序列,分别为DS1和DS2;(3)依据排码组合公式,得两英语单词的排码序列,分别为PM1和PM2;(4)根据排码序列及编码序列,使用位置变化相关系数公式计算两英语单词的相关系数值p;(5)计算两英语单词的相差系数x;(6)计算两英语单词的外观相似度s=p+x,基于外观相似度计算数值,判断两个英语单词的相似程度。所计算的两个英语单词,分别为第一英语单词和第二英语单词,且第一英语单词和第二英语单词的字母数量相同,字母数量大于等于5个,均为小写字母,在本实施例中以daily和diary这两个单词为例,第一英语单词为daily,第二英语单词为diary;所述的步骤(1)具体为:对26个英语字母进行重新排序,并给出每个字母的编码及代表符号,其中,所述的排序表格如下:其中,设集合C的代表符号如下:C={c1,c2,c3……cm……c26};cm代表第m个字母的编码;比如c3代表了第3个字母的编码,也就是说它代表了字母k的编码0.4,简单的来说c3就代表0.4。...

【技术保护点】
1.一种两英语单词相似度的智能计算方法,其特征在于,包括以下步骤:/n(1)对26个英语字母进行重新排序,并给出每个字母的编码及代表符号;/n(2)根据编码,得两英语单词的编码序列,分别为DS1和DS2;/n(3)依据排码组合公式,得两英语单词的排码序列,分别为PM1和PM2;/n(4)根据排码序列及编码序列,使用位置变化相关系数公式计算两英语单词的相关系数值p;/n(5)计算两英语单词的相差系数x;/n(6)计算两英语单词的外观相似度s=p+x,基于外观相似度计算数值,判断两个英语单词的相似程度。/n

【技术特征摘要】
1.一种两英语单词相似度的智能计算方法,其特征在于,包括以下步骤:
(1)对26个英语字母进行重新排序,并给出每个字母的编码及代表符号;
(2)根据编码,得两英语单词的编码序列,分别为DS1和DS2;
(3)依据排码组合公式,得两英语单词的排码序列,分别为PM1和PM2;
(4)根据排码序列及编码序列,使用位置变化相关系数公式计算两英语单词的相关系数值p;
(5)计算两英语单词的相差系数x;
(6)计算两英语单词的外观相似度s=p+x,基于外观相似度计算数值,判断两个英语单词的相似程度。


2.根据权利要求1所述的一种两英语单词相似度的智能计算方法,其特征在于,所计算的两个英语单词,分别为第一英语单词和第二英语单词,且第一英语单词和第二英语单词的字母数量相同,字母数量大于等于5个,均为小写字母。


3.根据权利要求1或2所述的一种两英语单词相似度的智能计算方法,其特征在于,所述的步骤(1)具体为:对26个英语字母进行重新排序,并给出每个字母的编码及代表符号,其中,所述的排序表格如下:



其中,设集合C的代表符号如下:C={c1,c2,c3……cm……c26};cm代表第m个字母的编码;


4.根据权利要求1或2所述的一种两英语单词相似度的智能计算方法,其特征在于,所述的步骤(3)具体为:依据排码组合公式,得第一英语单词的排码序列PM1,第二英语单词的排码序列PM2,所述的排码组合公式如下:
N=COUNT(DSk)
PMk[0]=MAX(DSk)





5.根据权利要求1或2所述的一种两英语单词相似度的智能计算方法,其特征在于,所述的步骤(4)具体为:根据排码序列及编码序列,使用位置变化相关系数公式计算两单词的相关系数值p,位置变化相关系数p公式如下:公式中,di表示排码位置差,n为第一英语单词或第二英语单词的字母数量。<...

【专利技术属性】
技术研发人员:阮春颜熊绍丽骆剑锋
申请(专利权)人:东莞理工学院城市学院阮春颜熊绍丽骆剑锋东莞职业技术学院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1