System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及一种基于矩阵的针对英语单词外观特征码的编码方法,属于计算机领域。
技术介绍
1、以人脸的例子引入,对于人脸,我们常用一些特征语言去描述一个人的脸部特征,比如:圆脸、鼻子大、嘴巴小、眉毛粗等,听者通过这些特征可以想到一些相似的脸。同样,对于英语单词来说,我们计算出它的外观特征码,通过特征码的比较,找到相似的单词。相关技术及对比如下:
2、1、现有的如公告号为cn113268972b,专利技术名称为:两英语单词外观相似度的智能计算方法、系统、设备和介质,是申请人在该篇文献的申请日之前申请的的,其包括以下步骤:(1)对26个英语字母进行重新排序,并给出每个字母的编码及代表符号;(2)根据编码,得两英语单词的编码序列;(3)依据排码组合公式,得两英语单词的排码序列;(4)根据排码序列及编码序列,计算两英语单词的相关系数值p;(5)计算两英语单词的相差系数x;(6)计算两英语单词的外观相似度s=p+x,基于外观相似度计算数值,判断两个英语单词的相似程度。关于两英语单词外观对比后得到相似度的方法,主要基于对字母数量一样多的两个英语单词进行外观相似度进行计算;
3、2、现有汉字外观特征的研究,但没有关于英语单词的,并且这些外观特征都没有通过数值(码)的形式表达出来。
4、3、而现有的编码研究,常见的有:
5、3.1、存在一些对英语单词进行编码的方法,这此方法为每个单词产生唯一的编码;而我们的编码不是唯一的,相似的单词具有一样的编码。
6、3.2、存在考虑了英语单词的发音
7、3.3、常见的英语单词编码方法,并没有压缩编码字符数;
8、3.4、现有的编码及其压缩方法,但没有针对英语单词外观的;
9、3.5、存在一些编码方法,它是基于外观的编码,但它的编码结果不反映外观的特征。
技术实现思路
1、为克服现有技术的缺陷,本专利技术提供一种基于矩阵的针对英语单词外观特征码的编码方法,本专利技术的技术方案是:
2、一种基于矩阵的针对英语单词外观特征码的编码方法,包括以下步骤:
3、s1、选择待编码的英语单词:所述的英语单词的字母均为小写字母,且英语单词不带标点符号,每一个英语单词的字母数量大于等于3个;
4、s2、根据26个英文字母在双目表格中的占位情况,形成第一批字母的占位矩阵,而这一批字母称作第一批字母;
5、s3、第一批字母的占位矩阵与m456模型矩阵运算,形成第一批字母外观特征码;
6、s4、将没有字母外观特征码的字母,形成第二批字母的占位矩阵,而这一批字母称作第二批字母;
7、s5、第二批字母的占位矩阵与m9123模型矩阵运算,形成第二批字母外观特征码;
8、s6、根据第一批字母外观特征码和第二批字母外观特征码,对英语单词进行字母替换,形成单词特征码集合;
9、s7、针对单词特征码集合,使用合码公式,得到初步合成编码;
10、s8、把初步合成编码进行62进制转换,结果就是最终编码。
11、所述的步骤s2具体为:
12、2.1、英语单词中的字母在双目表格中的占位情况,具体为:
13、
14、2.2、根据字母的占位情况,得到每个字母的占位矩阵,每个字母的占位矩阵用ms(ascii(字母)-96)来表示,具体每个字母的占位矩阵如下:
15、
16、2.3、根据步骤2.2中的矩阵,不包含m9的矩阵就是第一批字母的占位矩阵,这些字母分别是b、d、f、g、h、j、k、l、m、p、q、w、y。
17、所述的步骤s3具体为:
18、3.1、根据占位特点,设计m456模型矩阵如下:
19、
20、3.2、第一批字母的占位矩阵与m456模型矩阵运算公式如下:
21、
22、其中,si g456(字母)为字母的外观特征码;
23、⊙是矩阵运算中的hadamard积运算符;
24、max()为最大值函数,在矩阵中,取其最大值作为外观特征码;
25、其中,“字母”取值为b、d、f、g、h、j、k、l、m、p、q、w、y中的一个。
26、所述的步骤s4具体为:
27、4.1、根据字母外观情况,得到每个字母的九宫格占位情况:剩余的a、c、e、i、n、o、r、s、t、u、v、x、z的九宫格占位情况为
28、4.2、步骤4.2中剩余字母的占位情况,得到每个字母的占位矩阵,每个字母的占位矩阵用ms9(字母)来表示,其中,字母∈{a,c,e,i,n,o,r,s,t,u,v,x,z},具体每个字母的占位矩阵如下:
29、
30、所述的步骤s5具体为:
31、5.1、根据占位特点,设计m9123模型矩阵如下:
32、
33、5.2、第二批字母的占位矩阵与m9123模型矩阵运算公式如下:
34、
35、其中,sigm9(字母)为第二批字母的外观特征码;
36、⊙是矩阵运算中的hadamard积运算符;
37、max()为最大值函数,在矩阵中,取其最大值作为外观特征码;
38、其中,字母取值为a、c、e、i、n、o、r、s、t、u、v、x、z中的一个。
39、所述的步骤s6具体为:
40、wscl={sigm9(字母1),sig456(字母2),sig456(字母3),......,sigm9(字母n)};
41、其中,wscl代表了单词特征码集合,字母1为单词中的第一个字母,字母n为第n个字母,n的值为单词中字母的个数。字母如果属于第一批字母,则使用sig456(字母)代表该字母的特征码,如果字母属于第二批字母,则使用sigm9(字母)代表该字母的特征码。
42、所述的步骤s7具体为:
43、所述的合码公式如下:
44、
45、其中,t即代表单词外观特征码的初步合成编码,sk即为wscl集合中第k个单词特征码,max()的功能是:从矩阵的元素中,取出最大值。
46、所述的步骤s8具体为:
47、把初步合成编码t进行62进制转换,转换的结果就是最终编码。
48、一种基于矩阵的针对英语单词外观特征码的编码方法在人工智能领域的应用。
49、一种基于矩阵的针对英语单词外观特征码的编码方法在大数据领域的应用。
50、本专利技术的优点是:针对英语单词的外观,计算出它外观特征码,外观特征码表达了单词外观的特征,具有一样特征码的英语单词,外观是相似的。同时,因为有了特征码,英语单词外观对比的方法就变得简单,并且特征码的字符数量比原来单词的字母要少,存储空间可以得到节省。
<本文档来自技高网...【技术保护点】
1.一种基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,所述的步骤S2具体为:
3.根据权利要求1或2所述的基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,所述的步骤S3具体为:
4.根据权利要求3所述的基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,所述的步骤S4具体为:
5.根据权利要求4所述的基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,所述的步骤S5具体为:
6.根据权利要求5所述的基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,所述的步骤S6具体为:
7.根据权利要求6所述的基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,所所述的步骤S7具体为:
8.一种基于矩阵的针对英语单词外观特征码的编码方法在人工智能领域的应用。
9.一种基于矩阵的针对英语单词外观特征码的编码方法在大数据领域的应用。
【技术特征摘要】
1.一种基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,所述的步骤s2具体为:
3.根据权利要求1或2所述的基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,所述的步骤s3具体为:
4.根据权利要求3所述的基于矩阵的针对英语单词外观特征码的编码方法,其特征在于,所述的步骤s4具体为:
5.根据权利要求4所述的基于矩阵...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。