一种对多级字符串序列进行编码的方法技术

技术编号:6525299 阅读:266 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种对多级字符串序列进行编码的方法,可使多级字符串编码与多级字符串一一对应,通过该编码方法所获得的编码能够保留多级字符串的各级别的从属关系,多级字符串的各个级别在其编码中均能够有所反应。通过该方法对多级字符串序列进行编码处理后,可方便对多级别字符串序列进行分析处理。

【技术实现步骤摘要】

本专利技术涉及,属于信息处理领域。
技术介绍
随着计算机应用的日益广泛,越来越多的数据要需要计算机进行辅助管理和分析。计算机在对字符串类型数据进行分析之前,必须对其进行编码,且要求编码能够体现多级字符串的多级属性。本专利技术可以对大量的多级字符串进行统一编码,通过该方法可直接获得一个与多级字符串序列相对应的编码序列,且多级字符串序列中的多级字符串允许出现重复。在数据量较少时。
技术实现思路
为了避免现有技术的不足之处,本专利技术提出。,其特征在于具体步骤如下步骤1 计算多级字符串序列编码矩阵X的第1行令多级字符串序列矩阵S的第 1行对应的各级字符串编码全部为1,得到多级字符串序列编码矩阵X的第1行Xu,j = 1, 2,3,…,η ;所述的多级字符串序列矩阵S表示为

【技术保护点】
1.一种对多级字符串序列进行编码的方法,其特征在于具体步骤如下:步骤1:计算多级字符串序列编码矩阵X的第1行:令多级字符串序列矩阵S的第1行对应的各级字符串编码全部为1,得到多级字符串序列编码矩阵X的第1行Xij,j=1,2,3,…,n;所到了多级字符串序列编码矩阵X,表示为:ij=1,j=p+2,p+3,…,n;当检查直至矩阵S(1),结果仍为不相同时,多级字符串序列编码矩阵X的第i行的编码为:Xi1=max(Xk1)+1,k∈{1,2,3,…,i-1};Xij=1,j=2,3,4,…,n;当第m行编码完成,得第i行的编码为:Xij=Xkj,j=1,2,3,…,p,{k|k<i,Sk1=Si1,Sk2=Si2,…,Skp=Sip};Xi(p+1)=max(Xk(p+1))+1,{k|k<i,Sk1=Si1,Sk2=Si2,…,Skp=Sip};X新矩阵进行同样的检查,若检查结果仍为不相同,则继续去掉新矩阵的最后一列,直至检查到当前多级字符串序列矩阵为n(n-1)列,即多级字符串序列矩阵S(1);在上述检查中,当检查到多级字符串序列矩阵S(p)结果为相同时,多级字符串序列编码矩阵X的i(n-i)是否与矩阵S(n-1)中的第1行至第i-1行的某个多级字符串Sk1,Sk2,…,Sk(n-1),k∈{1,2,3,…,i-1}完全相同,在检查结果为不相同时,去掉当前多级字符串序列矩阵中的最后一列得到新的多级字符串序列矩阵,并对,Skn,k∈{1,2,3,…,j-1}完全相同,若相同Xij=Xkj,j=1,2,3,…,n;若不相同,去掉多级字符串序列矩阵S中的最后一列,得到n-1列的多级字符串序列矩阵S(n-1),继续检查矩阵S(n-1)中的Si1,Si2,…,S述的多级字符串序列矩阵S表示为:步骤2:在i∈{2,3,…,m}范围内依次计算多级字符串序列编码矩阵X的第i行的元素Xij,j=1,2,3,…,n;首先检查Si1,Si2,…,Sin是否与第1行至第i-1行的某个多级字符串Sk1,Sk2,…...

【技术特征摘要】
1. 一种对多级字符串序列进行编码的方法,其特征在于具体步骤如下 步骤1 计算多级字符串序列编码矩阵X的第1行令多级字符串序列矩阵S的第...

【专利技术属性】
技术研发人员:陈俊杰徐乙人杨云涛
申请(专利权)人:西北工业大学
类型:发明
国别省市:87

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1