计算机语言标识信息的方法技术

技术编号:2858320 阅读:377 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种计算机语言标识信息的方法。该方法的格式由标签和内容构成,其标签采用首标签的单一形式,没有尾标签;内容块中可以是子标签和子标签对应的内容。内容可以包含一行或者多行,如果内容为多行,或者内容是子标签和子标签对应的内容,则成为内容块;标签、内容块、子标签、子标签对应的内容可以多层嵌套,层数不受限制,其逻辑结构为树状;该方法的描述结构清晰,可读性高,采用首标签的单一形式,易于编写分析软件,SML文件可以转换成XML文件,利用SML相关的工具软件可以实现SML文本的解析,成生,编辑,以及和XML文本,HTML文本,数据库中的数据的转换功能。

【技术实现步骤摘要】

本专利技术属于计算机信息处理
,特别涉及一种。
技术介绍
信息的标识有两种基本方法1、采用自然语言标识,即名称;2、采用数字编码方式标识,即代码。例如,对于一个公司的员工和岗位,员工的名字和岗位名称属于自然语言标识,工号和岗位编码属于编码方式标识。采用自然语言标识信息的方法可以被掌握这门自然语言的所有人理解,可以用在日常生活,工作,交流中,也可以用在计算机领域。采用数字编码方式标识的信息不容易被人理解,用途局限于计算机领域或者某个专业领域。目前,采用自然语言标识信息的方法有可扩展标记语言(ExtensibleMarkup Language,XML),它是标准通用标记语言(Standard Generic MarkupLanguage,SGML)的一个子集。XML由XML工作组(原先的SGML编辑审查委员会)开发,此工作组由World Wide Web Consortium(W3C)在1996年主持成立。XML以文本方式(即采用自然语言标识)定义了信息的保存和交换规则,使在Web上能以现有超文本标记语言(Hypertext Markup Language,HTML)的使用方式提供,接收和处理通用的SGML成为可能。由于XML采用了自然语言标识信息,容易被人理解,降低了维护和交流成本。目前,XML已经在Internet领域获得了广泛应用。在计算机中,采用自然语言标识的信息采用文本方式保存和加工,采用数字编码标识的信息采用二进制方式保存和加工。采用自然语言标识信息的方法容易被人理解,但是如果要采用计算机识别和加工,还需要以下工作1.消除二义性;2.增加信息组合规则;3.增加信息识别规则。
技术实现思路
本专利技术的目的在于,提供一种。对于同样的信息,采用该方法描述比Window INI文件格式的描述结构清晰,可读性高;比采用XML描述更容易阅读。该方法采用首标签的单一形式,易于编写分析软件。XML相关的工具软件可以完成对文本的分析,生成文本。通过该方法,可以将文本转换成其它形式,例如,XML文本,HTML文本,数据库中的数据,从而可以利用现有的工具软件对信息进行进一步加工。实现上述专利技术目的的技术解决方案是,创建一种,其特征在于信息标识由标签(Tag)和内容(Content)构成,其标签采用首标签的单一形式,没有尾标签,即标签在前,内容在后;内容可以包含一行或者多行,如果内容为多行,或者内容是子标签和子标签对应的内容,则成为内容块(Content Block);内容块中可以是子标签(SubTag)和子标签对应的内容(Sub Content);标签、内容块、子标签、子标签对应的内容可以多层嵌套,层数不受限制,其逻辑结构为树状。(1)基本结构SML语言由转移符,注释和元素组成,相关的定义如下转义符(Escape)反斜杠“\”是转义符,与C语言的转义符相同;注释(Comment)是以下之一①注释行或②注释块; 注释行(Comment Line)以双斜杠“//”开始,其后为注释,直到本行结束;与C++语言的行注释相同;注释块(Comment Block)以“/*”开始,以“*/”结束,中间的部分为注释内容;与C语言的注释相同;元素(Element)由标签和以下之一组成①内容块,②内容。标签(Tag)定位符“@”+标签名,“@”为保留字符,标签名由用户定义,符合以下规则(1)第一个字符不是定位符@,或者第一个字符是转义符加定位符\@;(2)不能包含空白字符;(3)不包含斜杠“/”;内容块(Content Block)由以下之一组成(1)一对花括号“{”,“}”和包含在这对花括号中的元素;(2)一对花括号“{”,“}”和包含在这对花括号中的内容;内容(Element Content)两个标签之间,或者最后一个标签之后的空白(Blank)和非空白(Non-blank);空白(Blank)一个或者多个连续的空白字符,非空白行最后的换行字符;空白字符(Blank Character)空格(‘’),制表符(‘
’);非空白行(Non Blank Line)换行字符之前至少有一个非空白字符的行;非空白字符(Non Blank Line)除了空白字符,换行字符以外的字符;非空白(Non-blank)一个或者多个连续的非空白字符,或者一个字符串(String);字符串(String)包含在双引号之间的字符,符合以下规则不能是换行字符;换行字符(Line Feed)(‘\n’); 空白行(Blank Line)换行字符之前只有一个或者多个空白字符,没有非空白字符的行;(2)SML的标签第一个字符不是定位符@,或者第一个字符是转义符加定位符\@;SML标签名不能包含空白字符;SML标签名中不包含斜杠“/”;SML标签名建议如果标签名称为一个单词,则采用小写字母;SML标签名建议如果标签名为两个或者多个单词,则采用下划线连接,每个单词采用小写字母;SML标签名建议标签名中的缩写词视为一个普通单词;(3)SML的字符串SML将字符串视为一个完整的非空白(Non-blank);字符串可以出现在元素内容中的任意一行中的任意位置,并在本行内结束;元素内容中可以包含一个或者多个字符串;SML不解释字符串中的内容,即,保持字符串中的所有字符;如果字符串内容中有双引号,制表符,换行符,应该使用转义符;如果字符串中有定位符“@”,可以不使用转义符;(4)SML的内容如果一个非空白行的前面一行是空白行,则这个非空白行是开始行;如果一个非空白行的后面一行是空白行,则这个非空白行是结束行;从起始行(包括)到其后的第一个结束行(包括),称为一个段落;SML保留一个段落最后的换行符,而将这个段落中间的换行符定义为空白。即,如果这一行是结束行,则保留其后的换行符,如果不是结束行,则其后的换行符视为空白;SML将一行中字符串以外的连续的空白字符,以及段落中间的换行字符定义为空白,其作用等效于一个空格,仅仅表示前面的文字和后面的文字没有连在一起;(5)SML树SML的逻辑结构为树状,称为SML树;SML的每个元素对应SML树中的一个节点;SML树的叶子节点包含标签和内容,内容可以为空;这种情况并不等效于不包含内容,而应理解为,内容存在,但内容为空;SML树的非叶子节点只包含标签,不包含内容;(6)SML树的访问在SML树中,元素的路径指节点的路径,节点的路径是从相对节点开始到这个节点的所有节点构成的标识;在SML树中,一个节点可以有两种路径命名路径(Named Path)和索引路径(Index Path);一个节点的命名路径由标签名构成,即,从相对节点到这个节点的所有节点的元素的标签名构成的标识,以斜杠字符“/”作为分隔符;一个节点的索引路径由节点索引构成,即,从相对节点到这个节点的所有节点的索引构成的标识,以斜杠字符“/”作为分隔符;索引由定位符@+索引值构成;(7)冒号的使用在标签前缀字符“@”和标签名之间使用“”;分隔符“”的作用是①视觉上容易识别;②在Windows系统下,用鼠标双击抓词比较方便,在一般情况下,双击时不会选中“”,如果没有分隔符,则双击抓词会选中定位符“@”;不能使用汉字的冒号“”,汉字的冒号不能起到分隔作用。该表识信息方法具有以本文档来自技高网
...

【技术保护点】
一种计算机语言标识信息的方法,其特征在于,标识信息由标签和内容构成,其标签采用首标签的单一形式,没有尾标签,即标签在前,内容在后;内容可以包含一行或者多行,内容块中可以是子标签和子标签对应的内容,标签、内容块、子标签、子标签对应的内容可以多层嵌套,层数不受限制,其逻辑结构为树状。

【技术特征摘要】
1.一种计算机语言标识信息的方法,其特征在于,标识信息由标签和内容构成,其标签采用首标签的单一形式,没有尾标签,即标签在前,内容在后;内容可以包含一行或者多行,内容块中可以是子标签和子标签对应的内容,标签、内容块、子标签、子标签对应的内容可以多层嵌套,层数不受限制,其逻辑结构为树状。2.如权利要求1所述的计算机语言标识信息的方法,其特征在于,分析SML的文本,检查语法和语义,如果检查通过,则自动识别SML文本中的内容,生成可以进一步加工的数据。3.如权利要求1所述的计算机语言标识信息的方法,其特征在于,将用户的数据按照SML的语法进行编码,产生SML文本。4.如权利要求1所述的计算机语言标识信息的方法,其特征在于,为使用者提供一个图形操作界面,向使用者显示SML树,使用者选择图符或者文字,插入到SML树的指定位置,修改或者删除SML树中的节点,生成SML的文本。5.如权利要求1所述的计算机语言标识信息的方法,其特征在于,提供一个文本编辑器,用户可以编辑SML文本,用不同的颜色显示SML的关键字,识别文本的SML语法错误。6.如权利要求1所述的计算机...

【专利技术属性】
技术研发人员:刘伟
申请(专利权)人:西安大唐电信有限公司
类型:发明
国别省市:87[中国|西安]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1