The embodiment of the invention provides a state machine, the state machine includes rules module, pre established rules for identifying the character set, the division rules including feature based set partitioning characters; editing module for feature according to the rules in the character set based on the division of regular expressions for editing state machine; pre classification module, used for pre classification using the partition rules treat character set character recognition; state recognition module uses the regular expression recognition process to identify the characters set partitioning.
【技术实现步骤摘要】
一种状态机
本专利技术涉及计算机
,特别涉及一种状态机。
技术介绍
词法分析(lexicalanalysis)是计算机语言学的基本功能之一,用于定义单词的组成方法。进行语法分析的程序或者函数称为词法分析器(Lexicalanalyzer,简称Lexer),也叫扫描器(Scanner)。词法分析器一般以函数的形式存在,供语法分析器调用。词法分析的第一阶段为识别所处理的单词中包含的字符集,该过程通常基于状态机。状态机为描述单词组成方法的图形,状态机由状态点和转换箭头组成,表示在一定的输入条件下,状态转换的过程。一个状态机和一个正则表达式相对应。现有的状态机主要有非确定性有限状态机和确定性有限状态机两种;其中非确定性有限状态机为在一定的输入条件下,状态转换不唯一的状态机;确定性有限状态机为在一定的输入条件下,状态转换唯一的状态机。现有的状态机所包含的状态与状态转换一般有上百个,由于数量大,所以使状态机的复杂性非常高,而状态机的高复杂性导致了编程语言在微系统上的实现有一定困难,并且导致处理字符的速度缓慢。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种状态机,通过 ...
【技术保护点】
一种状态机,其特征在于,所述状态机包括:规则模块,用于预先制定待识别字符集的划分规则,所述划分规则包括划分字符集所依据的特征;编辑模块,用于按照所述划分规则中划分字符集所依据的特征为状态机编辑正则表达式;预分类模块,用于利用所述划分规则对待识别字符集中的字符进行预分类;状态识别模块,用于利用所述正则表达式识别经过划分的待识别字符集。
【技术特征摘要】
1.一种状态机,其特征在于,所述状态机包括:规则模块,用于预先制定待识别字符集的划分规则,所述划分规则包括划分字符集所依据的特征;编辑模块,用于按照所述划分规则中划分字符集所依据的特征为状态机编辑正则表达式;预分类模块,用于利用所述划分规则对待识别字符集中的字符进行预分类;状态识别模块,用于利用所述正则表达式识别经过划分的待识别字符集;其中,所述规则模块包括:第一规则单元,用于以大写字母、小写字母...
【专利技术属性】
技术研发人员:李小明,胡胜发,
申请(专利权)人:安凯广州微电子技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。