【技术实现步骤摘要】
本申请涉及大数据领域,尤其涉及获取正则表达式的方法和相关装置。
技术介绍
1、正则表达式是对字符串(包括普通字符(例如a到z之间的字母)和特殊字符(称为“元字符”))操作的一种逻辑公式,就是用事先定义好的一些特定字符及这些特定字符的组合来生成正则表达式,用来表达对字符串的一种过滤逻辑。在数据处理中,可以通过正则表达式从文件、数据库或者网络传输的数据等多种场景中提取出符合要求的信息。因此,在从文件、数据库或者网络传输的数据等多种场景中提取出符合要求的信息之前,需要先获取能够表达需求的正则表达式。
2、目前,常用的获取正则表达式的方法如下:用户手动向正则表达式生成工具输入用于表达所需提取文本特征的文字内容;正则表达式生成工具对该文字内容进行分词;确定分词所得每个词语对应的正则表达式片段;正则表达式生成工具对正则表达式片段进行组合,输出正则表达式。
3、但是,在采用上述方法生成正则表达式时发现,生成的正则表达式的准确度较低。
技术实现思路
1、本申请提供一种获取正则表达式
...【技术保护点】
1.一种获取正则表达式的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述正则表达式的多个需求信息可以包括以下需求信息中至少一种:开头描述信息、主体描述信息和结尾描述信息,所述开头描述信息用于限定所述目标正则表达式的起始字符应满足的需求,所述主体描述信息用于限定所述目标正则表达式中除起始字符和结尾字符之外的字符应满足的需求,所述结尾描述信息用于限定所述目标正则表达式中结尾字符应满足的需求。
3.根据权利要求2所述的方法,其特征在于,所述多个控件包含M个单选框和M个字符类型名称以及第一输入框,所述M个单选框与所述M个
...【技术特征摘要】
1.一种获取正则表达式的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述正则表达式的多个需求信息可以包括以下需求信息中至少一种:开头描述信息、主体描述信息和结尾描述信息,所述开头描述信息用于限定所述目标正则表达式的起始字符应满足的需求,所述主体描述信息用于限定所述目标正则表达式中除起始字符和结尾字符之外的字符应满足的需求,所述结尾描述信息用于限定所述目标正则表达式中结尾字符应满足的需求。
3.根据权利要求2所述的方法,其特征在于,所述多个控件包含m个单选框和m个字符类型名称以及第一输入框,所述m个单选框与所述m个字符类型名称一一对应,所述m个单选框中每个单选框被选中时表示所述目标正则表达式的起始字符的类型为所述每个单选框对应的字符类型名称所指示的字符类型,m为正整数,所述m个单选框同时仅能有一个被选中,所述第一输入框用于输入所述目标正则表达式的起始字符。
4.根据权利要求3所述的方法,其特征在于,所述m个单选框中任意单选框被选中、所述输入框中输入有字符时,若所述输入框中输入的字符的类型与所述被选中的单选框对应的字符类型不同时,输出提示信息。
5.根据权利要求2所述的方法,其特征在于,所述多个控件包含n个复选框和n个字符类型名称,所述n个复选框与所述n个字符类型名称一一对应...
【专利技术属性】
技术研发人员:徐文斌,
申请(专利权)人:中国银行股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。