一种提取目标字符的方法及装置制造方法及图纸

技术编号:19424961 阅读:48 留言:0更新日期:2018-11-14 10:34
本发明专利技术公开了一种提取目标字符方法,包括:接收到文本数据后,将所述文本数据转换为字符数据;将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;输出所述目标字符。本发明专利技术还同时公开了一种提取目标字符装置及计算机可读存储介质。

【技术实现步骤摘要】
一种提取目标字符的方法及装置
本专利技术涉及文字识别匹配技术,尤其涉及一种提取目标字符的方法、装置及计算机可读存储介质。
技术介绍
目前,手机终端只具备接收验证码内容信息并没有对接受到的内容进行精确提取,并以统一格式的字符串将验证码内容展示给用户。因此,现有手机短信平台并没有把内容与验证码分开,缺乏突出显示验证码的功能,用户体验这一环节上不理想。
技术实现思路
有鉴于此,本专利技术实施例期望提供一种目标字符的提取方法、装置及计算机可读存储介质,能够精确有效地提炼短信内容获得短信验证码,同时通过不同颜色高亮显示验证码,从而提高了用户获取有效信息的速度。为达到上述目的,本专利技术实施例提供了一种提取目标字符的方法:接收到文本数据后,将所述文本数据转换为字符数据;将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;输出所述目标字符。其中,当接收到文本数据后,获取接收所述文本数据端口的端口格式;上述将所述待提取字符的字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符,所述方法包括判断所述接收到字符数据格式是否符合所述端口格式;当确定所述接收到字符数据格式符合所述端口格式时,根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符。其中,上述根据所述预设的目标字符正则表达式中的,对所述字符数据进行匹配之后,所述方法包括:当匹配失败后,将所述字符数据与预设的字符数据库的关键字符进行匹配;当所述字符数据与预设的字符数据库的关键字符匹配成功后,根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符。其中,上述判断所述接收到字符数据格式是否符合所述端口格式,包括:根据所述端口格式中包含的规则字符串,对所接收到字符数据进行匹配;匹配成功后,确定所述接收到字符数据格式符合所述端口格式。其中,上述根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符,包括:提取所述字符数据中的数字字符;根据预设的目标字符正则表达式,对所述数字字符进行匹配,将匹配成功获得的数字字符确定为目标字符。本专利技术实施例提供了一种提取目标字符的装置,所述装置包括:转换模块,匹配模块,输出模块;其中,转换模块,用于接收到文本数据后,将所述文本数据转换为字符数据;匹配模块,用于将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;输出模块,用于输出所述目标字符。其中,当接收到文本数据后,获取接收所述文本数据端口的端口格式,上述匹配模块,用于所述将所述待提取字符的字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符,所述匹配模块用于:判断所述接收到字符数据格式是否符合所述端口格式;当确定所述接收到字符数据格式符合所述端口格式时,根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符。其中,上述匹配模块,用于当匹配失败后,将所述字符数据与预设的字符数据库的关键字符进行匹配;当所述字符数据与预设的字符数据库的关键字符匹配成功后,根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符。其中,上述匹配模块,用于根据所述端口格式中包含的规则字符串,对所接收到字符数据进行匹配;匹配成功后,确定所述接收到字符数据格式符合所述端口格式。其中,上述匹配模块,用于提取所述字符数据中的数字字符;根据预设的目标字符正则表达式,对所述数字字符进行匹配,将匹配成功获得的数字字符确定为目标字符。本专利技术实施例提供了一种基于对象的社交装置,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器用于运行所述计算机程序时,执行:接收到文本数据后,将所述文本数据转换为字符数据;将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;输出所述目标字符。本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现:接收到文本数据后,将所述文本数据转换为字符数据;将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;输出所述目标字符。本专利技术实施例提供的一种提取目标字符的方法、装置及计算机可读存储介质,接收到文本数据后,将所述文本数据转换为字符数据;将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;输出所述目标字符。如此,通过本专利技术实施例所提出的提取目标字符的方法,能够精确有效地提炼短信内容获得短信验证码,同时通过不同颜色高亮显示验证码,从而提高了用户获取有效信息的速度。附图说明图1为本专利技术实施例提取目标字符的方法实现流程示意图;图2为本专利技术实施例提取目标字符的装置的结构示意图;图3为本专利技术实施例提取短信种验证码方法的流程图。具体实施方式为了能够更加详尽地了解本专利技术实施例的特点与
技术实现思路
,下面对本专利技术实施例的实现进行详细阐述。实施例一图1为本专利技术实施例提取目标字符的方法实现流程示意图,如图1所示,本专利技术实施例提取目标字符的方法包括:步骤101:接收到文本数据后,将所述文本数据转换为字符数据;其中,当接收到文本数据后,同时获取接收所述文本数据端口的端口格式;在实际应用中,常用的短信在传输时使用的编码方式有7-bit位编码、8-bit位编码以及Unicode编码,其中,7-bit位编码为GSM的默认编码方式,可以发送的最大英文字符为160个;8-bit位编码通常用于发送数据消息,例如:图片、音乐等;Unicode编码通常是由UTF-16编码以16位无符号整数位单位对中文进行编码,例如:一个中文字符是两个字节,直接对高位字节和低位字节进行十六进制转换就可以了。如“欢迎”,UniCode编码是6B228FCE,这同时也就是转换的结果,如果发送的串中有英文字符,那么在前面补全00,以保证一个字符对应两个字节。在短信的发送或接收过程中,均会涉及到短信地址的问题,其地址的编码规则与短信传输编码的方式保持一致,可以使用BCD8421码进行编码;例如:08916808501505F0;其中,08表示地址的长度,由(号码类型+号码长度)/2的十六进制进行表示;91表示号码类型;6808501505F0表示号码,其实际表达的号码为:+8613805515500,其中,对于号码的处理方法为,如号码是以+86开头,将+去掉,随后判断是否为偶数,如果不是,在号码的末尾处补F,最后将奇数位和偶数位互换。在实际应用中,接收到短信PDU串为:0891683108503705F0040D91683106504562F7000830507080635400046B228FCE后,可以获来自13600554267发送的“欢迎!”的信息,具体解析可参照下述表1的内容:表1步骤102:将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;其中,判断所述接收到字符数据格式是否符合所述端口格式;根据所述端口格式本文档来自技高网
...

【技术保护点】
1.一种提取目标字符的方法,其特征在于,所述方法包括:接收到文本数据后,将所述文本数据转换为字符数据;将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;输出所述目标字符。

【技术特征摘要】
1.一种提取目标字符的方法,其特征在于,所述方法包括:接收到文本数据后,将所述文本数据转换为字符数据;将所述字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符;输出所述目标字符。2.根据权利要求1所述的方法,其特征在于,当接收到文本数据后,获取接收所述文本数据端口的端口格式;所述将所述待提取字符的字符数据与预设的目标字符正则表达式进行匹配,确定出匹配于所述目标字符正则表达式的目标字符,所述方法包括:判断所述接收到字符数据格式是否符合所述端口格式;当确定所述接收到字符数据格式符合所述端口格式时,根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符。3.根据权利要求2所述的方法,其特征在于,所述根据所述预设的目标字符正则表达式中的,对所述字符数据进行匹配之后,所述方法包括:当匹配失败后,将所述字符数据与预设的字符数据库的关键字符进行匹配;当所述字符数据与预设的字符数据库的关键字符匹配成功后,根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符。4.根据权利要求1所述的方法,其特征在于,所述判断所述接收到字符数据格式是否符合所述端口格式,包括:根据所述端口格式中包含的规则字符串,对所接收到字符数据进行匹配;匹配成功后,确定所述接收到字符数据格式符合所述端口格式。5.根据权利要求2或3所述的方法,其特征在于,所述根据所述预设的目标字符正则表达式,对所述字符数据进行匹配,将成功匹配的字符确定为目标字符,包括:提取所述字符数据中的数字字符;根据预设的目标字符正则表达式,对所述数字字符进行匹配,将匹配成功获得的数字字符确定为目标字符。6.一种提取目标字符的装置,其特征在于,所述装置包括:转换模块,匹配模块,输出模块;其中,转换模块,用于接收...

【专利技术属性】
技术研发人员:姚德生叶天宽丁小波杨正铃欧伯武谭明武农家锴陈炎森周泽杰陈炫锦张炜东王绮媛於文婧郭骏逸赵茜邵韵潮曾小箭肖献骏
申请(专利权)人:中国移动通信集团公司中移互联网有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1