【技术实现步骤摘要】
本专利技术涉及计算机
,具体地,涉及一种字符处理方法和字符处理装置。
技术介绍
随着互联网应用的普及,越来越多的用户喜欢在各种应用的输入文本中使用emoji符号(表情符号)来表达心情和想法。针对这种趋势,统一码联盟(UnicodeConsortium)为每个emoji符号创建了对应的unicode码。统一码联盟最新发布的Unicode8.0版本总共含有7716个脚本和符号。其中,emoji符号新增37个,另还有4个emoji表情得到了更改。除了食物、大型飞鸟之外,Unicode8.0还涉及到笑脸、宗教以及多种运动符号。但对于使用MySQL的应用来说,新增的emoji符号可能造成数据库应用异常。这是因为5.6以下版本的MySQL数据库在使用UTF8字符集时最多使用三个字节存储emoji符号,导致部分emoji符号信息丢失。例如,目前苹果移动终端的操作系统支持新版的Unicode编码,导致客户通过苹果移动终端提交的京东反馈表(包含emoji符
【技术保护点】
一种字符处理方法,包括:从输入设备接收文本内容;识别所述文本内容中的第一字符;将所述第一字符转换为特殊字符串;将所述特殊字符串存储到数据库。
【技术特征摘要】
1.一种字符处理方法,包括:
从输入设备接收文本内容;
识别所述文本内容中的第一字符;
将所述第一字符转换为特殊字符串;
将所述特殊字符串存储到数据库。
2.根据权利要求1所述的字符处理方法,其中,所述识别所述文本
内容中的第一字符包括:
将所述文本内容由当前的编码格式转换为unicode编码格式;
从所述unicode编码格式的文本内容中识别所述第一字符。
3.根据权利要求2所述的字符处理方法,其中,所述从unicode编
码格式的文本内容中识别所述第一字符包括根据unicode码表通过正则
表达式匹配获得所述第一字符。
4.根据权利要求2所述的字符处理方法,其中,所述当前编码格式
包括UTF8、GBK2312。
5.根据权利要求1所述的字符处理方法,其中,所述特殊字符串包
含当前的编码格式的所述第一字符。
6.根据权利要求1所述的字符处理方法,其中,所述第一字符为
emoji字符。
7.根据权利要求1所述的字符处理方法,其中,所述第一字符为第
一类型的emoji字符。
8.根据权利要求1所述的字符处理方法,其中,所述数据库为
MySQL数据库。
9...
【专利技术属性】
技术研发人员:王冠,
申请(专利权)人:北京京东尚科信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。