当前位置: 首页 > 专利查询>朱守涛专利>正文

计算机用PBS多元组合方式检索汉字的方法技术

技术编号:2863569 阅读:240 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种计算机汉字信息处理方法。解决GB18030和EXTENTION  B在内的超大字符集中疑难、复杂及不认识汉字的检索问题。包括由频繁使用的“GB2312+动态字符区”组成的前台字符集和后台字符集,动态字符区吸纳被用到的后台汉字,前台字符集通过空格键实现检索;前台没有的汉字可以在后台字符集中查找,并且一经使用,自动移到前台字符集,后台字符集通过回车键实现检索。PBS多元组合方式可有七种汉字检索方法。GB18030和EXTENTION  B超大字符集的汉字,大部分属疑难字,笔画多,在屏幕上看不清楚,因此,本发明专利技术设计了待选字的放大功能,单击鼠标右键,得到放大的汉字,并标明该字的拼音、笔形、拆白(结构拼音)、国标码、通用(UNICODE码),以方便人们查询和检索。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

该专利技术涉及一种计算机汉字信息处理方法。
技术介绍
现有技术检索汉字的方法,有全拼、简拼、混拼、纯笔形、音形混拼等方法。但这些方法对疑难字、结构复杂的复合字以及不认识的汉字的检索较为困难,甚至无法检索到。
技术实现思路
本专利技术目的是提供一种计算机能快速检索到疑难、复杂以及不认识汉字特别是检索GB18030或涵盖包括EXTENTION B在内的超大字符集的汉字检索方法。该计算机用PBS多元组合方式检索汉字的方法,包括由前台字符集和后台字符集组成的字符集,其特征是前台字符集由频繁使用的“GB2312+动态字符区”组成,动态字符区吸纳被用到的后台字符,前台字符集通过空格键实现检索;后台字符集为GB-18030或涵盖包括EXTENTION B在内的超大字符集,前台字符集没有的汉字可以在后台字符集中查找,并且一经使用,就自动移动到前台字符集,后台字符集通过回车键实现检索。其中,待检汉字可以采用结构拼音输入法,该方法是将汉字按照结构进行拆白,根据结构至少分为二部分,至多分为五部分,并键入各可读部分拼音,可以是全拼、简拼或混拼,按回车键检索,如果分成的部分,仍然不可读,可以输入该部分中的可读部分的拼音,按回车键检索,如果这个字仅仅有一个部分可读,则在可读的拼音前加“界符字母”,如[u]。待检汉字也可采用“拼音+结构拼音”输入的方式检索汉字,但需要在拼音即全拼或简拼与结构拼音之间加“界符”,如短横杠[-]。或采用“结构拼音+笔形”输入的方式检索汉字,笔形可以是一笔至六笔。也可采用“拼音+笔形+结构拼音”输入的方式检索汉字,。还可以采用笔形输入的方式检索汉字,使用笔形输入时,在该字笔形的前面加“界符”,如[u],按回车键检索。为了方便对检索汉字属性的了解,只要将鼠标焦点放在侯选窗的任一汉字上,再单击鼠标右键,就可以将这个字放大,并标明这个字的拼音、笔形、拆白(结构拼音)、国标码、通用(YNICODE码)。本专利技术优点及效果采用拼音、笔形、结构拼音相结合的方式检索汉字为首创。本专利技术通过软件编程,在计算机上实现以上技术,可以提高人们的工作效率。该方法特别对疑难字、结构复杂的复合字以及不认识的汉字的检索较为快捷、方便。具体实施例方式实施例PBS多元组合方式检索汉字,是指采用拼音(P)、笔形(B)、结构拼音(S)单独和组合使用,检索GB18030或涵盖包括EXTENTION B在内的超大字符集。该方法包括由前台字符集和后台字符集组成的字符集,前台字符集由频繁使用的“GB2312+动态字符区”组成,动态字符区吸纳被用到的后台字符集,前台字符集通过空格键实现检索;后台字符集为GB-18030或涵盖包括EXTENTION B在内的超大字符集,前台字符集没有的汉字可以在后台字符集查找,并且一经使用,就自动移动到前台字符集,后台字符集通过回车键实现检索。采用PBS多元组合方式可以有7种方法检索汉字第一、拼音采用全拼的方式,并按回车键。例如输入“鎔”字,输入拼音“rong”,按回车键,再翻页选择。第二、结构拼音使用汉字的结构表达一个汉字,是自古就有的方法。到了宋元时代,更发展为一项叫做“拆白道字”的技艺,非常流行。“你共人女边着子,争知我门里挑心”(黄廷坚),即用“女,子;门,心”表达“好闷”的意思。结构拼音,是指一个汉字的可读部分,一般遵照人们的自然习惯,不设严格的规则。大体要点1]主要针对结构复杂的复合汉字,独体字通常为常用字,目前不在检索范围。2]根据汉字大多数为形声字的特点,通常采用一分为二的办法,如输入“瓞”字,这个字的可读部分是“瓜”和“失”,因此输入结构拼音“guashi”,按回车键可以检索到“瓞”。再如输入“鎔”字,这个字的可读部分是“金”和“容”,因此输入结构拼音“jingrong”,按回车键可检索到“鎔”。3]如果分成的部分,仍然不可读(按照目前高中文化水平),可以输入该部分中的可读部分。例如输入“坚”,上半部分的可读部分是“又”,下半部分可读部分是“土”,因此输入“youtu”,按回车键检索。如果仅仅有一个部分可读,仍然可以查到该字。自古就有“汉字读半边”的说法。如果结构拼音是单个音节,则在前面加界符[u],(含义为unknow sound),表明不是整个汉字的读音,而是其中部分结构的读音。例如输入“猜”字,右边可读部分是“青”,因此输入“uqing”,按回车键可检索到“猜”。4]可读部分最多不超过五个。5]结构拼音可以单独使用,也可以和该字的拼音、笔形混合使用。单独使用的时候,最好用全拼;混合使用的时候,全拼、简拼、混拼皆可以使用。第三、u+笔形笔形输入是用数字键1、2、3、4、5、6、7、8分别代表“横、竖、撇、点、折、弯、叉、方”。“U”是笔形输入的界符,例如输入“鎔”,可以输入“u341445”,按回车键可检索到“鎔”。第四、拼音+笔形拼音的后面加笔形是为了减少检索的范围,最多可以加6个笔形。可以用全拼加笔形,也可以用简拼加笔形。例如输入“鎔”字,如果在全拼的后面加1个笔形“rong3”按回车键选择7;如果在全拼的后面加2个笔形“rong34”,不用选择;如果加3个或4个笔形,“rong341”或“rong3414”结果唯一。如果用简拼加1个笔形,“r3”按回车键,需翻页7次。如果用简拼加2个笔形,“r34”按回车键,需翻页1次如果用简拼加3个笔形,“r341”按回车键,无需翻页如果用简拼加4个笔形,“r3414”按回车键,无需翻页如果用简拼加4个笔形,“r34144”按回车键,唯一选择如果用简拼加6个笔形,“r341445”按回车键,唯一选择第五、拼音+结构拼音拼音加结构拼音,要在全拼或简拼的后面加短横杠[-],作为拼音和结构拼音的界符。例如输入“鎔”字。可以全拼加结构拼音“rong-jinrong”或“rong-jr”,也可以简拼加结构拼音“r-jinrong”或“r-jr”。按回车键可以检索到“鎔”。第六、结构拼音+笔形结构拼音可以全拼、简拼或混拼,可以加一个或多个笔形。例如输入“鎔”字,可以输入“jinrong3”或“jinrong34”或“jinrong341”或“jinrong3414”或“jinrong34144”或“jinrong341445”;“jr3”或“jr34”或“jr431”或“jr3414”或“jr34144”或“jr341445”。按回车键,可以检索到。第七、拼音+笔形+结构拼音在这种方式下拼音可以用全拼或简拼,笔形可以一个或多个,但使用简拼比较好,使用全拼信息的冗余量太大。例如输入“鎔”字,可以输入“rong34jinrong”或“r34jr”,按回车键,可以检索到。前台字符集通过空格键实现,例如输入“容”字,输入“rong”后按空格键,按空格键输入“容”字。“容”的同音字有“容、绒、融、溶、熔、荣、戎、蓉、冗、茸、嵘、狨、榕、肜、蝾”。后台字符集通过回车键实现。如果要输入“鎔”字,前台没有,输入“rong”按回车键,翻页5次,检索到“鎔”字并将其输入。如果再次输入“鎔”字,输入“rong”后按空格键,“鎔“的同音字有“容、绒、融、溶、熔、荣、戎、蓉、冗、羢、鎔、榕、嵘、狨、榕、肜、蝾”。“鎔”字已经自动移动到前台字符集。这种设计符合人们对汉字处理的规律。GB18030本文档来自技高网...

【技术保护点】
一种计算机用PBS多元组合方式检索汉字的方法,该方法包括由前台字符集和后台字符集组成的字符集,其特征是前台字符集由频繁使用的“GB2312+动态字符区”组成,动态字符区吸纳被用到的后台汉字,前台字符集通过空格键实现检索;后台字符集为GB-18030或涵盖包括EXTENTIONB在内的超大字符集,前台没有的汉字可以在其中查找,并且一经使用,就自动移动到前台字符集,后台字符集通过回车键实现检索。

【技术特征摘要】
1.一种计算机用PBS多元组合方式检索汉字的方法,该方法包括由前台字符集和后台字符集组成的字符集,其特征是前台字符集由频繁使用的“GB2312+动态字符区”组成,动态字符区吸纳被用到的后台汉字,前台字符集通过空格键实现检索;后台字符集为GB-18030或涵盖包括EXTENTIONB在内的超大字符集,前台没有的汉字可以在其中查找,并且一经使用,就自动移动到前台字符集,后台字符集通过回车键实现检索。2.根据权利要求1所述的计算机用PBS多元组合方式检索汉字的方法,其特征是待检汉字采用结构拼音输入法,该方法是将汉字按照结构进行拆白,根据结构至少分为二部分,至多分为五部分,并键入各可读部分拼音,可以是全拼、简拼或混拼,按回车键检索,如果分成的部分,仍然不可读,可以输入该部分中的可读部分的拼音,按回车键检索,如果这个字仅仅有一个部分可读,则在可读的拼音前加“界符字母”,如[u]。3.根据权利要求2所述的计算机用PBS多元组合方式检索汉字的方法,...

【专利技术属性】
技术研发人员:朱守涛李政
申请(专利权)人:朱守涛李政
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1