拼音序列到汉字串(词组)的转换方法技术

技术编号:2893355 阅读:283 留言:0更新日期:2012-04-11 18:40
拼音序列到汉字串(词组)的转换方法,以汉字字音数据库和汉字词语数据库为基础,在其上建立了完成自动分词、同音词辩识的拼音序列到汉字串的转换器,辅以拼法检查、自动记忆、组词造码、多次变换等技术,用户可以选择使用汉字的四声,以进一步提高输入速度。在同音词辩识中考虑了词频、词词搭配、临近环境、前缀和后缀、专有名词、(人名、地名)等因素,大幅度降低了同音词的重码率。用户在使用时用标准的汉语拼音连续输入,无需每输入一个字即停下来进行选择。(*该技术在2009年保护过期,可自由使用*)

【技术实现步骤摘要】

【技术保护点】
拼音序列到汉字串(词组)的转换方法(简称转换方法),其特征在于,A.一个汉字字音数据库,汉字字音的数据结构为汉字,声母,韵母,四声,使用频度B.一个汉字词语数据库,汉字词语的数据结构为词条,词音,词类,语义项,使用频度C .建立在上述两个数据库基础上的拼音序列到汉字串的转换器,转换器包括自动分词和同音词辨识,同音词辨识的判别规则包括词频、词词搭配、临近环境、前缀和后缀、专有名词(人名和地名)。

【技术特征摘要】

【专利技术属性】
技术研发人员:李慧勤陈力为张普朱守涛于耀宗邱德政李红刘国琴左京强沈刚黄建平向华张庆任杰
申请(专利权)人:能源部电力科学研究院机械电子工业部计算机与微电子发展研究中心北京语言学院
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1