一种汉字输入方法和装置制造方法及图纸

技术编号:5962210 阅读:363 留言:0更新日期:2012-04-11 18:40
本发明专利技术的实施例提供了一种汉字输入方法和装置,可解决现有技术汉字输入速度慢的问题。所述方法包括:获取拼音串;根据词典对所述拼音串进行切分以获得拼音串的拼音子串;根据词典获取与拼音子串对应的候选词条,以及该候选词条对应的出现概率、其它词条出现条件下该候选词条的出现概率、该候选词条的词性;根据上述候选词条自左向右计算每一候选词条的权重;并根据候选词条的权重确定输入结果。本发明专利技术的实施例,由于考虑了词的词性,由于词性有一定的约束关系,通过这种约束关系,会提高了输入拼音串对应汉字的正确性,进而提高了输入速度。

【技术实现步骤摘要】

本专利技术涉及一种汉字输入技术,尤其涉及一种汉字输入方法和装置
技术介绍
在打字的时候,我们需要使用输入法系统记录想要表达的信息,而这些信息中很 大的一部分都是较长的句子,将拼音一次完整输入并得到想要的句子,这就需要使用输入 法系统中的一个重要功能-智能组句。我们知道同一个拼音串可以对应多个词、词条或者 句子,输入法系统为了更大可能的向用户提供该拼音所表达的信息,目前输入法系统主要 根据词条出现的概率找到出现概率最大的词条、短语或者句子作为备选项。在输入汉字的时候输入法系统提供的备选词一般是选择日常生活中出现概率较 高的词条、词条以及英文单词按照降序排列的。当输入较长的句子时,就使用智能匹配算法 组合出共现概率最大的句子作为备选项。例如在输入拼音串xian'cheng之后,根据该拼音 串对应的各个词条出现的频率(或者概率)进行排序,“县城”会排在“现成”和“线程”前 面,而“先乘”这样的词条因为出现次数较少,没有被记录到输入法系统的词库选中。在输入一句话时,输入法系统会根据输入的拼音进行切分,再根据词出现的频率 找到共现概率最大的句子。例如图1所示。如图1所示,对于输入的拼音串本文档来自技高网...

【技术保护点】
1.一种汉字输入方法,其特征在于,包括:获取拼音串;根据词典对所述拼音串进行切分以获得拼音串的拼音子串,所述词典包括词条、词条对应的拼音、词条的出现概率、其它词条出现条件下该词条的出现概率、词性、词性之间的条件概率;从词典中获取与拼音子串对应的候选词条,以及该候选词条对应的出现概率、其它词条出现条件下该候选词条的出现概率、该候选词条的词性;根据候选词条的出现概率、其它词条出现条件下该候选词条的出现概率、所述候选词条的词性自左向右计算每一候选词条的权重;从包括拼音串的最后拼音子串对应的所有候选词条的权重中,找出权重最大的候选词条,并根据该权重最大的候选词条确定所述拼音串对应的各个候选词条,将这些...

【技术特征摘要】

【专利技术属性】
技术研发人员:蔡衡董恭谨李洋
申请(专利权)人:新浪网技术中国有限公司
类型:发明
国别省市:11[中国|北京]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1