一种输入法系统及智能组词的方法技术方案

技术编号：3765304 阅读：378 留言：0更新日期：2012-04-11 18:40

本发明专利技术提供了一种输入法系统，该系统包括：词库；口语模板，所述口语模板与口语词条的各种特征及判定标准相关；输入接口单元，用于接收用户的输入信息；信息转换单元，用于依据所接收的输入信息，检索词库，得到相应的候选项；智能组词单元，用于依据所述口语模板，智能组词得到相应的候选项；显示输出单元，用于展示候选项，并输出用户选择的候选项。本发明专利技术还公开了一种智能组词的方法。通过本发明专利技术，可以帮助用户更好的输入口语词汇，提高输入体验和输入效率，效率较高而且成本较低，并且可以适应口语词汇变化更新速度比较快的特性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于信息处理领域，特别是涉及一种输入法系统和一种智能组词的方法。
技术介绍
当前的输入法系统(包括中文、日文等等)都是基于其词库系统以及词库系统中的词频来为使用者在信息输入过程中提供候选词的排序。候选词的排序是使用者在信息输入过程中首选词命中率高低的一个重要指标。所述首选词命中率是指，接收用户的输入信息之后，排序在前的词汇或字是用户最需要的。现有技术为了提高首选词命中率，采取了各种措施，例如，扩大词库的容量，存储更多的词条；或者通过各种方式获取最近的新词以及更准确的词频信息；或者，采用加载专业词库的方式，提高用户在某些特殊输入情况下的首选词命中率。应该说，这些技术改进在一定程度上可以提高用户的首选词命中率，但是对于本专利技术期望处理的口语词条，却是无能为力。本专利技术期望获取的口语词条实际上可以分为两个类别，一是普通的口头用语，一是网络语言。对于口头用语，由于人们对口头用语的使用比书面语更加的灵活和不拘一格，如，"试试看"、"走一走"、"吃个饭"、"打会球"等等，所以采用现有的各种词汇的收集方法难以获得准确的和足够全面的口头用语。而对于网络语言，由于其具有更为复杂的特性，例如汉字/数字/字母混用("8 错"、"期待ing，，等)，甚至还有符号的参与；错词率非常高("娃哈哈"、"哇哈哈"、"挖哈哈"等)；随时间的动态变化性很强。所以釆用现有的各种词汇的收集方法更是无法获取。现今对上述的口语词条的获取和研究往往采用人工的形式，因为研究人员的主观能动性可以很好的满足这些口语词条的复杂特性。例如，由北京广l番学院播音主持...

【技术保护点】
一种输入法系统，其特征在于，包括：　词库；　口语模板，所述口语模板与口语词条的各种特征及判定标准相关；　输入接口单元，用于接收用户的输入信息；　信息转换单元，用于依据所接收的输入信息，检索词库，得到相应的候选项；　　智能组词单元，用于依据所述口语模板，智能组词得到相应的候选项；　显示输出单元，用于展示候选项，并输出用户选择的候选项。

【技术特征摘要】

【专利技术属性】
技术研发人员：张扬，郭奇，
申请(专利权)人：北京搜狗科技发展有限公司，
类型：发明
国别省市：11[中国|北京]

全部详细技术资料下载我是这个专利的主人