【技术实现步骤摘要】
本专利技术涉及文字输入领域,特别涉及一种文字输入方法及系统。
技术介绍
输入法软件是一种常 见的文字输入系统,通常的操作流程为输入法软件接收用户通过键盘输入的代码序列(如拼音或五笔等),然后将代码序列作为参数利用通用语言模型找出与代码序列对应的候选语句序列,并计算出每个候选语句在候选语句序列中的上屏概率,然后根据上屏概率的大小将候选语句序列排序,最后将候选语句序列展现给用户。用户只需要在候选语句序列中选出想要的词语即可完成输入。传统的文字输入方法,一般采用通用语言模型构建输入法的核心,这种通用语言模型是通过对大规模训练语料统计分析后得到的,大规模训练语料通常从互联网上自动获取,代表了大多数用户的一般性输入需求,即这种通用语言模型根据大多数人输入文字时的具有普遍性的选词习惯建立。而用户在使用输入法软件输入文字时,往往希望能够快速获取自己常用以及习惯性使用的文字,每个用户在进行选词时,由于身份不一样,兴趣爱好和文字输入的领域不一样,所希望排序靠前的候选语句序列也不一样。例如,科研工作者和银行职员在输入文字时,往往希望自己领域的专业术语排在最前面。再例如,东北人和四川人在输入 ...
【技术保护点】
一种文字输入方法,包括以下步骤:获取用户标识,根据用户标识查找对应的用户语言模型;获取用户输入,根据所述用户输入生成候选语句列表;获取通用语言模型,根据所述用户语言模型和通用语言模型计算所述候选语句列表中的候选语句的上屏概率;按照所述上屏概率的大小顺序对所述候选语句列表中的候选语句进行排序;输出排序后的候选语句列表。
【技术特征摘要】
1.一种文字输入方法,包括以下步骤 获取用户标识,根据用户标识查找对应的用户语言模型; 获取用户输入,根据所述用户输入生成候选语句列表; 获取通用语言模型,根据所述用户语言模型和通用语言模型计算所述候选语句列表中的候选语句的上屏概率; 按照所述上屏概率的大小顺序对所述候选语句列表中的候选语句进行排序; 输出排序后的候选语句列表。2.根据权利要求I所述的文字输入方法,其特征在于,所述方法还包括建立与用户标识对应的用户语言模型并在每次用户输入词条后根据用户输入的词条信息更新用户语言模型的步骤。3.根据权利要求2所述的文字输入方法,其特征在于,所述更新用户语言模型的步骤具体为 记录用户输入的词条信息和词频信息; 获取所述词条信息和词频信息,对词条进行分词,根据所述词频信息对分词后的词条进行词频整理; 根据分词后的词条和整理后的词频更新所述用户语言模型。4.根据权利要求I至3中任意一项所述的文字输入方法,其特征在于,所述根据所述用户语言模型和通用语言模型计算所述候选语句列表中的候选语句的上屏概率的步骤为 对所述用户语言模型和通用语言模型进行线性插值,生成混合模型,根据所述混合模型计算所述候选语句列表中的候选语句的上屏概率。5.一种文字输入方法,包括以下步骤 客户端获取用户标识,根据用户标识从服务器查找对应的用户语言模型; 所述客户端获取用户输入,将所述用户输入上传到服务器,所述服务器根据所述用户输入生成候选语句列表; 所述服务器获取通用语言模型,根据所述用户语言模型和通用语言模型计算所述候选语句列表中的候选语句的上屏概率; 所述服务器按照所述上屏概率的大小顺序对所述候选语句列表中的候选语句进行排序,将排序后的候选语句列表下发到所述客户端; 所述客户端接收所述排序后的候选语句列表并输出。6.根据权利要求5所述的文字输入方法,其特征在于,所述方法还包括在服务器上建立与用户标识对应的用户语言模型并在每次用户输入词条后根据用户输入的词条信...
【专利技术属性】
技术研发人员:肖镜辉,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。