【技术实现步骤摘要】
一种句联想方法和装置
本申请涉及输入法领域,特别是涉及方法一种句联想方法和装置。
技术介绍
输入法系统可以在用户输入过程中基于用户上屏的内容联想下文候选项,使得用户可以通过选择候选项直接上屏,为用户输入提供了便利。输入法系统通过句联想功能可以将联想出的下文句子作为句联想候选项,句联想候选项中包括句子,句子可以是多个词组成的词组或长句。若用户选择一个句联想候选项,可以一次上屏较多内容,提高了输入效率。目前主要采用大词汇连续语音识别中常用的N-Gram模型实现句联想的功能。输入法系统通过统计用户历史语料中的高频句子组合,以此训练该模型,例如,若一个用户之前经常输入“吃葡萄不吐葡萄皮,不吃葡萄倒吐葡萄皮”这个句子组合,当该用户再次输入“吃葡萄不吐葡萄皮”时,输入法系统会通过模型匹配,联想得到“不吃葡萄倒吐葡萄皮”的句联想候选项。然而由于目前的模型训练基于用户历史语料,同时离线的模型词库占用存储的要求严格,因此目前只能在已经上屏的上文内容中提取高频句子训练高频句子模型,并以高频句子模型实现句联想功能,以确定当前上文内 ...
【技术保护点】
1.一种句联想方法,其特征在于,所述方法包括:/n获取已经上屏的上文内容;/n将所述上文内容作为关键词进行搜索得到搜索结果;/n根据所述搜索结果确定所述上文内容对应的下文句子;/n根据所述下文句子生成所述上文内容对应的句联想候选项。/n
【技术特征摘要】
1.一种句联想方法,其特征在于,所述方法包括:
获取已经上屏的上文内容;
将所述上文内容作为关键词进行搜索得到搜索结果;
根据所述搜索结果确定所述上文内容对应的下文句子;
根据所述下文句子生成所述上文内容对应的句联想候选项。
2.根据权利要求1所述的方法,其特征在于,所述根据所述搜索结果确定所述上文内容对应的下文句子,包括:
根据所述搜索结果中的分隔符将所述搜索结果分割为多个分割结果;
确定分割结果与所述上文内容间的第一匹配关系,所述第一匹配关系用于标识分割结果出现在所述上文内容之后的概率;
将所述第一匹配关系满足第一预设条件的分割结果确定为所述上文内容对应的下文句子。
3.根据权利要求1所述的方法,其特征在于,所述根据所述搜索结果确定所述上文内容对应的下文句子,包括:
判断所述上文内容的类型是否为提问类型;
若是,根据所述上文内容,获取所述搜索结果的摘要内容;
将所述摘要内容作为所述上文内容对应的下文句子。
4.根据权利要求1所述的方法,其特征在于,所述根据所述搜索结果确定所述上文内容对应的下文句子,包括:
从所述搜索结果中确定与所述上文内容的相似度满足第二预设条件的文本内容;
将所述文本内容在所述搜索结果中的下文句子作为所述上文内容对应的下文句子。
5.根据权利要求1-4任意一项所述的方法,其特征在于,若根据所述搜索结果确定出所述上文内容对应的多个下文句子,所述根据所述下文句子生成所述上文内容对应的句联想候选项,包括:
确定所述多个下文句子分别对应的排序值;
根据排序值满足阈值的下文句子生成所述上文内容对应的句联想候选项;
所述多个下文句子分别对应的排序值是根据以下确定方式中任意一种或多种的组合确定的:
第一确定方式:
确定所述多个下文句子分别与所述上文内容间的第二匹配关系,所述...
【专利技术属性】
技术研发人员:姚波怀,张扬,
申请(专利权)人:北京搜狗科技发展有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。