一种输入方法、装置和用于输入的装置制造方法及图纸

技术编号:33422910 阅读:28 留言:0更新日期:2022-05-19 00:14
本申请实施例公开了一种输入方法、装置和用于输入的装置。该方法的实施例包括:获取用户输入的原始语句;在原始语句满足预设条件的情况下,获取与原始语句具有相同语义且具有正确句式的目标语句;展示目标语句。该实施方式能够针对用户输入的原始语句实现语句重组,在不更改语义的情况下为用户提供更为准确的语句,从而提高用户输入语句效率。从而提高用户输入语句效率。从而提高用户输入语句效率。

【技术实现步骤摘要】
一种输入方法、装置和用于输入的装置


[0001]本申请实施例涉及计算机
,具体涉及一种输入方法、装置和用于输入的装置。

技术介绍

[0002]在用户利用输入法客户端输入语句的过程中,通常所输入的内容中存在一些表述问题。例如,母语为韩语、日语等语言的用户,在想要表达“他去哈尔滨了”时,通常受母语表达习惯的影响,误输入成“他哈尔滨去了”。再例如,一些用户想表达完成语句“明天在XX聚餐,收到请回复”时,只输入了个别关键词“明天、XX、回复”。
[0003]现有的输入法应用通常仅支持对用户输入的内容进行纠错,无法解决用户输入的语句中的句式问题,需要用户手动对语句进行修改,导致用户输入语句的效率较低。

技术实现思路

[0004]本申请实施例提出了一种输入方法、装置和用于输入的装置,以解决现有技术中用户输入语句的效率较低的技术问题。
[0005]第一方面,本申请实施例提供了一种输入方法,该方法包括:获取用户输入的原始语句;在所述原始语句满足预设条件的情况下,获取与所述原始语句具有相同语义且具有正确句式的目标语句;展示所述目标语句。
[0006]在一些实施例中,所述获取与所述原始语句具有相同语义且具有正确句式的目标语句,包括:确定所述原始语句的转换需求;采用与所述转换需求匹配的目标语句获取方式,获取与所述原始语句具有相同语义且具有正确句式的目标语句。
[0007]在一些实施例中,所述转换需求包括以下至少一项:零散词造句需求、语序调整需求;以及,所述目标语句获取方式包括以下至少一项:基于语句库的目标语句获取方式、基于语序调整模型的目标语句获取方式。
[0008]在一些实施例中,所述采用与所述转换需求匹配的目标语句获取方式,获取与所述原始语句具有相同语义且具有正确句式的目标语句,包括:在所述转换需求为零散词造句需求的情况下,从所述原始语句中提取关键词,并确定所述关键词的类型;基于所述关键词和所述关键词的类型,从预设的语句库中检索候选语句,得到候选语句集;基于所述原始语句的相关信息,对所述候选语句集中的候选语句进行排序,得到排序结果;基于所述排序结果,从所述候选语句集中选取目标语句。
[0009]在一些实施例中,所述采用与所述转换需求匹配的目标语句获取方式,获取与所述原始语句具有相同语义且具有正确句式的目标语句,包括:在所述转换需求为语序调整需求的情况下,将所述原始语句输入至预先训练的语序调整模型,得到对所述原始语句进行语序调整后的目标语句。
[0010]在一些实施例中,所述语序调整模型基于如下步骤训练得到:获取样本集,所述样本集中的样本为语句二元组,所述语句二元组包括第一样本语句和第二样本语句,所述第
一样本语句与所述第二样本语句具有不同语序;将所述样本集中的第一样本语句作为端对端生成模型的输入,将所输入的第一样本语句对应的第二样本语句作为所述端对端生成模型的输出目标,利用机器学习算法对所述端对端生成模型进行训练,得到语序调整模型。
[0011]在一些实施例中,所述样本集中的样本通过如下步骤生成:获取无语病的正确语句;将所述正确语句中的词语的位置进行随机调换,得到乱序语句;将所述乱序语句作为第一样本语句,将所述正确语句作为第二样本语句,将所述第一样本语句与所述第二样本语句进行汇总,得到样本。
[0012]在一些实施例中,所述样本集中的样本通过如下步骤生成:获取输入法应用的日志,所述日志中包括用户的历史行为数据;从所述历史行为数据中,查找退格修改行为对应的修改前语句和修改后语句;若所述修改前语句与所述修改后语句具有相同语义且所述修改后语句具有正确句式,则将所述修改前语句作为第一样本语句,将所述修改后语句作为第二样本语句,将所述第一样本语句和所述第二样本语句进行汇总,得到样本。
[0013]在一些实施例中,在所述展示所述目标语句之后,所述方法还包括:在检测到用户选中所述目标语句时,将所述原始语句替换为所述目标语句。
[0014]第二方面,本申请实施例提供了一种输入装置,该装置包括:第一获取单元,被配置成获取用户输入的原始语句;第二获取单元,被配置成在所述原始语句满足预设条件的情况下,获取与所述原始语句具有相同语义且具有正确句式的目标语句;展示单元,被配置成展示所述目标语句。
[0015]在一些实施例中,所述第二获取单元,进一步被配置成:确定所述原始语句的转换需求;采用与所述转换需求匹配的目标语句获取方式,获取与所述原始语句具有相同语义且具有正确句式的目标语句。
[0016]在一些实施例中,所述转换需求包括以下至少一项:零散词造句需求、语序调整需求;以及,所述目标语句获取方式包括以下至少一项:基于语句库的目标语句获取方式、基于语序调整模型的目标语句获取方式。
[0017]在一些实施例中,所述第二获取单元,进一步被配置成:在所述转换需求为零散词造句需求的情况下,从所述原始语句中提取关键词,并确定所述关键词的类型;基于所述关键词和所述关键词的类型,从预设的语句库中检索候选语句,得到候选语句集;基于所述原始语句的相关信息,对所述候选语句集中的候选语句进行排序,得到排序结果;基于所述排序结果,从所述候选语句集中选取目标语句。
[0018]在一些实施例中,所述第二获取单元,进一步被配置成:在所述转换需求为语序调整需求的情况下,将所述原始语句输入至预先训练的语序调整模型,得到对所述原始语句进行语序调整后的目标语句。
[0019]在一些实施例中,所述语序调整模型基于如下步骤训练得到:获取样本集,所述样本集中的样本为语句二元组,所述语句二元组包括第一样本语句和第二样本语句,所述第一样本语句与所述第二样本语句具有不同语序;将所述样本集中的第一样本语句作为端对端生成模型的输入,将所输入的第一样本语句对应的第二样本语句作为所述端对端生成模型的输出目标,利用机器学习算法对所述端对端生成模型进行训练,得到语序调整模型。
[0020]在一些实施例中,所述样本集中的样本通过如下步骤生成:获取无语病的正确语句;将所述正确语句中的词语的位置进行随机调换,得到乱序语句;将所述乱序语句作为第
一样本语句,将所述正确语句作为第二样本语句,将所述第一样本语句与所述第二样本语句进行汇总,得到样本。
[0021]在一些实施例中,所述样本集中的样本通过如下步骤生成:获取输入法应用的日志,所述日志中包括用户的历史行为数据;从所述历史行为数据中,查找退格修改行为对应的修改前语句和修改后语句;若所述修改前语句与所述修改后语句具有相同语义且所述修改后语句具有正确句式,则将所述修改前语句作为第一样本语句,将所述修改后语句作为第二样本语句,将所述第一样本语句和所述第二样本语句进行汇总,得到样本。
[0022]在一些实施例中,所述装置还包括:替换单元,被配置成在检测到用户选中所述目标语句时,将所述原始语句替换为所述目标语句。
[0023]第三方面,本申请实施例提供了一种用于输入的装置,包括有存储器,以及一个或者一个以上的程序,其中一个或者本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种输入方法,其特征在于,所述方法包括:获取用户输入的原始语句;在所述原始语句满足预设条件的情况下,获取与所述原始语句具有相同语义且具有正确句式的目标语句;展示所述目标语句。2.根据权利要求1所述的方法,其特征在于,所述获取与所述原始语句具有相同语义且具有正确句式的目标语句,包括:确定所述原始语句的转换需求;采用与所述转换需求匹配的目标语句获取方式,获取与所述原始语句具有相同语义且具有正确句式的目标语句。3.根据权利要求1所述的方法,其特征在于,所述转换需求包括以下至少一项:零散词造句需求、语序调整需求;以及,所述目标语句获取方式包括以下至少一项:基于语句库的目标语句获取方式、基于语序调整模型的目标语句获取方式。4.根据权利要求3所述的方法,其特征在于,所述采用与所述转换需求匹配的目标语句获取方式,获取与所述原始语句具有相同语义且具有正确句式的目标语句,包括:在所述转换需求为零散词造句需求的情况下,从所述原始语句中提取关键词,并确定所述关键词的类型;基于所述关键词和所述关键词的类型,从预设的语句库中检索候选语句,得到候选语句集;基于所述原始语句的相关信息,对所述候选语句集中的候选语句进行排序,得到排序结果;基于所述排序结果,从所述候选语句集中选取目标语句。5.根据权利要求3所述的方法,其特征在于,所述采用与所述转换需求匹配的目标语句获取方式,获取与所述原始语句具有相同语义且具有正确句式的目标语句,包括:在所述转换需求为语序调整需求的情况下,将所述原始语句输入至预先训练的语序调整模型,得到对所述原始语句进行语序调整后的目标语句。6.根据权利要求5所述的方法,...

【专利技术属性】
技术研发人员:崔欣
申请(专利权)人:北京搜狗科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1