长文本预测方法、装置、设备和存储介质制造方法及图纸

技术编号:21999429 阅读:18 留言:0更新日期:2019-08-31 05:11
本发明专利技术实施例提出一种长文本预测方法、装置、设备和存储介质。该方法包括接收来自客户端的长文本预测请求,所述长文本预测请求中包括所述客户端的上下文信息;利用所述上下文信息和长文本预测模型进行预测,得到与所述上下文信息的语义关联的至少一个长文本,所述长文本中包括多个词语;向所述客户端发送至少一个所述长文本。本发明专利技术实施例利用训练得到长文本预测模型,根据客户端的上下文信息得到符合输入语境的预测长文本,以提升用户的输入效率。

Long text prediction methods, devices, devices and storage media

【技术实现步骤摘要】
长文本预测方法、装置、设备和存储介质
本专利技术涉及输入
,尤其涉及一种长文本预测方法、装置、设备和存储介质。
技术介绍
很多电子产品例如手机、电脑、智能家电等具有输入功能,可以在应用程序的客户端输入文本。在输入文本时能够给出下一个可能输入的词。例如,利用最近输入的词统计得到下一个高频组合的字或词。再如,通过N-Gram语言模型,根据前序N个词统计得到下一个字或词。根据传统统计方案得到的词具有局限性,没有全面地考虑到上下文信息,无法直接给用户提供符合语境的短语、整句等选项。
技术实现思路
本专利技术实施例提供一种长文本预测方法、装置、设备和存储介质,以解决现有技术中的一个或多个技术问题。第一方面,本专利技术实施例提供了一种长文本预测方法,包括:接收来自客户端的长文本预测请求,所述长文本预测请求中包括所述客户端的上下文信息;利用所述上下文信息和长文本预测模型进行预测,得到与所述上下文信息的语义关联的至少一个长文本,所述长文本中包括多个词语;向所述客户端发送至少一个所述长文本。在一种实施方式中,所述利用所述上下文信息和长文本预测模型进行预测,包括:利用所述上下文信息确定模型输入特征;将所述模型输入特征输入长文本预测模型进行预测。在一种实施方式中,所述上下文信息包括所述客户端的输入文本;所述利用所述上下文信息确定模型输入特征,包括以下至少一种:在所述输入文本包括所述客户端的输入框中的前序文本的情况下,利用所述前序文本得到所述模型输入特征;在所述输入文本包括输入法的输入区中的当前输入码的情况下,利用所述当前输入码翻译得到的翻译文本得到所述模型输入特征;在所述输入文本包括所述前序文本和所述当前输入码的情况下,将所述当前输入码获得翻译文本与所述前序文本拼接得到拼接文本,利用所述拼接文本得到所述模型输入特征。在一种实施方式中,所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。在一种实施方式中,所述向所述客户端发送至少一个所述长文本,包括:对至少一个所述长文本进行过滤,向所述客户端发送过滤后的内容。第二方面,本专利技术实施例提供了一种长文本预测方法,包括:获取客户端的上下文信息;向服务器发送长文本预测请求,所述长文本预测请求中包括所述上下文信息;接收来自所述服务器的与所述上下文信息的语义关联的至少一个长文本,所述长文本是所述服务器利用所述上下文信息和长文本预测模型预测得到的。在一种实施方式中,所述上下文信息包括所述客户端的输入文本,获取客户端的上下文信息,包括:获取所述客户端的输入框中的前序文本;和/或,获取所述客户端使用的输入法的输入区中的当前输入码。在一种实施方式中,所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。第三方面,本专利技术实施例提供了一种长文本预测装置,包括:第一接收模块,用于接收来自客户端的长文本预测请求,所述长文本预测请求中包括所述客户端的上下文信息;预测模块,用于利用所述上下文信息和长文本预测模型进行预测,得到与所述上下文信息的语义关联的至少一个长文本,所述长文本中包括多个词语;第一发送模块,用于向所述客户端发送至少一个所述长文本。在一种实施方式中,所述预测模块包括:输入特征子模块,用于利用所述上下文信息确定模型输入特征;预测子模块,用于将所述模型输入特征输入长文本预测模型进行预测。在一种实施方式中,所述上下文信息包括所述客户端的输入文本,所述输入特征子模块用于执行至少一种:在所述输入文本包括所述客户端的输入框中的前序文本的情况下,利用所述前序文本得到所述模型输入特征;在所述输入文本包括输入法的输入区中的当前输入码的情况下,利用所述当前输入码翻译得到的翻译文本得到所述模型输入特征;在所述输入文本包括所述前序文本和所述当前输入码的情况下,将所述当前输入码获得翻译文本与所述前序文本拼接得到拼接文本,利用所述拼接文本得到所述模型输入特征。在一种实施方式中,所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。在一种实施方式中,所述第一发送模块还用于对至少一个所述长文本进行过滤,向所述客户端发送过滤后的内容。第四方面,本专利技术实施例提供了一种长文本预测装置,包括:获取模块,用于获取客户端的上下文信息;第二发送模块,向服务器发送长文本预测请求,所述长文本预测请求中包括所述上下文信息;第二接收模块,用于接收来自所述服务器的与所述上下文信息的语义关联的至少一个长文本,所述长文本是所述服务器利用所述上下文信息和长文本预测模型预测得到的。在一种实施方式中,所述上下文信息包括所述客户端的输入文本,所述获取模块还用于获取所述客户端的输入框中的前序文本;和/或,获取所述客户端使用的输入法的输入区中的当前输入码。在一种实施方式中,所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。第五方面,本专利技术实施例提供了一种长文本预测设备,所述长文本预测设备的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。在一个可能的设计中,所述长文本预测设备的结构中包括处理器和存储器,所述存储器用于存储支持所述长文本预测设备执行上述长文本预测方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述长文本预测设备还可以包括通信接口,用于与其他设备或通信网络通信。第六方面,本专利技术实施例提供了一种计算机可读存储介质,用于存储长文本预测设备所用的计算机软件指令,其包括用于执行上述长文本预测方法所涉及的程序。上述技术方案中的一个技术方案具有如下优点或有益效果:利用训练得到长文本预测模型,根据客户端的上下文信息例如输入文本、输入场景信息、用户画像信息等,得到符合输入语境的预测长文本,以提升用户的输入效率。上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本专利技术进一步的方面、实施方式和特征将会是容易明白的。附图说明在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本专利技术公开的一些实施方式,而不应将其视为是对本专利技术范围的限制。图1示出根据本专利技术实施例的长文本预测方法的流程图。图2示出根据本专利技术实施例的长文本预测方法的流程图。图3示出根据本专利技术实施例的长文本预测方法中LSTM模型训练示意图。图4示出根据本专利技术实施例的长文本预测方法中LSTM模型预测示意图。图5示出根据本专利技术实施例的长文本预测方法中transformer模型训练示意图。图6示出根据本专利技术实施例的长文本预测方法中transformer模型预测示意图。图7示出不同预测场景中根据前序文本得到不同预测结果的对比示意图。图8示出根据当前输入码得到预测结果的示意图。图9示出根据本专利技术实施例的长文本预测装置的结构框图。图10示出根据本专利技术实施例的长文本预测装置的结构框图。图11示出根据本专利技术实施例的长文本预测装置的结构框图。图12示出根据本专利技术实施例的长文本预测设备的结构框图。具体实施方式在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本专利技术的精神或范围的情况下,可通过各种不同方式修改所本文档来自技高网...

【技术保护点】
1.一种长文本预测方法,其特征在于,包括:接收来自客户端的长文本预测请求,所述长文本预测请求中包括所述客户端的上下文信息;利用所述上下文信息和长文本预测模型进行预测,得到与所述上下文信息的语义关联的至少一个长文本,所述长文本中包括多个词语;向所述客户端发送至少一个所述长文本。

【技术特征摘要】
1.一种长文本预测方法,其特征在于,包括:接收来自客户端的长文本预测请求,所述长文本预测请求中包括所述客户端的上下文信息;利用所述上下文信息和长文本预测模型进行预测,得到与所述上下文信息的语义关联的至少一个长文本,所述长文本中包括多个词语;向所述客户端发送至少一个所述长文本。2.根据权利要求1所述的方法,其特征在于,所述利用所述上下文信息和长文本预测模型进行预测,包括:利用所述上下文信息确定模型输入特征;将所述模型输入特征输入长文本预测模型进行预测。3.根据权利要求2所述的方法,其特征在于,所述上下文信息包括所述客户端的输入文本;所述利用所述上下文信息确定模型输入特征,包括以下至少一种:在所述输入文本包括所述客户端的输入框中的前序文本的情况下,利用所述前序文本得到所述模型输入特征;在所述输入文本包括输入法的输入区中的当前输入码的情况下,利用所述当前输入码翻译得到的翻译文本得到所述模型输入特征;在所述输入文本包括所述前序文本和所述当前输入码的情况下,将所述当前输入码获得翻译文本与所述前序文本拼接得到拼接文本,利用所述拼接文本得到所述模型输入特征。4.根据权利要求1所述的方法,其特征在于,所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述向所述客户端发送至少一个所述长文本,包括:对至少一个所述长文本进行过滤,向所述客户端发送过滤后的内容。6.一种长文本预测方法,其特征在于,包括:获取客户端的上下文信息;向服务器发送长文本预测请求,所述长文本预测请求中包括所述上下文信息;接收来自所述服务器的与所述上下文信息的语义关联的至少一个长文本,所述长文本是所述服务器利用所述上下文信息和长文本预测模型预测得到的。7.根据权利要求6所述的方法,其特征在于,所述上下文信息包括所述客户端的输入文本;所述获取客户端的上下文信息,包括:获取所述客户端的输入框中的前序文本;和/或,获取所述客户端使用的输入法的输入区中的当前输入码。8.根据权利要求6或7所述的方法,其特征在于,所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。9.一种长文本预测装置,其特征在于,包括:第一接收模块,用于接收来自客户端的长文本预测请求,所述长文本预测请求中包括所述客户端的上下文信息;预测模块,用于利用所述上下文信息和长文本预测模型进行预...

【专利技术属性】
技术研发人员:蔡泽华王轶翔
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1