长文本预测方法、装置、设备和存储介质制造方法及图纸

技术编号：21999429 阅读：18 留言：0更新日期：2019-08-31 05:11

本发明专利技术实施例提出一种长文本预测方法、装置、设备和存储介质。该方法包括接收来自客户端的长文本预测请求，所述长文本预测请求中包括所述客户端的上下文信息；利用所述上下文信息和长文本预测模型进行预测，得到与所述上下文信息的语义关联的至少一个长文本，所述长文本中包括多个词语；向所述客户端发送至少一个所述长文本。本发明专利技术实施例利用训练得到长文本预测模型，根据客户端的上下文信息得到符合输入语境的预测长文本，以提升用户的输入效率。

Long text prediction methods, devices, devices and storage media

全部详细技术资料下载

【技术实现步骤摘要】
长文本预测方法、装置、设备和存储介质
本专利技术涉及输入
，尤其涉及一种长文本预测方法、装置、设备和存储介质。
技术介绍
很多电子产品例如手机、电脑、智能家电等具有输入功能，可以在应用程序的客户端输入文本。在输入文本时能够给出下一个可能输入的词。例如，利用最近输入的词统计得到下一个高频组合的字或词。再如，通过N-Gram语言模型，根据前序N个词统计得到下一个字或词。根据传统统计方案得到的词具有局限性，没有全面地考虑到上下文信息，无法直接给用户提供符合语境的短语、整句等选项。
技术实现思路
本专利技术实施例提供一种长文本预测方法、装置、设备和存储介质，以解决现有技术中的一个或多个技术问题。第一方面，本专利技术实施例提供了一种长文本预测方法，包括：接收来自客户端的长文本预测请求，所述长文本预测请求中包括所述客户端的上下文信息；利用所述上下文信息和长文本预测模型进行预测，得到与所述上下文信息的语义关联的至少一个长文本，所述长文本中包括多个词语；向所述客户端发送至少一个所述长文本。在一种实施方式中，所述利用所述上下文信息和长文本预测模型进行预测，包括：利用所述上下文信息确定模型输入特征；将所述模型输入特征输入长文本预测模型进行预测。在一种实施方式中，所述上下文信息包括所述客户端的输入文本；所述利用所述上下文信息确定模型输入特征，包括以下至少一种：在所述输入文本包括所述客户端的输入框中的前序文本的情况下，利用所述前序文本得到所述模型输入特征；在所述输入文本包括输入法的输入区中的当前输入码的情况下，利用所述当前输入码翻译得到的翻译文本得到所述模型输入特征；在所述输入...

【技术保护点】
1.一种长文本预测方法，其特征在于，包括：接收来自客户端的长文本预测请求，所述长文本预测请求中包括所述客户端的上下文信息；利用所述上下文信息和长文本预测模型进行预测，得到与所述上下文信息的语义关联的至少一个长文本，所述长文本中包括多个词语；向所述客户端发送至少一个所述长文本。

【技术特征摘要】
1.一种长文本预测方法，其特征在于，包括：接收来自客户端的长文本预测请求，所述长文本预测请求中包括所述客户端的上下文信息；利用所述上下文信息和长文本预测模型进行预测，得到与所述上下文信息的语义关联的至少一个长文本，所述长文本中包括多个词语；向所述客户端发送至少一个所述长文本。2.根据权利要求1所述的方法，其特征在于，所述利用所述上下文信息和长文本预测模型进行预测，包括：利用所述上下文信息确定模型输入特征；将所述模型输入特征输入长文本预测模型进行预测。3.根据权利要求2所述的方法，其特征在于，所述上下文信息包括所述客户端的输入文本；所述利用所述上下文信息确定模型输入特征，包括以下至少一种：在所述输入文本包括所述客户端的输入框中的前序文本的情况下，利用所述前序文本得到所述模型输入特征；在所述输入文本包括输入法的输入区中的当前输入码的情况下，利用所述当前输入码翻译得到的翻译文本得到所述模型输入特征；在所述输入文本包括所述前序文本和所述当前输入码的情况下，将所述当前输入码获得翻译文本与所述前序文本拼接得到拼接文本，利用所述拼接文本得到所述模型输入特征。4.根据权利要求1所述的方法，其特征在于，所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。5.根据权利要求1至4中任一项所述的方法，其特征在于，所述向所述客户端发送至少一个所述长文本，包括：对至少一个所述长文本进行过滤，向所述客户端发送过滤后的内容。6.一种长文本预测方法，其特征在于，包括：获取客户端的上下文信息；向服务器发送长文本预测请求，所述长文本预测请求中包括所述上下文信息；接收来自所述服务器的与所述上下文信息的语义关联的至少一个长文本，所述长文本是所述服务器利用所述上下文信息和长文本预测模型预测得到的。7.根据权利要求6所述的方法，其特征在于，所述上下文信息包括所述客户端的输入文本；所述获取客户端的上下文信息，包括：获取所述客户端的输入框中的前序文本；和/或，获取所述客户端使用的输入法的输入区中的当前输入码。8.根据权利要求6或7所述的方法，其特征在于，所述上下文信息还包括所述客户端的输入场景信息和/或用户画像信息。9.一种长文本预测装置，其特征在于，包括：第一接收模块，用于接收来自客户端的长文本预测请求，所述长文本预测请求中包括所述客户端的上下文信息；预测模块，用于利用所述上下文信息和长文本预测模型进行预...

【专利技术属性】
技术研发人员：蔡泽华，王轶翔，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人