文本处理的方法、电子设备、计算机可读介质技术

技术编号:42377536 阅读:16 留言:0更新日期:2024-08-16 15:02
本公开提供了一种文本处理的方法,其包括:获取至少一个问题;每个所述问题包括多个依次排列的问题token;将所述问题token依次填充到batch的填充位中;每个所述batch包括多个排成矩阵的所述填充位,每个所述填充位能填充一个所述问题token;将所述batch输入至预设的语言模型处理,得到所述问题的回答;所述语言模型基于查询‑键‑值QKV机制,每个所述回答包括多个依次排列的回答token。本公开还提供了一种电子设备、计算机可读介质。

【技术实现步骤摘要】

本公开涉及文本处理,特别涉及一种文本处理的方法、电子设备、计算机可读介质


技术介绍

1、语言模型(大语言模型)能针对输入的问题文本产生对应的回答文本。

2、但在一些相关技术中,为满足语言模型的输入的要求,会造成计算资源的浪费和效率的降低。


技术实现思路

1、本公开提供一种文本处理的方法、电子设备、计算机可读介质。

2、第一方面,本公开实施例提供一种文本处理的方法,其包括:

3、获取至少一个问题;每个所述问题包括多个依次排列的问题文本单元token;

4、将所述问题token依次填充到文本块batch的填充位中;每个所述batch包括多个排成矩阵的所述填充位,每个所述填充位能填充一个所述问题token;

5、将所述batch输入至预设的语言模型处理,得到所述问题的回答;所述语言模型基于查询-键-值qkv机制,每个所述回答包括多个依次排列的回答token。

6、在一些实施例中,所述将所述问题token依次填充到batch的填充位中,包括:<本文档来自技高网...

【技术保护点】

1.一种文本处理的方法,其包括:

2.根据权利要求1所述的方法,其中,所述将所述问题token依次填充到batch的填充位中,包括:

3.根据权利要求2所述的方法,其中,在所述按照所述排序,依次将每个所述问题的各所述问题token以填充位、逐行、逐batch的顺序进行填充之后,还包括:

4.根据权利要求1所述的方法,其中,所述将所述batch输入至预设的语言模型处理,得到所述问题的回答,包括:

5.根据权利要求4所述的方法,其中,在所述获取所述语言模型输出的当前轮结果之后,还包括:

6.根据权利要求4所述的方法,其中,所述将填充...

【技术特征摘要】

1.一种文本处理的方法,其包括:

2.根据权利要求1所述的方法,其中,所述将所述问题token依次填充到batch的填充位中,包括:

3.根据权利要求2所述的方法,其中,在所述按照所述排序,依次将每个所述问题的各所述问题token以填充位、逐行、逐batch的顺序进行填充之后,还包括:

4.根据权利要求1所述的方法,其中,所述将所述batch输入至预设的语言模型处理,得到所述问题的回答,包括:

5.根据权利要求4所述的方法,其中,在所述获取所述语言模型输出的当前轮结果之后,还包括:

6.根据权利要求4所述的方法,其中,所述将填充所述回答token后的所述batch输入至...

【专利技术属性】
技术研发人员:祝轲政沈杨书
申请(专利权)人:北京灵汐科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1