【技术实现步骤摘要】
本公开涉及文本处理,特别涉及一种文本处理的方法、电子设备、计算机可读介质。
技术介绍
1、语言模型(大语言模型)能针对输入的问题文本产生对应的回答文本。
2、但在一些相关技术中,为满足语言模型的输入的要求,会造成计算资源的浪费和效率的降低。
技术实现思路
1、本公开提供一种文本处理的方法、电子设备、计算机可读介质。
2、第一方面,本公开实施例提供一种文本处理的方法,其包括:
3、获取至少一个问题;每个所述问题包括多个依次排列的问题文本单元token;
4、将所述问题token依次填充到文本块batch的填充位中;每个所述batch包括多个排成矩阵的所述填充位,每个所述填充位能填充一个所述问题token;
5、将所述batch输入至预设的语言模型处理,得到所述问题的回答;所述语言模型基于查询-键-值qkv机制,每个所述回答包括多个依次排列的回答token。
6、在一些实施例中,所述将所述问题token依次填充到batch
...【技术保护点】
1.一种文本处理的方法,其包括:
2.根据权利要求1所述的方法,其中,所述将所述问题token依次填充到batch的填充位中,包括:
3.根据权利要求2所述的方法,其中,在所述按照所述排序,依次将每个所述问题的各所述问题token以填充位、逐行、逐batch的顺序进行填充之后,还包括:
4.根据权利要求1所述的方法,其中,所述将所述batch输入至预设的语言模型处理,得到所述问题的回答,包括:
5.根据权利要求4所述的方法,其中,在所述获取所述语言模型输出的当前轮结果之后,还包括:
6.根据权利要求4所述的方
...【技术特征摘要】
1.一种文本处理的方法,其包括:
2.根据权利要求1所述的方法,其中,所述将所述问题token依次填充到batch的填充位中,包括:
3.根据权利要求2所述的方法,其中,在所述按照所述排序,依次将每个所述问题的各所述问题token以填充位、逐行、逐batch的顺序进行填充之后,还包括:
4.根据权利要求1所述的方法,其中,所述将所述batch输入至预设的语言模型处理,得到所述问题的回答,包括:
5.根据权利要求4所述的方法,其中,在所述获取所述语言模型输出的当前轮结果之后,还包括:
6.根据权利要求4所述的方法,其中,所述将填充所述回答token后的所述batch输入至...
【专利技术属性】
技术研发人员:祝轲政,沈杨书,
申请(专利权)人:北京灵汐科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。