一种对长文本进行压缩的处理方法和装置制造方法及图纸

技术编号：41873548 阅读：25 留言：0更新日期：2024-07-02 00:25

本发明专利技术实施例涉及一种对长文本进行压缩的处理方法和装置，所述方法包括：构建第一、第二评分模型和第一决策模型并训练；模型训练后接收任意长文本和对应的问题文本；对长文本和问题文本进行文本降噪、文本规范化、文句转换处理得到文句序列问题文句；将文句序列和问题文句输入第一评分模型进行处理得到相关性评分序列；基于第二评分模型对文句序列的各文句的语义连贯性进行评分；将文句序列对应的文句特征向量序列输入第一决策模型进行处理得到决策类型序列；将各个具体为删除的决策类型对应的文句从长文本中删除，并将完成删除的长文本作为压缩文本输出。本发明专利技术提供的长文本压缩机制有助提高LLM模型的任务处理质量和处理效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据处理，特别涉及一种对长文本进行压缩的处理方法和装置。

技术介绍

1、大语言模型（large language models，llm）能够理解文本的深层意义、生成连贯的文本内容；llm模型能够处理多类复杂的语言理解任务，智能问答任务就是其中一种典型任务。在处理智能问答任务时llm模型首先对与问题文本相关的文本资源进行检索并基于检索结果构建一个或多个长文本作为对应的辅助上下文，再基于辅助上下文进行答案文本生成处理。从原理上讲llm模型构建的长文本越大则辅助上下文的内容越丰富、生成的答案准确率越高、模型的任务处理质量也越高；但在实际应用中我们会发现受模型实际处理能力的限制，许多llm模型在构建长文本时都会发生由文本超长导致的信息过载问题，这个问题不但会增加模型的计算成本、还会降低模型的处理效率和处理质量；也就是说当llm模型处理的长文本大小超过模型处理能力极限时，模型的任务处理质量会不升反降。要解决这个问题就需要给出一种长文本的压缩处理机制，而这也是本专利技术要解决的技术问题。

技术实现思路>

1、本文档来自技高网...

【技术保护点】

1.一种对长文本进行压缩的处理方法，其特征在于，所述方法包括：
2.根据权利要求1所述的对长文本进行压缩的处理方法，其特征在于，
3.根据权利要求2所述的对长文本进行压缩的处理方法，其特征在于，
4.根据权利要求3所述的对长文本进行压缩的处理方法，其特征在于，
5.根据权利要求1所述的对长文本进行压缩的处理方法，其特征在于，所述对所述第一、第二评分模型和所述第一决策模型进行训练，具体包括：
6.根据权利要求5所述的对长文本进行压缩的处理方法，其特征在于，所述基于所述第一数据集对所述第一评分模型进行有监督方式的模型训练，具体包括：...

【技术特征摘要】

1.一种对长文本进行压缩的处理方法，其特征在于，所述方法包括：
2.根据权利要求1所述的对长文本进行压缩的处理方法，其特征在于，
3.根据权利要求2所述的对长文本进行压缩的处理方法，其特征在于，
4.根据权利要求3所述的对长文本进行压缩的处理方法，其特征在于，
5.根据权利要求1所述的对长文本进行压缩的处理方法，其特征在于，所述对所述第一、第二评分模型和所述第一决策模型进行训练，具体包括：
6.根据权利要求5所述的对长文本进行压缩的处理方法，其特征在于，所述基于所述第一数据集对所述第一评分模型进行有监督方式的模型训练，具体包括：
7.根据权利要求5所述的对长文本进行压缩的处理方法，其特征在于，所述基于所述第二数据集对所述第二评分模型进行有监督方式的模型训练，具体包括：
8.根据权利要求5所述的...

【专利技术属性】
技术研发人员：蔡恒兴，许明军，高志锋，张林峰，孙伟杰，
申请(专利权)人：北京深势科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：一种脱氧腺苷的制备装置及其使用方法制造方法及图纸
下一篇：吸尘装置及激光切割机制造方法及图纸

相关技术

一种c-Myc降解剂及其制备方法和用...

一种借助生成式大语言模型的检索迭代方...

一种竞赛状态机的处理方法和装置制造方...

一种基于大语言模型的检索排序方法和装...

一种以大语言模型为编码器的文档检索方...

一种基于配置驱动的实验脚本生成方法和...

一种用于化合物制备的实验任务处理系统...

一种实验任务处理系统技术方案

一种检索文档嵌入特征的处理方法和装置...

一种基于大语言模型集合任务提示的文档...

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

一种高空冰晶积冰的脱落预测方法、装置...

基于多交易平台数据融合的农产品供需趋...

考虑次像元地形辐射效应的卫星陆上红外...

一种基于自监督学习的快速磁共振扩散成...

一种海洋碳收支评估方法、装置、设备及...

一种数据库迁移中的分布键选择方法、系...

一种无Dockerfile自动打包镜...

一种处理器系统以及服务器技术方案