一种本地qwen模型从长合同文本内容提取自定义字段的方法技术

技术编号：46545368 阅读：1 留言：0更新日期：2025-10-10 21:09

本专利提出了一种本地qwen模型从长合同文本内容提取自定义字段的方法。首先，选择Qwen1.5‑7B‑Chat作为本地大模型进行长文本合同字段抽取，从开源社区下载Qwen1.5‑7B‑Chat模型到本地进行部署，下载并配置了Langchain‑Chatchat项目，使其能够使用Qwen1.5‑7B‑Chat模型；其次，由于合同文本通常较长，我们采用长文本分片的方式进行处理；接下来，我们通过调用Langchain‑Chatchat的API进行字段抽取，将合同文本和所需的字段组成prompt，并将其传入API中；最后，将字段结果转换为业务所需的格式并进行数据清洗和校验，利用自定义的agent对结果进行评估和校准。该方法可以应用于于多个领域，不仅提高了合同管理的效率和质量，降低了人工审核和录入的错误率，还为企业提供了更可靠的决策支持。随着人工智能技术的不断发展，该方法将在未来具有更广阔的应用前景。

全部详细技术资料下载

【技术实现步骤摘要】

这个专利的涉及到自然语言处理、大语言模型、内容生成、本地大模型。大语言模型是一种基于海量文本数据训练的深度学习模型，能够通过大规模的训练数据进行训练和优化,它可以生成自然语言文本，并深入理解文本的含义。其核心技术包括：自然语言处理、大型语言模型、机器学习、内容抽取等。这些都是当前和未来的热门领域，其中自然语言处理和数据分析在很多行业中的应用都非常广泛。自然语言处理技术可以用于自动化处理海量的文本数据，可提取出特定的自定义字段、快速识别合同的类型、性质或重要性等级、从文本中抽取实体之间的关系等。结合大语言模型的方法极大提高了信息处理的效率和准确性，提高合同文本的质量。例如生成简洁的摘要，便于快速浏览和理解合同的主要内容、识别实体并对其进行标注，为后续的分析和处理提供便利等等。它可以应用于多个领域如商业金融、电子商务、法律行业、市场研究机构及其他相关领域，帮助企业更好地处理大量合同文本、提高执行效率和管理水平。

技术介绍

1、在现实生活中，合同文本是商务合作中不可或缺的一部分。由于合同文本通常较长，包含的信息量大且结构复杂，使得从合同文本中...

【技术保护点】

1.一种本地qwen模型从长合同文本内容提取自定义字段的方法，其特征在于，包括以下步骤：

2.权利要求1中所述方法，其中模型选择步骤还包括：接入Langchain-Chatchat的API以实现合同内容抽取；在成本和性能之间进行平衡，最终确定采用Qwen1.5-7B-Chat模型作为基础模型。

3.权利要求1或2中所述方法，其中方案设计步骤还包括：通过长文本分片处理，结合agent逻辑，确保在本地模型token限制下实现准确的数据抽取。

4.根据任一上述权利要求所述的方法，其中模型部署步骤还包括：从开源社区下载Qwen1.5-7B-Chat模型到本地；...

【技术特征摘要】

1.一种本地qwen模型从长合同文本内容提取自定义字段的方法，其特征在于，包括以下步骤：

2.权利要求1中所述方法，其中模型选择步骤还包括：接入langchain-chatchat的api以实现合同内容抽取；在成本和性能之间进行平衡，最终确定采用qwen1.5-7b-chat模型作为基础模型。

3.权利要求1或2中所述方法，其中方案设计步骤还包括：通过长文本分片处理，结合agent逻辑，确保在本地模型token限制下实现准确的数据抽取。

4.根据任一上述权利要求所述的方法，其中模型部署步骤还包括：从开源社区下载qwen1.5-7b-chat模型到本地；修改langchain-chatchat项目的配置以使用所述qwen1.5-7b-chat模型；启动langchain-chatchat并加载qwen1.5-7b-chat模型，同时开启api访问。

5.根据任一上述权...

【专利技术属性】
技术研发人员：顾玮珺，
申请(专利权)人：上海适享文化传播有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人