一种本地qwen模型从长合同文本内容提取自定义字段的方法技术

技术编号:46545368 阅读:1 留言:0更新日期:2025-10-10 21:09
本专利提出了一种本地qwen模型从长合同文本内容提取自定义字段的方法。首先,选择Qwen1.5‑7B‑Chat作为本地大模型进行长文本合同字段抽取,从开源社区下载Qwen1.5‑7B‑Chat模型到本地进行部署,下载并配置了Langchain‑Chatchat项目,使其能够使用Qwen1.5‑7B‑Chat模型;其次,由于合同文本通常较长,我们采用长文本分片的方式进行处理;接下来,我们通过调用Langchain‑Chatchat的API进行字段抽取,将合同文本和所需的字段组成prompt,并将其传入API中;最后,将字段结果转换为业务所需的格式并进行数据清洗和校验,利用自定义的agent对结果进行评估和校准。该方法可以应用于于多个领域,不仅提高了合同管理的效率和质量,降低了人工审核和录入的错误率,还为企业提供了更可靠的决策支持。随着人工智能技术的不断发展,该方法将在未来具有更广阔的应用前景。

【技术实现步骤摘要】

这个专利的涉及到自然语言处理、大语言模型、内容生成、本地大模型。大语言模型是一种基于海量文本数据训练的深度学习模型,能够通过大规模的训练数据进行训练和优化,它可以生成自然语言文本,并深入理解文本的含义。其核心技术包括:自然语言处理、大型语言模型、机器学习、内容抽取等。这些都是当前和未来的热门领域,其中自然语言处理和数据分析在很多行业中的应用都非常广泛。自然语言处理技术可以用于自动化处理海量的文本数据,可提取出特定的自定义字段、快速识别合同的类型、性质或重要性等级、从文本中抽取实体之间的关系等。结合大语言模型的方法极大提高了信息处理的效率和准确性,提高合同文本的质量。例如生成简洁的摘要,便于快速浏览和理解合同的主要内容、识别实体并对其进行标注,为后续的分析和处理提供便利等等。它可以应用于多个领域如商业金融、电子商务、法律行业、市场研究机构及其他相关领域,帮助企业更好地处理大量合同文本、提高执行效率和管理水平。


技术介绍

1、在现实生活中,合同文本是商务合作中不可或缺的一部分。由于合同文本通常较长,包含的信息量大且结构复杂,使得从合同文本中提取所需信息变得困难本文档来自技高网...

【技术保护点】

1.一种本地qwen模型从长合同文本内容提取自定义字段的方法,其特征在于,包括以下步骤:

2.权利要求1中所述方法,其中模型选择步骤还包括:接入Langchain-Chatchat的API以实现合同内容抽取;在成本和性能之间进行平衡,最终确定采用Qwen1.5-7B-Chat模型作为基础模型。

3.权利要求1或2中所述方法,其中方案设计步骤还包括:通过长文本分片处理,结合agent逻辑,确保在本地模型token限制下实现准确的数据抽取。

4.根据任一上述权利要求所述的方法,其中模型部署步骤还包括:从开源社区下载Qwen1.5-7B-Chat模型到本地;...

【技术特征摘要】

1.一种本地qwen模型从长合同文本内容提取自定义字段的方法,其特征在于,包括以下步骤:

2.权利要求1中所述方法,其中模型选择步骤还包括:接入langchain-chatchat的api以实现合同内容抽取;在成本和性能之间进行平衡,最终确定采用qwen1.5-7b-chat模型作为基础模型。

3.权利要求1或2中所述方法,其中方案设计步骤还包括:通过长文本分片处理,结合agent逻辑,确保在本地模型token限制下实现准确的数据抽取。

4.根据任一上述权利要求所述的方法,其中模型部署步骤还包括:从开源社区下载qwen1.5-7b-chat模型到本地;修改langchain-chatchat项目的配置以使用所述qwen1.5-7b-chat模型;启动langchain-chatchat并加载qwen1.5-7b-chat模型,同时开启api访问。

5.根据任一上述权...

【专利技术属性】
技术研发人员:顾玮珺
申请(专利权)人:上海适享文化传播有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1