【技术实现步骤摘要】
这个专利的涉及到自然语言处理、大语言模型、内容生成、本地大模型。大语言模型是一种基于海量文本数据训练的深度学习模型,能够通过大规模的训练数据进行训练和优化,它可以生成自然语言文本,并深入理解文本的含义。其核心技术包括:自然语言处理、大型语言模型、机器学习、内容抽取等。这些都是当前和未来的热门领域,其中自然语言处理和数据分析在很多行业中的应用都非常广泛。自然语言处理技术可以用于自动化处理海量的文本数据,可提取出特定的自定义字段、快速识别合同的类型、性质或重要性等级、从文本中抽取实体之间的关系等。结合大语言模型的方法极大提高了信息处理的效率和准确性,提高合同文本的质量。例如生成简洁的摘要,便于快速浏览和理解合同的主要内容、识别实体并对其进行标注,为后续的分析和处理提供便利等等。它可以应用于多个领域如商业金融、电子商务、法律行业、市场研究机构及其他相关领域,帮助企业更好地处理大量合同文本、提高执行效率和管理水平。
技术介绍
1、在现实生活中,合同文本是商务合作中不可或缺的一部分。由于合同文本通常较长,包含的信息量大且结构复杂,使得从合同文本中
...【技术保护点】
1.一种本地qwen模型从长合同文本内容提取自定义字段的方法,其特征在于,包括以下步骤:
2.权利要求1中所述方法,其中模型选择步骤还包括:接入Langchain-Chatchat的API以实现合同内容抽取;在成本和性能之间进行平衡,最终确定采用Qwen1.5-7B-Chat模型作为基础模型。
3.权利要求1或2中所述方法,其中方案设计步骤还包括:通过长文本分片处理,结合agent逻辑,确保在本地模型token限制下实现准确的数据抽取。
4.根据任一上述权利要求所述的方法,其中模型部署步骤还包括:从开源社区下载Qwen1.5-7B-
...【技术特征摘要】
1.一种本地qwen模型从长合同文本内容提取自定义字段的方法,其特征在于,包括以下步骤:
2.权利要求1中所述方法,其中模型选择步骤还包括:接入langchain-chatchat的api以实现合同内容抽取;在成本和性能之间进行平衡,最终确定采用qwen1.5-7b-chat模型作为基础模型。
3.权利要求1或2中所述方法,其中方案设计步骤还包括:通过长文本分片处理,结合agent逻辑,确保在本地模型token限制下实现准确的数据抽取。
4.根据任一上述权利要求所述的方法,其中模型部署步骤还包括:从开源社区下载qwen1.5-7b-chat模型到本地;修改langchain-chatchat项目的配置以使用所述qwen1.5-7b-chat模型;启动langchain-chatchat并加载qwen1.5-7b-chat模型,同时开启api访问。
5.根据任一上述权...
【专利技术属性】
技术研发人员:顾玮珺,
申请(专利权)人:上海适享文化传播有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。