【技术实现步骤摘要】
本专利技术属于信息提取,尤其涉及一种基于大模型的提取文档可信证据方法及系统。
技术介绍
1、现有技术中,文档可信证据提取已形成多技术融合的应用体系。在破损文档处理领域,常采用ocr字符识别结合人工补全方式修复残缺内容,辅以传统图像修复算法(如基于插值的像素填充)处理物理破损;跨语言证据验证多依赖机器翻译工具(如神经网络翻译模型)进行文本转换,再通过术语对照表实现基础比对;文档真伪鉴别则主要依托纸张厚度检测、墨迹成分分析等物理特征检验手段,部分场景引入简单的语义一致性校验。同时,证据可信度评估多通过领域专家主观判断,结合基础统计方法(如准确率计算)形成结论,相关技术已在古籍整理、跨境贸易、司法取证等场景得到应用。
2、然而,现有技术在实际应用中存在明显局限。破损文档修复因缺乏物理特征与语义逻辑的跨模态融合,常出现补全内容与上下文脱节的问题;跨语言验证仅停留在字面转换层面,难以捕捉法律术语、专业规范等核心概念的深层语义差异;文档真伪鉴别未将挥发性有机物等化学特征与文本语义关联分析,易受高仿物理特征的误导;可信度评估缺乏量化模型与
...【技术保护点】
1.一种基于大模型的提取文档可信证据方法,其特征在于,包括以下步骤:
2.如权利要求1所述一种基于大模型的提取文档可信证据方法,其特征在于,步骤S1.1中,破损文档推理进一步包括:
3.如权利要求1所述一种基于大模型的提取文档可信证据方法,其特征在于,步骤S1.2中,跨语言验证进一步包括:
4.如权利要求1所述一种基于大模型的提取文档可信证据方法,其特征在于,步骤S1.3中,气味指纹分析进一步包括:
5.如权利要求1所述一种基于大模型的提取文档可信证据方法,其特征在于,共性技术架构包括:
6.如权利要求5所述
...【技术特征摘要】
1.一种基于大模型的提取文档可信证据方法,其特征在于,包括以下步骤:
2.如权利要求1所述一种基于大模型的提取文档可信证据方法,其特征在于,步骤s1.1中,破损文档推理进一步包括:
3.如权利要求1所述一种基于大模型的提取文档可信证据方法,其特征在于,步骤s1.2中,跨语言验证进一步包括:
4.如权利要求1所述一种基于大模型的提取文档可信证据方法,其特征在于,步骤s1.3中,气味指纹分析进一步包括:
5.如权利要求1所述一种基于大模型的提取文档可信证据方法,其特征在于,共性技术架构包括:
6.如权利要求5所述一种基于大模型...
【专利技术属性】
技术研发人员:智静,雷红瑛,张保磊,张健,刘伟,
申请(专利权)人:西安汇智众泽电子科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。