当前位置: 首页 > 专利查询>中国石油化工股份有限公司胜利油田分公司勘探开发研究院专利>正文

油田综合研究大数据样本标注方法技术

技术编号：35846418 阅读：12 留言：0更新日期：2022-12-07 10:26

本发明专利技术提供一种油田综合研究大数据样本标注方法，该油田综合研究大数据样本标注方法包括：步骤1，提取油田勘探开发业务相关的结构化数据；步骤2，对原始的结构化数据进行预处理；步骤3，根据业务需求，以曲线、图、表这些形式直观展示数据；步骤4，在数据可视化展示界面下，进行样本标注；步骤5，基于标注完成的基础样本集，构建全量样本集；步骤6，对于已标定的样本集，进行样本的维护。该油田综合研究大数据样本标注方法技术思路清楚，标注方法具有创新性，而且标注工具应用简单、方便，实现了油田勘探开发综合研究领域大数据样本采集的智能化、便捷化，具有两项明显的效果。具有两项明显的效果。具有两项明显的效果。

全部详细技术资料下载

【技术实现步骤摘要】
油田综合研究大数据样本标注方法

[0001]本专利技术涉及油田数据处理
，特别是涉及到一种油田综合研究大数据样本标注方法。

技术介绍

[0002]开展油田勘探开发综合研究大数据技术研究，利用SVM、随机森林等机器学习算法和CNN、RNN等深度学习算法建立识别或预测模型，实现大数据应用场景，需要用到大量的样本数据。人工标注样本存在工作量大，标注成果分散在个人手中，无法共享应用等问题，因此，建立通用的样本数据标注方法，研发可视化标注工具，从海量数据中快速对数据进行样本标注，实现数据和专家经验的融合，构建高质量、标准化的油气大数据样本集，并对这些宝贵样本资源进行有效管理是实现大数据场景的基石。
[0003]随着人工智能的发展，机器学习、深度学习等对数据标注的需求越来越高。样本数据标注的越精准，算法模型训练的效果就越好，能否建立足够的、高质量的样本数据是制约模型和算法突破瓶颈的关键。正是由于样本数据标注的重要性，在AI传统行业已经形成了一条数据标注产业链。比较著名的标注平台有京东众智、腾讯云数据采集标注服务、百度数据众包、数据堂等。目前市面上的数据标注存在以下问题：(1)现有的数据标注平台大都采用众包模式分配任务，导致标注结果质量层次不齐，从而影响模型训练的准确性。(2)数据标注产业主要面向个人或企业的项目需求，针对不同的行业应用对数据标注的任务存在一定的差异性，传统行业的数据标注方法主要面向的是互联网数据，与油田专业数据类型差异大，难以满足油田勘探开发专业大数据标注需求，细化标注任务。(3)标注过程无法针对油...

【技术保护点】

【技术特征摘要】
1.油田综合研究大数据样本标注方法，其特征在于，该油田综合研究大数据样本标注方法包括：步骤1，提取油田勘探开发业务相关的结构化数据；步骤2，对原始的结构化数据进行预处理；步骤3，根据业务需求，以曲线、图、表这些形式直观展示数据；步骤4，在数据可视化展示界面下，进行样本标注；步骤5，基于标注完成的基础样本集，构建全量样本集；步骤6，对于已标定的样本集，进行样本的维护。2.根据权利要求1所述的油田综合研究大数据样本标注方法，其特征在于，在步骤1中，根据大数据业务场景需求，提取深度域、时间域和常规二维表这些结构化数据，支持本地文件提取、数据库配置提取、分布式文件系统直接提取等三种数据源提取方式。3.根据权利要求2所述的油田综合研究大数据样本标注方法，其特征在于，在步骤1中，提取测井、岩心这些深度域数据，并进行测井曲线数据体的解析。4.根据权利要求2所述的油田综合研究大数据样本标注方法，其特征在于，在步骤1中，提取基于油田开发生产时间序列的数据，包括生产、监测数据。5.根据权利要求2所述的油田综合研究大数据样本标注方法，其特征在于，在步骤1中，提取油田其他结构化数据，包括与区域、井、措施、油藏类型相关的数据。6.根据权利要求1所述的油田综合研究大数据样本标注方法，其特征在于，在步骤2中，通过对提取的结构化数据进行异常分析、空值处理规则的制定，完成对原始数据的预处理，为后面的样本标定提供准确可靠的数据基础。7.根据权利要求1所述的油田综合研究大数据样...

【专利技术属性】
技术研发人员：张世明，孙业恒，李春雷，张林凤，姜兴兴，杨河山，刘建涛，马青，靳彩霞，车慧翠，
申请(专利权)人：中国石油化工股份有限公司胜利油田分公司勘探开发研究院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人