The invention relates to a method for extracting the service performance information of nuclear power materials, which comprises the following steps: Step 1: using the information cleaning system based on machine learning and the glossary of terms and expression rules to process all kinds of information related to the service performance of materials obtained by the nuclear power plant and obtain the cleaned information; step 2: using the manual method to process all kinds of information obtained by some nuclear power plants The information related to the service performance of materials is classified, marked and extracted to obtain a number of information samples, and then the information samples are sorted according to the corresponding arrangement rules to obtain the sample library; step 3: use the sample library for machine learning to obtain the information extraction system, and use the information extraction system to process the cleaned information to obtain the information to be extracted. The invention realizes the extraction of service performance information of nuclear power materials by using the system after machine learning, which can improve the efficiency and accuracy of information extraction, and is applicable to the processing of various information related to service performance of materials in nuclear power plants.
【技术实现步骤摘要】
一种核电材料服役性能信息提取方法
本专利技术属于核电厂信息处理领域,具体涉及一种核电材料服役性能信息提取方法。
技术介绍
核电厂的材料服役性能是关于核电厂运行的安全性、可靠性和经济性的研究内容,是核电领域重要的研究方向。进行相关研究所需的相关的数据,种类繁多,数量巨大。同时由于国内核电厂的建设、运行经历了从无到有的摸索过程,设备、材料的国产化程度也从低到高,所以整个过程中各种数据的记录方式并不统一,同时数据的产生、传递过程的巨大差别也造成了数据种类多,整体结构化程度低。针对现状,需要一种可以适用于大量、低结构化程度数据的核电厂服役性能信息提取方法。核电材料服役性能相关的数据描述的专业性、对于同类问题描述的差异性较大,还可能存在不同的缩写、简写、不规范表达等情况,现有的通用文本挖掘和处理技术无法直接应用,且面对核电厂与材料服役性能相关数据中普遍的短文本等问题也存在根本上的技术障碍。故需要一套适用于核电材料服役性能信息特征的数据清洗、模型训练方法和信息提取方法。
技术实现思路
本专利技术的目的是提供一种适用于核电厂信息处理,能够提高准确性和效率的核电材料服役性能信息提取方法。为达到上述目的,本专利技术采用的技术方案是:一种核电材料服役性能信息提取方法,包括以下步骤:步骤1:数据清洗:利用基于机器学习的信息清洗系统和为提取材料服役性能相关信息所专门建立的术语集与表达规则表,对由核电厂获取的各类与材料服役性能相关的信息进行处理,从而得到清洗后的信息;步骤2:建模:采 ...
【技术保护点】
1.一种核电材料服役性能信息提取方法,其特征在于:所述核电材料服役性能信息提取方法包括以下步骤:/n步骤1:数据清洗:利用基于机器学习的信息清洗系统和为提取材料服役性能相关信息所专门建立的术语集与表达规则表,对由核电厂获取的各类与材料服役性能相关的信息进行处理,从而得到清洗后的信息;/n步骤2:建模:采用人工方法对部分由核电厂获取的各类与材料服役性能相关的信息进行分类标记和信息提取,从而获得满足数量要求的若干项信息样本,再按照对应的排布规则对各项所述信息样本进行排序,从而获得样本库;/n步骤3:信息提取:利用所述样本库进行机器学习而得到用于提取信息的信息提取系统,利用所述信息提取系统处理清洗后的信息,从而得到所要提取的信息。/n
【技术特征摘要】
1.一种核电材料服役性能信息提取方法,其特征在于:所述核电材料服役性能信息提取方法包括以下步骤:
步骤1:数据清洗:利用基于机器学习的信息清洗系统和为提取材料服役性能相关信息所专门建立的术语集与表达规则表,对由核电厂获取的各类与材料服役性能相关的信息进行处理,从而得到清洗后的信息;
步骤2:建模:采用人工方法对部分由核电厂获取的各类与材料服役性能相关的信息进行分类标记和信息提取,从而获得满足数量要求的若干项信息样本,再按照对应的排布规则对各项所述信息样本进行排序,从而获得样本库;
步骤3:信息提取:利用所述样本库进行机器学习而得到用于提取信息的信息提取系统,利用所述信息提取系统处理清洗后的信息,从而得到所要提取的信息。
2.根据权利要求1所述的一种核电材料服役性能信息提取方法,其特征在于:所述步骤1中,所述信息清洗系统进行机器学习的方法为:建立核电材料服役性能专用术语集以及惯用表达规则表,利用所述核电材料服役性能专用术语集和所述惯用表达规则表进行机器学习而得到所述信息清洗系统。
3.根据权利要求1所述的一种核电材料服役性能信息提取方法,其特征在于:所述步骤2包括以下子步骤:
子步骤a:目标信息筛选:按照与材料服役性能的相关性强弱,从部分由核电厂获取的各类与材料服役性能相关的信息中筛选出若干类待处理的信息;
子步骤b:确定分类方法:...
【专利技术属性】
技术研发人员:刘啸天,张彦召,孙大健,张晏玮,薛飞,遆文新,
申请(专利权)人:苏州热工研究院有限公司,中国广核集团有限公司,中国广核电力股份有限公司,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。