一种材料数据库制造技术

技术编号:19934227 阅读:23 留言:0更新日期:2018-12-29 04:33
本发明专利技术提供一种材料数据库,所述数据库包括:材料样品的信息,是指对材料的样品的完整描述;源数据信息,是指对样品进行测量或计算获得的未经进一步分析的数据;分析数据信息,是指对源数据进行分析处理后得到的性能数据。本申请提供一种材料数据库,其更好地符合材料基因工程所需的可发现、可访问、可交互、可重复使用的数据原则,从而更加系统有效地存储必要信息,并利用材料数据加快材料研发。

【技术实现步骤摘要】
一种材料数据库
本专利技术涉及一种材料科学领域,特别是涉及一种材料数据库。
技术介绍
材料是人类用于制造物品、器件、构件、及其或者其他产品的那些物质。燃料和化学原料、工业化化学品、食物和药物,一般都不算是材料。材料总是和一定的用处相联系,可由一种或若干种物质构成。并且,即便是同一种物质,由于制备方法或者加工方法不同,可成为用途、类型和性能迥然不同的材料。其中,从物理化学属性来分,材料可分为金属材料、无机非金属材料、无机高分子材料、有机高分子材料和不同类型材料所组成的复合材料。材料基因工程是材料科学的新型研发理念。通过从“试错法”向数据密集型工作模式的转变,实现新材料及工艺的理性设计,极大地提高研发效率。以“数据+人工智能”为标志的数据引领模式围绕数据产生与数据处理展开,代表了材料基因工程的核心理念与发展方向。其中,材料基因工程数据库是要素之一,需要收录符合FAIR(可发现、可获取、可互操作、可再利用)原则的数据资源【WilkinsonMD,DumontierM,AalbersbergIJ,etal.TheFAIRguidingprinciplesforscientificdatamanagementandstewardship[J].ScientificData,2016,3:160018.】,供社会共享。“可发现”指数据及其元数据被赋予全球性唯一并持久的标识,数据被丰富的元数据所描述并在可检索的源中登记或建立索引,易于被第三方(人员与机器)方便地找到;“可获取”指数据及其源数据可使用标准通讯协议通过标识查询并获取;“可互操作”指数据及其元数据的表达使用正式、可获得、共享和广泛使用的语言;“可再利用”指数据及其元数据由多种准确并相关的特征所描述,与细致的出处信息相关联并符合相关领域的标准,从而被不同用户(人员与机器)方便地使用。因此,有必要建立一种适合材料基因工程需求的数据模型,规范数据的产生过程中必须收集的信息与遵循的格式,有利于今后对数据的充分有效利用。数据,特别是源数据(即由测量或计算获得的未经进一步分析的数据)的可再利用性是材料基因工程的重要特征。以某一合金的X光衍射谱为例,它可用于获得材料的晶体结构,也可用于分析合金掺杂的成分,还可用于分析结晶程度、晶粒大小、晶体取向等参数。因此一组源数据在不同的使用者手中可以根据各自关切产出不同的结果。传统材料数据库一般仅收集由源数据处理而得到的分析结果(如各种材料性能参数等),而源数据本身通常分散在实验者手中,不被收录。同时,与数据相关的元数据通常也不在收录之列,因此难以满足FAIR原则。美国密西根大学的预测性集成结构材料学(PRISM)中心开发的MaterialsCommons是近期国际上出现的较为符合FAIR原则的数据平台【PuchalaB,TarceaG,MarquisEA,etal.Thematerialscommons:acollaborationplatformandinformationrepositoryfortheglobalmaterialscommunity[J].JOM,2016,68:2035-2044.】。它采用的数据模型包含了样品、工艺、参数、测量值、数据文件、数据组几个部分,其中覆盖了样品历史(即样品元数据)、测量源数据、和经过处理的数据这三个层面的信息。尽管该模型考虑到对同一样品进行多次表征和对同一种多个样品进行表征的情况,但没有强调系统地赋予样品与测量事件以独特并持久的标识,也没有建立样品、源数据与经处理产生的数据间的系统性关联。这影响了之后的数据分析中对材料数据检索的完整性与建立材料变量间关联关系。
技术实现思路
鉴于以上所述现有技术的缺点,本专利技术的目的在于提供一种材料数据库,用于解决现有技术中材料数据库平台不符合FAIR数据原则的问题。为实现上述目的及其他相关目的,本专利技术是通过以下技术方案获得的。本专利技术首先提供一种材料数据库,所述数据库包括:材料样品的信息,是指对材料的样品的完整描述;源数据信息,是指对样品进行测量或计算获得的未经进一步分析的数据;分析数据信息,是指对源数据进行分析处理后得到的性能数据。优选地,所述样品为实际样品或虚拟样品。实际样品由特定制备方法在特定条件下产生。实际样品的源数据由表征实验获得。虚拟样品是由人为选定或用特定计算方法在特定条件下计算产生。虚拟样品的源数据针对特定虚拟样品由特定计算方法在特定条件下通过计算获得。优选地,材料实际样品的信息包括材料样品的规格和名称。优选地,材料实际样品的信息还包括样品的制备元数据,如制备方法,制备条件等。优选地,材料实际样品的信息还包括样品的独特且持久标识,如根据国标《科技资源标识(GB/T32843-2016)》生成的样品资源标识码或DOI识别码等。优选地,材料实际样品的源数据信息包括对每个样品的每次表征、测试实验的元数据,如方法、测试条件。优选地,材料实际样品的源数据信息包括对每个实际样品的每次表征、测试实验的未经处理的数据。优选地,材料实际样品的源数据信息包括对每个样品的每次表征、测试实验的独特且持久的标识,如根据国标《科技资源标识(GB/T32843-2016)》生成的样品表征数据资源标识码或DOI识别码等。优选地,材料虚拟样品的信息包括样品的规格和名称。优选地,材料虚拟样品的信息包括产生样品的计算方法和条件等元数据。优选地,材料虚拟样品的信息包括样品的独特标识,如根据国标《科技资源标识(GB/T32843-2016)》生成的样品资源标识码或DOI识别码等。优选地,材料虚拟样品的源数据信息包括对每个虚拟样品的每次计算实验的元数据,如方法和条件。优选地,材料虚拟样品的源数据信息包括对每个虚拟样品的每次计算实验的未经处理的数据。优选地,材料虚拟样品的源数据信息包括对每个虚拟样品的每次计算实验的独特标识,如根据国标《科技资源标识(GB/T32843-2016)》生成的样品表征数据资源标识码或DOI识别码等。优选地,材料实际样品或虚拟样品的源数据信息包括样品的物理化学参数和综合表征参数。所述物理化学参数包括化学成分、物理性能、机械性能和加工性能。优选地,材料样品的分析数据信息包括对源数据信息每次分析处理使用的分析方法和条件等元数据。优选地,分析数据信息包括对源数据信息每次分析处理后得到的每个性能数据的数值、单位、曲线、图形、表格、关系式。优选地,分析数据信息包括对源数据信息每次分析处理后得到的每个性能数据的独特且持久的标识,如根据国标《科技资源标识(GB/T32843-2016)》生成的样品表征数据资源标识码或DOI识别码等。优选地,本申请中所述材料包括金属材料、无机非金属材料、无机高分子材料、有机高分子材料和复合材料。本申请中材料数据库的数据模型具有三层结构的数据库,可以通过科技资源标识以及条目中的关键词等进行关联、检索,可为不同的用户与不同的用途反复使用。附图说明图1为本申请中数据模型的层次结构示意图。图2为本申请中材料数据库的框架示意图。图3为实施例1中Fe-Ni-Cr组合材料样品制备示意图。图4为实施例1中Fe-Ni-Cr组合材料样品几何信息示意图。图5为实施例1中Fe-Ni-Cr组合材料样品的综合表征数据库示意图。图6为(CoCrCuFeNi本文档来自技高网
...

【技术保护点】
1.一种材料数据库,其特征在于,所述数据库包括:材料样品的信息,是指对材料的样品的完整描述;源数据信息,是指对样品进行测量或计算获得的未经进一步分析的数据;分析数据信息,是指对源数据进行分析处理后得到的性能数据。

【技术特征摘要】
1.一种材料数据库,其特征在于,所述数据库包括:材料样品的信息,是指对材料的样品的完整描述;源数据信息,是指对样品进行测量或计算获得的未经进一步分析的数据;分析数据信息,是指对源数据进行分析处理后得到的性能数据。2.根据权利要求1所述的材料数据库,其特征在于,包括如下特征中的一种或多种:所述样品为实际样品或虚拟样品;实际样品由特定制备方法在特定条件下产生;虚拟样品是由人为选定或用特定计算方法在特定条件下计算产生。3.根据权利要求1或2所述的材料数据库,其特征在于,包括如下特征中的一种或多种:实际样品的源数据由表征实验获得;虚拟样品的源数据针对特定虚拟样品由特定计算方法在特定条件下通过计算获得。4.根据权利要求1或2所述的材料数据库,其特征在于,包括如下特征中的一种或多种:材料实际样品的信息包括材料样品的规格和名称;材料实际样品的信息还包括样品的制备方法和制备条件;材料实际样品的信息还包括样品的独特且持久标识。5.根据权利要求2所述的材料数据库,其特征在于,包括如下特征中的一种或多种:材料实际样品的源数据信息包括对每个样品的每次表征、测试实验的方法、测试条件的元数据;材料实际样品的源数据信息包括对每个样品的每次表征、测试实验中获得的未经处理的数据;材料实际样品的源数据信息包括对...

【专利技术属性】
技术研发人员:汪洪张澜庭
申请(专利权)人:上海交通大学
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1