数据挖掘技术在材料数据分析中的应用探究
来源:用户上传
作者:
摘 要 本文首先介绍了以GH4169合金为代表的高温合金特点和应用现状,然后介绍了数据挖掘技术在高温合金材料微观组织分析中的研究现状和发展趋势,最后提出该方向的研究还存在一定的困难,主要包括:研究需要培养复合型人才、数据提取和清洗存在困难、研究只能作为辅助手段不能代替实验等。
关键词 数据挖掘;材料数据库;高温合金
1 高温合金特点和研究现状
高温合金微观组织和性能等关系研究一直是材料研究人员的研究核心和主要工作。高温合金以较高的高温强度、良好的抗氧化和抗热腐蚀性能、良好的疲劳性能、断裂韧性、塑性而广泛应用在航空器材上。然而,研发周期长是目前材料领域面临的主要问题,例如某高温合金持久实验时间动辄达到上万小时;同时,经济成本也是进行材料试验不得不考虑的问题,为了保证实验的准确性,同一实验通常需要不同批次在不同实验环境下进行测试,因此耗费大量原材料。
数据挖掘技术是当下科学研究与应用的焦点,“大数据”连续六年写入政府工作报告,然而对航空材料数据的分析和挖掘研究仍处于探索阶段。对材料数据的整理和对其规律的探索,一方面能够从数据角度揭示材料微观组织等因素对性能影响,另一方面,可减少材料研究人员在时间、金钱上的消耗,从而控制成本,在未来将有效促进航空材料研究的发展[1]。
2 GH4169合金特点和应用现状
以GH4169为例,该合金是以体心四方的γ”和面心立方的γ’相沉淀强化的镍基高温合金,在-253℃至700℃范围内具有良好的综合性能,650℃以下的屈服强度居变形高温合金的首位,并具有良好的抗疲劳、抗辐射、抗氧化、耐腐蚀性能,以及良好的加工性能、焊接性能和长期组织稳定性,能够制造各种形状复杂的零部件,在宇航、核能、石油工业中,在上述温度范围内获得了极为广泛的应用。
不同的热加工工艺可以使GH4169的合金组织有较大改变,合金中相析出和溶解规律及组织与工艺、性能间的相互关系,是数据挖掘的一个研究方向。可针对不同的使用要求制定合理、可行的工艺规程,就能获得可满足不同强度级别和使用要求的各种零件。
3 数据挖掘技术在高温合金微观组织分析中的应用
3.1 数据挖掘方法
数据挖掘技术是在大型数据存储库中,自动地发现有用信息的过程。数据挖掘技术用来探查大型数据库,发现先前未知的有用模式,数据挖掘也可以用来预测未来观测结果。数据挖掘技术利用了来自如下一些领域的思想:首先是统计学的抽样、估计和假设检验;其次,是人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论;另外,数据挖掘技术也吸取了最优化、进化计算、信息论、信号处理、可视化和信息检索等,最后,数据库通常作为数据的载体,在数据挖掘技术中也起到了至关重要的作用。
3.2 研究现状和发展趋势
通过数据挖掘技术揭示微观组织与性能等规律,基于深度学习算法的人工智能技术可以自主开展实验,美国官方已开展上述研究并取得阶段性成果。美国空军研究实验室的材料和制造部于2013年将人工智能技术和机器人技术、大数据以及高通量和原位技术结合,研发可自主开展材料制备实验的机器人。2016年世界首套可自主开展材料制备实验的机器人样机——“自主研究系统”(ARES)研制成功,ARES能在材料制备迭代实验过程中,自主学习并优化实验设计,确定最佳制备参数,使材料制备实验效率提高百倍,大幅度提高材料研发速度。
在国内,通过数据挖掘技术对材料数据进行分析挖掘,揭示材料微观组织性能等规律的研究大多处于探索阶段。在机器学习方面,北京科技大学的X.Jiang等人提出了一种通过机器学习算法辅助完成的镍基单晶高温合金晶格错配度预测,采用化学成分、树突测量位置、样本厚度和温度作为研究对象,在实验数据集上对线性和多核进行支持向量回归,序列最小优化回归和多层感知器算法,以进行适当的模型选择,多层感知器模型因具有高相关系数和低误差值的显著预测性而运行良好。Zhenghua Deng等人则采用机器学习算法开展对Cu-Al合金的烧结密度研究。
北京航空材料研究院数据中心负责的航空材料数据库及其他相关数据库,积累了目前包括金属材料牌号库、知识库、理化性能库、力学性能库等。数据库中共有金属材料、非金属材料1800多个牌号,包括了各种常用材料和特殊用途材料的各种性能数据20多万个,曲线约3000条,同时在建的性能数据库未来将储存更多的牌号和性能数据。一方面,材料研究人员访问数据库时,不仅需要查询和管理数据,还要通过数据库了解数据间的关联性,甚至在数据库内进行计算,仅实现数据的储存和查询已经不能满足材料研究人员的实际需求;另一方面,数据挖掘技术对材料的辅助研究能够有效降低材料研制的时间和经济成本,提高材料研究水平。
4 存在的问题
(1)该领域的研究需要材料科学、计算机科学相关科研人员的紧密结合。对材料微观組织、性能等的研究需要材料学相关知识背景,数据挖掘技术则需要计算机学科的人才,因此需要多对交叉学科领域的研究需要懂得材料、计算机算法的复合人才,或需要二者相关科研人员的紧密结合。
(2)数据提取和清洗存在困难。虽然高温合金数据量大,但是数据结构复杂,数据维度繁多,单个维度下数据量并不一定能满足数据挖掘人员的分析需求,需要样本平衡、过采样技术等对样本数据进行处理,以获取符合挖掘条件的数据。
(3)数据挖掘技术是辅助手段,不能完全代替实验。对材料微观组织、性能的分析,目前采用数据挖掘技术对材料微观组织和性能进行抽样、提取模型还处于探索阶段。材料组织结构复杂,影响性能的因素多样,必须两种方式结合,才能为设计人员提供最优的解决方案。
5 结束语
对材料数据的整理和对其规律的探索,一方面能够从数据角度揭示材料微观组织等因素对性能影响,另一方面,可减少材料研究人员在时间、金钱上的消耗,从而控制成本。
中国航发航空材料数据中心负责建立并维护航空材料数据库及管理与应用平台,多年来,收集了多个项目大量数据和约四万多条手册数据。目前能够对这些数据进行常规管理和查询,对这些数据进一步挖掘分析,将该项目应用到数据库建设中后,将能够更大程度地发挥这些数据的价值,从而更好地为材料研究人员服务。
参考文献
[1] 周玮.热处理对连续点式锻压激光快速成形GH4169组织与性能的影响[D].秦皇岛:燕山大学,2017.
转载注明来源:https://www.xzbu.com/1/view-14900466.htm