新材料学院基于材料基因大数据研发的“未名材料解析系统”投入应用服务

“一代材料、一代产业”,材料研制周期长、检测分析困难等问题一直限制着新材料的研发与应用。2016年国家启动了材料基因工程重点研发计划目的是用新的研究范式(高通量计算、高通量制备、高通量检测及构建材料数据库)加速新材料研发速度。北京大学深圳研究生院新材料学院潘锋教授于2016年联合多所高校、研究机构和企业承担了“基于材料基因工程研发固态锂电池及关键材料”该国家重点项目。在5年的研究中,潘锋团队发展了基于图论的结构化学和材料基因研究新范式,将与中心原子成键的最近邻原子定义为结构基元,再把原子或结构基元抽象成图论中的点,结合计算机智能运算,实现了无误地判断结构同构性及定量描述结构间的异构度与演化关系的技术突破。团队基于图论的晶体结构和材料基因的表达方法,将空间原子/分子结构几何拓扑化,极大程度地提高了材料智能识别的效率和精度,构建了拥有60余万种结构的高质量晶体结构数据库(SCIENCE CHINA Chemistry (2019) 62 , 982), 在此基础上提出基于材料基因到数据构建整合材料制备,材料检测与分析于一体的新型“未名材料解析系统”,运用结构基元及其连和化学键相互作用等微观要素,结合计算机高通量智能比对分析,实现对于材料的智能检测分析,第一代系统开始投入应用和为用户服务。

图1. 材料基因数据库示意图

“未名材料解析系统”是基于完善的晶体结构大数据系统,结合晶体学衍射计算方法,实现了对于结构各种衍射图谱的高通量智能计算,可以完成对于晶体结构的X射线衍射图谱、中子衍射图谱和TEM衍射图样的精确计算,并依托材料大数据系统对传统衍射计算公式进行修正,获得与实验结果更接近的衍射图样。依托于背后强大的材料大数据的支持,该材料解析系统结合通讯领域信号处理等方法,实现了对于实验数据的智能处理,包括通过准确提取图谱中峰位峰强等关键信息,结合传统晶体学中的材料解析方法,系统可以完成对粉末衍射实验数据的一条龙定性相分析,准确解析发现实验样品中可能含有的物相。此外,为了加速对于大型数据库的检索速度,我们构建了离散型数据库框架,实现了对百万级峰位峰强数据的高通量快速检索。

图2. 未名材料解析系统相分析模块检索示意图

团队在目前相分析的基础上不断发展,如正在增加中子衍射相分析、TEM衍射图样分析及半定量相分析等模块,整合机器学习等人工智能方法,智能地获得和处理不同领域实验数据并进行深度的“学习和分析”,使得材料基因组科学工程的新范式能为新材料的研发检测提供全新思路和工具。

为方便广大科研工作者快速方便的完成实验物相解析,北大“未名材料解析系统”现开放线上预约服务。用户可以直接扫描下方微信二维码进行线上预约,也可以通过www.pkusam.com网站进入预约平台进行线上预约,网站同时提供对材料基因数据库的检索服务,用户可以通过网页实现对晶体结构的快速检索和相关电子结构信息的获取。

该工作得到了国家材料基因工程重点研发计划、国家自然科学基金、广东省重点实验室和深圳市科技创新委员会项目的大力支持。

转载本网文章请注明出处