跨界融合 技术赋能

“新工科下午茶·学科交叉沙龙”第五期活动举行

3月4日下午,“新工科下午茶·学科交叉沙龙”第五期活动在北京大学中关新园集贤多功能厅举行。本期作为“百度飞桨专场”的首期,也是“新工科下午茶”沙龙的首次跨界合作,由北京大学新工科建设办公室、百度基金会、百度AI技术生态部联合主办,北京大学环境科学与工程学院、学科建设办公室协办,以“AI & Environment”为主题,共同探讨环境生态相关的科学计算技术和人工智能的前沿发展。沙龙由环境科学与工程学院副院长、研究员刘永主持,来自北京大学环境科学与工程学院、计算机学院、地球与空间科学学院、公共卫生学院、建筑与景观设计学院等单位,以及中国科学院大学、山水自然保护中心等兄弟单位共30余个单位近60名师生现场参与研讨。

百度AI技术生态部总经理马艳军在致辞中介绍,飞桨是百度自研的深度学习平台,作为框架层衔接着底层人工智能芯片和上层模型,共同支撑应用层开发,服务智慧城市、智慧环境、生物计算等前沿领域的科学探索和产业落地。百度基金会和百度飞桨关注并支持北大新工科建设,期待助力北大开展更多国际领先的核心技术研究。

北大科学研究部副部长刘譞哲介绍了沙龙活动举办的背景和意义。他指出,“新工科下午茶”作为推动“新工科+”的重要载体,已经促成了多项交叉合作研究。本次与百度飞桨的跨界合作,将是促进产研互动的有益尝试。他希望借助百度自主研发的深度学习平台飞桨,为突破“缺芯少魂”的“卡脖子”问题贡献力量。

北大学科建设办公室副主任王志恒表示,近几年人工智能领域发展迅速,AI for Science的理念被提出,有可能形成新的研究范式,打破学科间及研究与产业间的界限,也必将为环境科学的发展带来契机。科技领军企业是“出题人”“答题人”“阅卷人”,高校的科学研究应充分与企业合作,共同提出问题、解决问题。

嘉宾致辞环节(从左到右、从上到下依次为:马艳军、刘譞哲、王志恒)

中国科学院院士,北大环境科学与工程学院院长、教授朱彤以“数字赋能改善环境、保护健康”为题作报告。他指出,空气污染和气候变化从多个维度影响着人类健康,对环境相关风险的预测、预报、预警成为环境领域的重要挑战。目前,基于机理过程已经发展出多个时空尺度的数值预报模型,但其预测结果和真实环境还有较大差距。科学家提出“数字孪生地球”概念,将卫星遥感与地面观测网络获得的大量观测数据与模型融合,通过“天-地-空”环境大数据的结合,帮助人类更好地监测、建模并预测自然灾害与气候变化。同时,可通过暴露组学开展大气全组分测量和基于个体的暴露评估,通过传感器、穿戴式设备等采集的个体生物标本,并与多种组学的大数据关联,识别出每一种暴露可能对人体健康产生的危害。在此过程中,需要AI技术为环境研究赋能,帮助人们认识现在和预测未来。

刘永以“AI驱动的可持续水管理”为题,介绍了AI技术在水管理领域中的应用潜力。他指出,联合国可持续发展目标中70%与水有关,近年来,我国的水环境治理在大规模基础设施建设、大幅度水质改善、大范围高频监测等方面取得重大进展,但是依然面临碳污协同、路径分异、预测预警等方面的现实挑战。AI技术在水管理的宏观、中观、微观尺度上均有应用场景:宏观尺度上包括获取高效率的空间大数据、气象及降雨的短期预报等;中观尺度上可应用于洪涝预警及智能水管理系统的网络监测、水文模拟、泄漏检测等;微观尺度上,可以用于污水处理能耗的优化和运行状态的实时调控等。AI技术可以在数据、模型和算力方面为水环境治理研究提供帮助,其所在课题组已形成高分辨率的水污染源排放清单、全球湖库温室气体排放核算、藻华与水质的短期预测预警、河湖生态补水动态调度、水环境专业领域的知识图谱构建等研究成果。

北大前沿计算研究中心讲席教授邓小铁介绍了课题组在基于上下文集成变换器的拍卖设计神经网络方面的研究成果,这也是深度学习应用于实际问题解决的典型案例。拍卖的价值受到环境约束,买家对商品的估值分布同时依赖于双方的上下文信息。如何设计一个满足占优策略激励相容和个体理性的拍卖机制,并且最大化拍卖者收益?研究中将上下文拍卖设计问题公式化为一个带限制的优化问题,并进一步转化为机器学习问题,设计出CITransNet网络结构。模型以买家报价、买家上下文与商品上下文这三种信息作为模型输入,首先通过输入层整合每个买家-商品对的报价与上下文信息,进而通过若干个基于变换器(transformer)的交互层来建模所有买家-商品对之间的相互影响,最后通过输出层来计算分配结果与支付结果。实验结果表明,模型可以在单物品拍卖上逼近理论最优解,在多物品拍卖上超越已有的基线模型。同时,该模型也具备一定程度的跨场景泛化能力,可以拓展应用到其他博弈问题的机制设计中。

北京应用物理与计算数学研究所研究员王涵以“原子间相互作用建模的机遇与挑战”为题,介绍了深度学习在原子间相互作用建模中的应用。客观世界是由原子构成的,人们试图通过探究微观世界的运动规律对客观世界进行认识和预测。1877年,玻尔兹曼提出熵关系,将宏观观测的热力学性质和微观状态的分子模拟联系起来,使得从微观认识宏观成为可能。传统上,原子间相互作用建模有两种方式,“自上而下”(Top-down)模式由实验观测数据拟合得到势函数模型,计算效率高但结果往往不可信;“自下而上”(Bottom-up)模式由第一性原理生成势函数模型,结果准确但计算复杂性高、开销昂贵。分子模拟问题中能量函数是多维函数,利用传统数学的方法处理比较困难,而深度学习却提供了非常有力的工具。基于此,王涵及其合作者发展了基于深度学习的原子间相互作用建模方法——深度势能(Deep potential),其模型精度达到与第一性原理计算一致,同时计算复杂度由原子数的三次方降低到线性依赖原子数。进一步,他们在深度势能模型中引入注意力(attention)机制,可以极大提高模型的数据效率。

百度飞桨总架构师于佃海介绍了“深度学习技术发展及飞桨应用实践”。深度学习技术的发展,带动了第三次人工智能热潮,也使得AI和各个学科产生深度交叉。AI预训练大模型更具通用性,跨模态文图生成实现了生成式AI的突破,大语言模型涌现的能力也让我们看到了通用人工智能的曙光。深度学习擅长多任务、跨模态特征表示学习和端到端训练,更适配大数据应用场景。深度学习近年来的技术发展经历了三个重要突破:一是以2017年出现的变换器结构(Transformer)为代表的神经网络结构的突破,实现了对信息更好地表示加工;二是任务对象的扩展,从传统的语言、语音和图像等信号输入任务,发展到处理结构化数据,解决推荐系统、知识图谱、时序问题以及科学计算等更广泛问题;三是学习机制的演进,如自监督学习的兴起,以及深度学习与强化学习、人在回路等交互式学习方式的结合等。他指出,深度学习平台下接芯片、上承应用,相当于智能时代的操作系统。百度飞桨自2016年开源,已发展为中国市场应用规模第一的深度学习框架和赋能平台,构建了中国最大的AI技术生态。于佃海还介绍了飞桨通过产教融合为高校AI人才培养所作的贡献。

百度杰出架构师胡晓光以“飞桨深度学习框架与科学计算探索”为题进行分享。近年来,深度学习框架经历了从学术创新探索、科技企业参与到大规模产业应用的发展历程。百度飞桨具有开发便捷的深度学习框架、超大规模深度学习模型训练技术、多端多平台部署的高性能推理引擎以及产业级开源模型库等核心特色,其中的物理信息神经网络、框架高阶自动微分功能、全面适配开源计算库DeepXDE等,将有效助力科学计算的探索。AI生物计算领域的蛋白质结构预测模型HelixFold、城市科学领域的交通大模型、气象学领域的FourCastNet气象模型复现,都是飞桨AI for Science的应用代表。

报告分享环节(从左到右、从上到下依次为:朱彤、刘永、邓小铁、王涵、于佃海、胡晓光)

在交流讨论环节,嘉宾们就人工智能的应用前景、跨学科人才培养、校企合作方式等话题,以及在环境科学、基础设施建设、智能决策等方面的具体问题和技术瓶颈展开讨论。他们认为,人工智能使用门槛的降低为其与各学科的深度合作提供了可能性,不同学科的应用实践也驱动了算法、算力的进步,形成一种良性的互动;环境领域的问题相对复杂,影响因素多,期待可以通过与人工智能领域的交叉,训练和开发出一些具有通用能力的大模型,解决实际环境问题;建议建立长效的校企合作机制,高校与企业共同培养专业人才并展开科学验证,企业为高校提供持续的技术和算力支持,搭建产学研桥梁,推动AI技术切实服务于前沿科学研究。

活动合影

转载本网文章请注明出处