鄂维南,中国科学院院士,北京大数据研究院院长,北京大学教授。
近几十年来,交叉科学的发展突飞猛进。尤其是在最近20年,交叉科学对生物医学、能源、环境、材料、化工、人工智能等诸多领域的发展更是起到了关键的作用。可以说,交叉科学的发展空间已经超过了传统领域。一方面因为许多实际问题本来就带有交叉科学的特性;另一方面,数学、物理学、化学等基础学科经过几百年的发展,已经相当成熟。相比较而言,介于这些学科之间的、需要不同学科背景的交叉科学的发展空间更为广阔。这些都促使交叉科学成为当下最为热门的科研方向。2020年11月,国家自然科学基金委员会成立交叉科学部;12月,我国正式将交叉学科设立为第14个学科门类。这是我国交叉科学发展的两个标志性事件。
大数据、人工智能等热潮的出现,给交叉科学的发展带来了新的机遇。2020年,AlphaFold 2通过机器学习的方法高精度实现了单个蛋白质折叠模拟。它给我们以计算的方法来解决困难的结构生物学问题带来了信心。同年,戈登·贝尔奖成果DeePMD将高性能计算、科学计算和机器学习相结合,实现了第一性原理精度下上亿个原子的分子动力学计算模拟,为分子动力学成为可靠的、实用的研究工具打开了新的大门,也为科学计算开拓了新的方向。这类科学成果成功地推动了机器学习成为交叉科学研究的一个新工具。
然而,交叉科学的人才培养体系建设一直是多年来让我们感到困惑的问题。这当中最根本的原因是交叉科学涉及的范围极其广泛,可以说是包罗万象,所以需要的基础知识也是包罗万象。这使得我们很难在深度和广度之间找到合适的平衡。造成的结果就是到目前为止,国际上成功的交叉科学本科专业非常少。
在交叉科学本科人才培养体系建设方面,我本人参加过两次重要的尝试。
第一次是参与建立上海交通大学致远学院的前身——理科班。理科班的目的是培养数学和物理学基础扎实、面向广大科学和工程领域解决实际问题的拔尖人才。为达到这个目的,从教学计划上,我们做了两件事情。一是高标准、高要求的同时教授数学和物理的基础课。二是开设讨论课,培养学生独立处理实际问题的科研能力。这样做的结果是学生的学习任务极其繁重。第一届理科班的招生是2009年的夏天,是从已经入学一年的学生中选拔。他们本来就是一群有极大干劲和充满热情的年轻人,一年的本科学习经历也使他们认识到自己的兴趣所在。他们对这样繁重的学习任务已经有了一定的甚至可以说是充分的思想准备。所以,第一届理科班办得非常成功。后来招收的学生并没有这样充分的思想准备,效果就大打折扣。究其根本原因,还是我们没有一个成熟的教学计划,靠把数学和物理学堆在一起的方案是不可持续的。这个问题让我思考了整整10年。如果现在再做同样的事情,我相信我们可以拿出更好的方案。
第二次尝试是担任北京大学元培学院院长时,参与推动了整合科学和数据科学专业的建设。这两个专业的建设应该说是比较成功的。整合科学专业经过困难的初创阶段,现在已经比较成熟,也培养出了许多具有良好数理化基础而从事生命科学研究的学生。数据科学专业已经在全国普遍推广。
回到本文的主题,也是我多年来长期思考的问题:什么是交叉科学的基础知识体系?尽管这个问题目前不一定有实际意义,而且也不一定有统一的答案,但是认真探讨一下这个问题对我们加深对交叉科学人才培养的认识是很有帮助的。要探讨这个问题,我们就应该从科学研究最基本的出发点开始。
科学研究有两个最基本的目的:一是寻求基本原理,二是解决实际问题。科学研究有两种最基本的范式:数据驱动的开普勒范式和基本原理驱动的牛顿范式。无论是开普勒范式还是牛顿范式,其最基础、最核心的学科知识都来自物理学、数学和计算机科学。物理学是基本原理的来源,也是培养直观理解、认清事物本质的学科。数学是其他学科精确量化表达的基本语言和基本工具,比方说基本原理通常是由微分方程或变分原理来表述的。无论是什么范式,最终解决问题都需要借助于计算机和算法。所以物理学、数学(特别是应用数学)、计算机的基础知识是交叉科学人才培养的基石。
交叉科学人才的培养,最重要的还是能力的培养。具体而言,我们需要培养以下几方面能力:
1.物理能力的培养
包括直观能力和基本原理方面的修养。
物理学最重要的能力之一就是透过复杂的现象看到背后的本质,并通过简单的模型来表达其本质内容。最经常被提起的例子是朗道关于相变、超流等方面的工作。这种直观能力和从复杂现象中找到其本质的能力不仅在物理学中至关重要,而且在所有领域都至关重要。
自然科学的基本原理都来自于物理学。无论是生物医学,还是能源和材料科学,其最基本的基本原理都可以追溯到量子力学。尤其是在微观层面,即电子、原子、分子层面,量子力学是最重要的理论工具。从量子力学出发,我们可以得到一系列简化的理论工具,如分子动力学。在宏观层面,我们通常不需要考虑电子或原子的精细结构,而只需要寻求代表它们宏观效应的本构关系。在本构关系的基础上,宏观层面的基本原理就可以从基本的守恒律或变分原理得到。除此之外,不同尺度上的动力学过程也表现得很不一样。在宏观尺度上,往往惯性力很重要。在微观尺度上,往往摩擦力更加重要。对于前者,传输的特性更加重要。对于后者,扩散的特性更加重要。交叉科学的学生对这些基本的物理学概念必须有深刻的了解。
有了基本原理,还需要分析方法和工具来帮助我们运用这些基本原理。由于这些基本原理通常是用微分方程表达的,微分方程自然就成了一个必需的基本工具。除此之外,变分法、概率论、渐近分析等也是经常需要的工具。
2. 数据驱动的研究能力培养
包括传统的统计分析方法、机器学习方法,以及其他一些数据分析方法,如图像处理、信号处理等。
3.算法能力的培养
包括针对基本原理的算法和针对数据的算法。
算法方面的课程还有待加强。针对连续对象的算法已由数学系的数值分析课程所涵盖,针对离散对象的算法通常已由计算机科学系的算法/离散数学课程所涵盖。但目前还缺乏将它们融合在一起,以一种更统一的方式来教授算法的课程。
这个计划跟我提出的应用数学人才培养计划高度重合。如果说应用数学计划要求学生选A类数学课程的话,上面这个计划可能要求的是B类数学课程。这并不奇怪,因为很大程度上应用数学面临的问题和交叉科学是非常相似的:应用数学也涉及众多领域,甚至可以说是包罗万象,它研究的许多问题也属于交叉科学的范畴。我个人认为未来很可能会发生的事情是应用数学、应用物理学和应用计算机科学逐渐融合,成为交叉科学的基础。
上面讨论的主要是理论工作方面的能力建设。我本人不是一个实验工作者,所以对实验方面的能力培养了解甚少。但是可以肯定的是,人工智能技术的发展也必将对实验科学产生巨大影响。自动化和智能化将成为实验科学一个新的重要的发展方向。而以上所讨论的内容对这一发展方向也是至关重要的。
比能力培养更重要的是交叉科学的文化建设。在交叉科学逐步被重视的同时,我们也已经建立起了一个以细分学科为基础的教育和科研体系。它对我国的学科建设、资源分配,以及教学和研究成果的评价都起着极其重要的作用。比方说一级学科的概念在我国比其他国家都更加重要。许多重要的评比是以细分领域来分配名额的。尽管说起来大家都觉得不合理,但期刊的所谓分区是我们评价科研工作的一项极其重要的基础设施,而这项基础设施对交叉科学是极为不利的。所以从多方面来说,交叉科学在我国的发展处在一个逆水行舟的局面。正因为如此,我们更加需要加大力度推动交叉科学文化建设,让每个青年学生都能够摆脱画地为牢的思维方式,看到交叉科学的发展空间,拥抱交叉科学的文化。