长期关注中国超算领域
鱼羊 丰色 发自 凹非寺
非常AI | 公众号 QbitAI
中美超算竞争正酣,前有中国超算“神威·太湖之光”登上国际排名第一,不过2年,美国Summit就迎头赶上。
后又有日本富岳连续霸榜,对两强格局发起新的冲击。
而它们争妍斗艳的“主战场”,是一个名为TOP500的超算排行榜。
今年的图灵奖就颁给了那个替超算跑分的人。
事实上,这也是一个与你日常工作息息相关的大佬。
无论你是人工智能领域的研究者,还是理工科大学生,目之所及的软件工具,比如Matlab、Scipy,都与这位高性能计算领域先驱的工作脱不开关系。
Jack Dongarra,这是一个早已在高性能计算领域家喻户晓的名字。
正如颁奖词中所说,正是他在数值算法和库上的开创性贡献,使得高性能计算软件在过去40年中追上了指数级硬件发展的节奏。
如此泰斗,亦与中国超算渊源颇深。
不仅几乎年年要到中国各大超算中心访问,不少年轻超算人才也都与他有过近距离的交流。
这么一位老爷子,今年71岁,依然活跃在高性能计算领域的一线。
尽管在去年接受采访时他表示,会在今年夏天过完72岁生日之后退休,但他的工作并没有因为这份退休计划而搁置。
就在本月初,他还合作发表了一篇新的论文,总结了他有关高性能计算发展和云服务巨头崛起之间碰撞的最新思考。
在他看来:
我是一名数学家,对于我而言,一切都是线性代数。现在全世界都看到了这一点。
有关他的成就,比如超算“跑分榜”TOP500的诞生,又如LINPACK等库影响之深远,或许你已经看过不少。
今天,我们不妨一起进一步看看,这位被Jeff Dean赞为“从根本上改变并推动了科学计算”的老人,成就背后的故事。
从“师范生”到科学计算性能基准奠基人
Jack Dongarra在1950年夏天出生,是个土生土长的芝加哥人。
他对科学的兴趣在高中时显现。在接受SIAM(美国工业与应用数学学会)采访时,他谈到:
有天我爸买了一个新的电钻,我很想知道这玩意儿到底是怎么工作的,于是就把它给拆了。
我犹记得当时拆完就装不回去了。还好我爸很理解我,只是出门又买了新的,我得以保留那些被我拆下来的零件。
不过在他高中毕业时,这种兴趣还只是驱使他在“成为一名高中教师”的计划上,选修了数学和科学课程。
他当时选择进入芝加哥州立大学就读——这所学校类似于地方性的师范学校,为芝加哥公立学校系统培养了不少教师。
改变发生在Dongarra读大三、大四的时候。
他发现,去高中教书其实并不是他想做的事情。出于这种想法的改变,一开始,他申请了位于芝加哥的德保罗大学的物理学专业。
但就在这时,他收到了来自芝加哥州立大学物理系主任Harvey Leff的建议:去申请阿贡国家实验室的本科生职位。在那里,他将有机会和真正的科学家一起做一些实际工作,并获取课程学分。
Jack Dongarra听取了这个建议。实际上,他当时面临着非常激烈的竞争——芝加哥州立大学在科学方面并没有非常强的声誉,而参与竞争的人中不乏来自斯坦福等名校的高材生。
好在时任ANL数学部主任(或副主任)的Jim Pool最后还是选择了给他一个机会。Dongarra猜测这里面有Harvey Leff的助力——Jim Pool是他的大学室友。
于是在芝加哥州立大学的最后一个学期,Dongarra在阿贡国家实验室度过了16周左右的时间。也是在那时候,他开始接触EISPACK的开发。
而EISPACK,和Dongarra后来的工作LINPACK,正是Matlab诞生的基础。
在阿贡国家实验室的这段经历,促使Dongarra决心转攻计算机。在本科毕业之后,他在伊利诺伊理工学院拿到了CS硕士学位,此后又在新墨西哥大学拜入Cleve Moler门下攻读博士。
需要说明的是,Cleve Moler是Matlab的创始人。
TOP500的诞生
博士期间,Jack Dongarra的主要工作是开发LINPACK。
这是一种广泛应用于对系统性能进行基准测试的线性代数程序。
基于这项工作,在1990年代初,Dongarra和合作者们一起,创建了用于测试超级计算机能力的新型测试——TOP500。
这一举解决了科学家们无法就衡量超级计算机进展的标准达成一致的问题。
负责监督美国能源部“百百亿次计算”项目的Paul Messina就表示:
“如果你不能测量它,你就不知道它是什么”,这就是为什么杰克的工作很重要。
现在,TOP500已经成为衡量超算能力的权威标准。
事实上,不止是LINPACK。
在过去40年里,Dongarra一直是BLAS、LAPACK、ScaLAPACK、PLASMA、MAGMA和SLATE等库的主要参与者和学术带头人。
有意思的是,当被问到最喜欢的“孩子”是哪一个时,Dongarra没有选择LINPACK,而是谈到了他“最新的孩子”——SLATE。
Dongarra介绍,SLATE的用户“可以忘记底层硬件。只需要把线性代数问题抛出来,SLATE就会想出如何将其分散到数十万个处理器或GPU上”。
长期关注中国超算领域
说起来,Jack Dongarra还长期关注中国超算领域,几乎年年都会来中国参观交流。
2010年国家超算天津中心的“天河一号”首次问鼎T0P500榜单之前,Dongarra在北京参加论坛,由于早就听说中国要推出一个大型超算,他就借此机会请求访问了“天河一号”。
Dongarra看着一排排柜子中装着的2万个小型处理器表示,虽然这些芯片来自美国,但是连接各芯片之间的交换机完全是由中国科学家自己设计的。
而互连速度越快,整体计算的效率就越高——当时天河一号每秒可以执行2.5万亿次运算,比第二名快了40%。Dongarra惊讶地感叹自己完全不知道中国的超算已经发展得有多好。
为此,他紧密关注着中国超算事业的发展。
2013年,在“天河二号”以每秒执行超过30千万亿次的计算再次获得T0P500冠军之后,Dongarra又来到长沙国防科技大学参加国际HPC会议,与中国超算科学家进行交流,并称赞中国超算研究正在大步向前。
那时“天河二号”已经开始使用更多国产组件,比如麒麟操作系统。Dongarra则表示相信中国一定会很快全部换上自己的处理器等硬件。
除了经常穿梭于中国各超算中心,作为ASC(世界大学生超级计算机竞赛,全球三大顶级超算竞赛之一)专家委员会主席,Dongarra从2012年比赛举办开始,几乎每年也会亲自横跨太平洋来到中国、来到ASC总决赛现场,和中国参赛队伍及其他参赛选手交流。
能和“业界泰斗”面对面,这让许多学生激动不已。
2016年,在华中科技大学的总决赛现场,Dongarra在接受CCTV专访时对超算行业发展的理解、对超算人才培养的渴望以及对中国超算发展的肯定也给人留下了深刻的印象。
据中科院的研究员包云岗表示,许多中国学者都和Dongarra有着很深的交情。
相信这两天,Dongarra一定收到了不少来自中国的道贺。
参考链接:
[1]http://history.siam.org/oralhistories/dongarra.htm
[2]https://amturing.acm.org/
[3]https://www.zdnet.com/article/jack-dongarra-who-made-supercomputers-usable-awarded-2021-acm-turing-prize/
[4]https://www.npr.org/templates/story/story.php?storyId=130895386