昇腾人工智能计算中心开路
金磊 发自 凹非寺
非常AI 报道 | 公众号 QbitAI
万万没想到,因为速度,武汉再次站在了聚光灯下。
这种速度有多快?
每秒十亿亿次计算!
或许你会好奇,武汉到底是如何解锁这种速度的?
直接上答案:
人工智能计算中心。
可千万不要小瞧这个东西。
在AI时代下的当今,它对于一个城市而言,可以说是一种基础设施了。
有了它,一个城市就是支撑起许多重大的AI应用项目,例如我们所熟知的自动驾驶、城市大脑、智慧交通等等。
再简单来说,就是给一个城市装上了个“马达”,可以让它快速发展。
而且还是大家都用得起的那种。
于是乎,在武汉建成人工智能计算中心的初期,便成了武汉企业竞相争抢试用的“香饽饽”。
武汉大学、中科院自动化所、斗鱼TV、立得空间等,纷纷前来入驻,一度呈现出供不应求的局面。
但讲真,既然人工智能计算中心的定位,是城市的一种基础设施。
那么质量、安全性方面必然是有较高的要求。
绝不是随随便便都可以的那种。
武汉到底是怎么做到的呢?
AI时代下,武汉给其它城市打了个样
武汉的人工智能计算中心,是在去年10月份宣布正式启动,12月28日开始建设。
仅仅耗时6个月,在今年的5月31日,便正式竣工。
值得一提的是,要是按照传统方式建造,可是得花上12-18个月的时间。
之所以能如此之快,是因为武汉采用了一种新的建造方式:
预制模块化机房+整柜交付。
而且正如刚才所述,刚刚上线,便有众多高校、企业单位入局,算力“火力全开”。
这局面,让武汉立即做出决定,扩容!
二期项目的建设已经在路上了。
这得是多大的吸引力,能让各单位如此买账?
要回答这个问题,先来看下它都能用来干什么。
从整体来看,就是一中心四平台。
这个“中心”很好理解,就是人工智能计算中心。
基于此,武汉要打造面向千行百业的四大平台:
- 公共算力服务平台
- 应用创新孵化平台
- 产业聚集发展平台
- 科研创新和人才培养平台
一个城市要想发展人工智能,算力,绝对是绕不开的一个关键因素。
但现实是,科研机构、中小公司,往往很难有这样的技术、经济实力。
因此,公共算力服务平台要做的,就是让大家都用得起强大的算力。
而且还是用得起、用得好、放心用的那种。
除了算力,应用落地也是制约AI发展的一大因素。
应用创新孵化平台要解决的就是这个问题。
举个例子,武汉有一家做智能机器人的公司,就通过这个平台,打造了全球首个机器人补药系统。
在药品分拣这个任务中,由原先的平均耗时50秒,啪的一下就压缩到了3秒!
这不仅让药师的工作效率提升了,更加受益的还是广大的患者。
单是应用的落地还是不够,凡事要壮大,都离不开一个词——生态。
这里亦是如此,于是产业聚集发展平台便发挥起它的作用了。
就目前来看,武汉已经吸纳了像中科院自动化所这样强有力的科研单位。
而这些单位还会带来更多的行业技术专家,孵化更多的创新企业。
据武汉自己的预测:
到2023年,武汉的AI核心产业规模将超过500亿元,带动相关产业规模超过5000亿元。
最后,人才,人才,还是人才。
这就是科研创新和人才培养平台要focus的点。
武汉的已然具备人才密集的优势,而它现在更加鼓励高校和龙头企业,做好产学研结合。
例如创建人工智能重点实验室、研究院等创新科研组织。
整体来说,就是在抓科研成果的同时,还要培养一批关键人才。
这就是武汉给其它城市做出的“范本”。
但这一整套的背后,还是离不开高标准的人工智能计算中心。
何为高标准,又该具备哪些条件?
在刚刚过去的世界人工智能大会(WAIC)中,中国工程院院士郑纬民给出了一种正解。
首先,具备一定AI算力规模以大算力使能大模型、赋能大应用,而且还得是领先的全栈技术。
例如AI服务器集群的算力密度、能效、网络能力,都得是采用先进专为AI计算所设计的处理器。
AI计算框架得具备支撑大模型、全场景的训练能力,芯片与其它硬件协同,源源不断地输出算力。
还有AI开发平台,需是具备全流程极简开发及自动化能力,可以提升集群的资源利用率。
其次,人工智能计算平台还得是自主可控的。
唯有如此,才能避免出现被“卡脖子”的情况,从根本上保障我国的科研创新。
第三,人工智能计算平台还得有一套合理的基准测试和评价系统。
这是因为传统的高性能计算机的测试结果,其实与人工智能需要的性能不完全一致。
例如分数得是可量化的;可以适应单卡内存规模变化、可适应多卡;支持神经网络运算;以及具备多机通信等特点。
最后,不仅建得好,还得用的好,对城市的经济、孵化、人才产生价值。
……
由此看来,武汉的人工智能计算中心,是符合这些标准的了。
那么接下来的一个问题便是:
城市为什么要打造人工智能计算中心?
先来看下近年来大火的大规模预训练模型。
从2019年至今,大模型的体量可谓是爆炸性的增长。
这就对AI算力提出了前所未有的需求。
在这种趋势的推动之下,全球都在布局大型AI算力基础设施。
例如已建成的美国橡树岭实验室的Summit、鹏城实验室的鹏城云脑Ⅱ、富士通的Fugaku等。
而其它更强性能的算力基础设施,也在建设的路上。
很明显的一点:
下一代AI的发展,亟需大规模集约化AI算力基础设施。
而归回到我国,在这方面的布局也是早有准备。
科技部对此做出了总结和展望。
早在2017年国务院发布的《人工智能发展规划》(以下简称规划)中便提出了布局方式:
要围绕构建一个体系、把握双重属性、坚持三位一体、强化四大支撑”进行布局。
规划中体现出的一个重大任务,便是构建泛在安全高效的智能化基础设施体系。
而后,科技部提出《国家新一代人工智能创新发展试验区》。
目标是在2023年,布局建设20个左右试验区(目前已经支持北京、上海等15个地方)。
其中一个核心的点还是,推进人工智能基础设施建设,强化人工智能创新发展的条件支撑。
而对于下一步的工作考虑,科技部同样强调:
夯实人工智能基础设施的发展。
……
不难看出,人工智能计算中心,已然成为一个城市的基础设施,上升到国家层面,亦是“兵家必争之地”。
既然如此重要,能够符合国家、城市要求的人工智能计算中心,又该去哪里找?
华为昇腾AI,了解一下。
昇腾AI,这里有现成的
武汉打造的人工智能计算中心,可以说是给全国其它城市打了个样了。
好用,确实好用。
而在它背后的技术实力,正是来自昇腾AI基础软硬件。
例如在人工智能计算中心现场,所采用的大型设备,便是基于昇腾AI的Atlas 900 AI集群。
据了解,武汉人工智能计算中心一期建设规模100P FLOPS人工智能算力。
而这么强大算力,是由数千颗华为昇腾AI处理器组成。
而武汉能够在如此短时间内建成人工智能计算中心,也离不开华为的帮助。
华为派驻了10余名工程师,与建设方湖一道,夜以继日协商、规划。
聊到这里,还不得不“插播”一下华为和武汉的关系。
众所周知,武汉的华中科技大学每年都会给华为输出一大批人才。
而此次华为力挺武汉建设人工智能计算中心,也算是一种“反哺”了吧。
回归正题,昇腾AI为什么能够胜任如此高要求的项目?
先从技术角度来看,昇腾AI可以说是软、硬两手抓。
早在2018年,华为就发布了全栈全场景的AI战略,同年便发布了昇腾系列的第一个AI芯片——310。
而时隔仅1年,便推出了昇腾910训练芯片,性能也是极其强悍,一问世,便拿下了“全球算力最强”、“训练速度最快”的头衔。
基于此,华为进一步推出了Atlas 900 AI集群,可谓是全球算力巅峰的代表之一:
可以在60秒完成基于Resnet-50模型训练,比榜上的第2名快15%。
也正是因为这样的能力,可以让Atlas 900在探索宇宙、预测天气、勘探石油、自动驾驶等领域大放异彩。
而这些领域,恰好正是一个城市AI发展的重点“高地”。
在这一点上,武汉选择华为,也就不难理解了。
但刚才也提到了,一个合格的人工智能计算中心,不仅仅对算力有要求,还需要软件的相辅相成。
因为唯有如此,才能让它具备全流程极简开发及自动化能力。
而昇腾AI,这方面的实力也是有的。
毕竟在华为推出的AI战略中,主打的便是“全栈”、“全场景”。
例如在推出昇腾910的同时,便发布了全场景AI计算框架MindSpore。
这个框架其实是与昇腾硬件相匹配的,是最能发挥昇腾AI处理器能力的深度学习框架。
除此之外,华为昇腾还拥有AI全栈软件平台,包括异构计算架构CANN 3.0、全流程开发工具链MindStudio和昇腾应用使能MindX等等。
而这一整套下来,便是华为的人工智能计算中心解决方案。
嗯,是与城市人工智能计算中心的理想要求,不谋而合了。
而至于生态方面,昇腾AI也有一套自己的“方法论”——“一平台、双驱动”。
同样是在WAIC上,华为昇腾计算业务总裁许映童是这样解释的:
“一平台”,是指昇腾AI的基础软件平台,这就构建了人工智能的“黑土地”。
“双驱动”,则包含AI的技术生态和商业生态。
就技术生态而言,包括了科研机构、高校、企业、合作伙伴的研究和开发人员。
如果说AI的技术平台是一个工具,昇腾AI要做的,便是要用技术生态,来优化使用工具的人。
对于商业生态,包括ISV、IHV、整机、一体机合作伙伴等,使用工具来开发人工智能产品,解决客户问题。
技术要走到生态里去,生态反过来又会推动技术的发展。
这就是“双驱动”的奥义所在。
除此之外,刚才也提到,要想构建好人工智能计算中心,人才的培养也是重中之重。
在这方面,昇腾AI所推出的“众智计划”和“优才计划”,便与之不谋而合了。
由此整体看来,昇腾AI无论是在软硬件技术,亦或是在生态等方面已有的实力,都是与城市建设人工智能计算平台的要求“一一映射”了。
也正因如此,就在不久前的6月9日,成都市正式宣布,开建人工智能计算中心!
华为昇腾AI,自然成为了成都市的不二选择。
也落地到了其他城市:成都。
至于昇腾AI为什么要发力于此,许映童给出了这样的解释:
未来三年是人工智能发展最关键的三年,唯有抓住机遇、抢占先机,才能赢得未来。
……
OK,华为+武汉、华为+成都,都已经或正在为AI时代下,城市高速发展起了个好头。
模式可复制,技术可现用,其它城市是可以跟上了!