中国已经成为全球开发框架生态发展最快的国家
金磊 发自 凹非寺
非常AI | 公众号 QbitAI
百度飞桨又一次被“点名”了:
中国深度学习市场应用规模第一!
这就是中国信通院与深度学习技术及应用国家工程研究中心联合发布的《深度学习平台发展报告(2022年)》(下文简称报告)中,所给出的最新结论。
而且还是和老牌深度学习框架选手,谷歌家的TensorFlow、Meta家的PyTorch一较高下后的结果。
不仅如此,报告中还指出,中国已经成为全球开发框架生态发展最快的国家。
单是在社区生态这一块,以飞桨为代表的“中国队”便在GitHub中交出了一组亮眼的数据:
- 项目贡献人数(Contributors)增速:是TensorFlow的5.2倍,PyTorch的1.6倍;
- 关注度(Stars)增速:是TensorFlow的3.8倍,PyTorch的1.3倍。
而与信通院这次发出的“信号”类似,在更早之前,IDC和弗若斯特沙利文等研究机构也给出了值得关注的结论。
它们分别在报告中指出:
飞桨在中国深度学习市场中的综合份额已超越其他国际巨头,成为中国第一。
飞桨在中国深度学习软件框架市场综合竞争力领跑行业。
不难看出,百度飞桨在多家研究机构调研下,已然成为佼佼者的存在。
那么问题就来了:
飞桨何以实现“国内第一”?
人工智能发展至今,可以说是已经成为最具活跃度的创新领域。
并且随着其不断在产业乃至生活中的应用,不仅是对技术本身,对社会经济的发展起到了推动作用。
而纵观近十几年来的发展轨迹,较为显著的一点是:深度学习仍旧是当下进程中的那个“主旋律”。
因此,与之对应的深度学习框架,也就成为了类似于AI时代下操作系统般的存在——下接芯片,上承各种业务模型、行业应用。
这也就是国内外科技巨头不遗余力地在此发力的原因了。
值得一提的是,在飞桨于2016年率先开源之后,2020年成为国内深度学习框架发展历程中值得被“标记”的一年。
因为在这一年,国内外深度学习框架的全球格局,发生了显著的变化:
从图中不难看出,在2020年之前,深度学习框架仍旧是TensorFlow和PyTorch等主流“玩家”来主导,国内仅有百度飞桨一枝独秀。
但在此之后,国内深度学习框架异军突起,呈现了第一波集中式的爆发。
产业界方面,独角兽旷视拿出了工业级深度学习框架天元(MegEngine),一流科技OneFlow、华为昇思(MindSpore)也在同年登场。
学术界方面,清华大学则是开源了支持即时编译的深度学习框架计图(Jittor)。
而信通院此番研究结果,正是基于国内外现如今“百家争鸣”般的深度学习框架。
从报告中来看,信通院这次将百度飞桨定位为“中国深度学习市场应用规模第一”,主要是从三个维度进行的考量。
首先,是技术应用能力。
报告认为,在全球范围来看TensorFlow和PyTorch仍是深度学习框架的主流“玩家”,但与此同时,也认可了百度飞桨自2016年以来的成绩。
例如在GitHub和Papers with Code的趋势榜单中,飞桨的PaddleClas、PaddleDetection、PaddleGAN等多个套件便登顶榜单。
并且从技术专利数量来看,百度在深度学习方面已经取得全球第一的成绩。
值得一提的是,飞桨还做到了“因地制宜”,针对国内市场的需求变化,不仅提供了大量“有经验”的产业模型库,还支持中文环境的算法和API:
相较于TensorFlow和PyTorch成为更满足国内技术应用需求的开发框架。
其次,是社区生态构建。
正如刚才我们提到的,报告指出“我国已成为全球开发框架生态发展最快的国家”。
报告统计了近一年半以来,我国以飞桨为代表的深度学习框架在贡献人数、关注等方面,与主流“玩家”的增速对比。
基于此,报告认为:
整体来看,目前飞桨社区生态仅次于PyTorch,位居国内市场次席。
而且报告针对国内玩家,围绕“活跃度”、“关注度”和“贡献人数”也做了数据的对比统计:
不难看出,百度飞桨在各项数据上的表现,都处于遥遥领先的状态。
最后,是平台服务规模。
报告指出,目前国内在深度学习框架开发者群体规模最大的便是百度飞桨,已经达到了477万、服务18万个企事业单位,并且通过飞桨所打造出来的AI模型数量已经达到了56万个。
综上数据,报告得出了如下了结论:
飞桨已经超越TensorFlow和PyTorch,成为国内服务规模最为广泛的框架工具。
至于为什么信通院要通过这三个维度来做评判,在报告中也道出了其缘由。
报告认为,要构建面向产业的深度学习平台,不仅仅是打造一个框架这么简单,更需要兼顾模型研发到部署的服务体系。
总体而言,需要包含这三个要素:开发框架、算法模型和开发工具及能力平台。
基于如此要素的深度学习平台,方可实现其基础核心:
通过打造易用、高效、可拓展的框架引擎,解决产业级应用的一系列问题,涉及编程范式、大规模分布式训练、软硬件适配等关键技术。
无独有偶,在IDC和沙利文的研究报告中,对百度飞桨“市场第一”的评判维度,同样也是围绕着易用、高效和落地等关键词展开。
那么基于这样的结果,还有一个更为深入的问题值得探讨:
飞桨拿下“国内第一”,意味着什么?
从多方研究机构的报告来看,国内深度学习框架的市场着实有“厚积薄发”的味道。
而百度飞桨作为国内最先发力且目前成绩最佳的那一个,或许多方给予的“第一”殊荣,正是意味着飞桨在“如何把深度学习用起来”这件事上,提交了一个“高分作业”。
这份“作业”,我们不妨将其定义为“飞桨模式”。
若是将其拆解开来,大致可以分为三个关键词,分别是深度学习、产业级和开源开放。
“深度学习”这个关键词,不仅指的是人工智能核心基础技术本身,还应当囊括深度学习框架,让开发者能够面对不同需求,不用再从0到1地去搭建,更应该像是搭积木一样简单。
为此,“易用”从始至今都是百度飞桨在发展、迭代中的一条主线路,也是能够在国内市场规模拿下第一的“致胜法宝”。
比如,飞桨企业版零门槛AI开发平台EasyDL一站式支持智能标注、模型训练、服务部署等功能,内置丰富的预训练模型,支持公有云/本地服务器/设备端等灵活部署,已在工业、零售、制造、医疗等领域落地。
有开发者评价:就像厨师无需亲自制作菜刀一样,码农们可以按需调用,开发AI程序、做出AI硬件,无论是PC、平板、电视还是安卓、iOS,都可以适配。
这就让开发者可以在不挑算法的情况下,“丝滑”地去做开发。
除此之外,现在飞桨的核心框架做到了贯穿开发、训练、推理部署三个环节,基础模型库更是覆盖CV、NLP、推荐、语音、知识增强的文心大模型。
而开发者所要做的,仅仅是根据自身业务的需求,把数据导进来训练即可,最终就可以快速实现部署。
用百度CTO王海峰在最近百度世界大会上,与撒贝宁的一段对话来形容就是:
百度飞桨像是一道完成了九成的菜,主料、佐料全都准备好了,只需要拿回去往锅里放就行了。
“产业级”则指的是,飞桨平台上的所有技术,并不是一张张PPT,而是用真金不怕火炼的方式,在现实场景中历练过的那种。
根据最新数据显示,飞桨提供超过500个精选算法和预训练模型,其中就包含了经过产业实践长期打磨的主流模型;飞桨还结合产业实际场景、精心打造了精度与性能平衡PP系列特色模型,覆盖目标检测、OCR、语音理解等多个高频应用场景,可以让AI产业应用时达到事半功倍的效果。
飞桨产业范例库和产业模型选型工具则以真实产业场景和数据为蓝本进行研发,涵盖智慧城市、智能制造等多个领域,助力企业灵活运用模型和开发套件构建完整的落地方案,直达项目落地,降低AI产业落地难度。
正所谓“实践是检验真理的唯一标准”,飞桨的技术也真真实实地已经用来在各行各业当中。
例如百度世界大会上最新展现的这些故事:飞桨走进过内蒙古大草原,相关高校团队借助飞桨,针对牧民在养羊上的痛点,打造了母羊分娩预测和预警系统,提高羊羔成活率。
再如农业场景之下,飞桨还曾帮助农业科研人员开展农田地块分割和农田障碍物识别。
从结果上来看,即使在形状不规则、环境复杂的农田地块里,也能快速获取高精度农田场景模型,保障了农机的精准作业。
最后的“开源开放”,指的就是百度把多年来积累下来的经验,一口气毫无保留地释放出来,和各界共同打造更强大的AI生态。
至于这么做的理由,其实也无需再多赘述,毕竟开源的力量,大家都是有目共睹的。
正如王海峰所说:
作为“智能时代的操作系统”,百度飞桨集深度学习框架、产业级模型库,以及丰富的开发套件和工具组件为一体,持续降低门槛,支持企业和广大开发者开展技术创新和产业应用。
飞桨的技术生态繁荣,也从一个侧面反映出中国人工智能技术、产业、人才正在蓬勃发展。
……
以上便是“飞桨模式”的主要内容了,至于这种模式的正确与否,还需要时间来慢慢考验。
但能够明确的一点是,起码“飞桨模式”现在所发力的关键节点,是与此次信通院报告中对于深度学习未来展望所契合的,即:
深度学习平台能力将围绕技术实力、功能体验、生态模式三个维度演进迭代。
并且单单是做到落地“格局”还是小了,深度学习框架还肩负更加深远的价值,正如报告中所述:
从更长周期和更广视野来看,深度学习平台将持续提升传统行业高附加值产品的比重,进一步优化产业结构,增强国家产业经济韧性和抗风险能力,已成为一项具有战略性、全局性、时代性、现实性的紧迫任务,需要政府、科研机构、人工智能企业和传统行业企业等各方通力协作配合,共同营造积极健康的产业生态。
扫码获取报告