谁能玩转ChatGPT

新闻 2023-04-17

436 0

　　过去两个月，选择押注ChatGPT的中国公司和个体纷纷涌现。

　　2月13日，原美团联合创始人王慧文发帖称，将出资5000万美元，打造中国OpenAI，设立估值2亿美元（约13.6亿元）的科技公司。

搜狗前CEO王小川也回复媒体称，“快速筹备中”，正与产业界和学界的重要人士进行密切沟通。

　　谁都希望赶上ChatGPT的热度，成为第一个占领市场的赢家。

3月15日凌晨1点，OpenAI正式推出GPT-4文本生成AI系统

　　但问题来了，怎么做？

粤港澳大湾区数字经济研究院（IDEA）讲席科学家张家兴告诉南风窗，如果发展类ChatGPT的千亿参数大模型，却一直无法证明自己的价值，大厂能否继续坚持投入，是一个值得担心的问题。

　　但势不可挡地，赶潮的锣鼓已经敲响。

　　焦急地等待与追赶中，仍有问题待解：玩家云集的赛道，到底能给公众带来什么应用和改变？

　　ChatGPT的商业化故事，会是下一个哑火的元宇宙吗？

　　火热的市场

人工智能圈很久没那么热闹了。

　　一位研究自然语言的AI行业人士告诉南风窗，2020年时，人工智能坐了几年的“冷板凳”，行业一片看衰。其所在公司因此“人员收缩”，裁了1/4的员工。

清华大学计算机系自然语言处理实验室副教授刘知远对南风窗回忆，AI在历史上成功出圈的次数不多。上一次备受瞩目，要属2017年击败柯洁的围棋AI——AlphaGo的推出。

2017AlphagoVs柯洁大赛（乌镇）柯洁大比分0-3遭零封

相比之下，ChatGPT的热潮从2022年末持续至今，让人意外。“没想到ChatGPT这么火，”上述行业人士说，“有时看到ChatGPT还在刷屏，我感到厌烦了。”

公众的关注，传导至了做自然语言处理技术的AI公司。

　　清华大学孵化的AI初创企业——聆心智能的联合创始人郑叔亮告诉南风窗，2月，他平均每天要面对4至6个主动前来交流的公司或团队。

这与过去需要主动对外介绍AI产品截然不同。“以前听到生成式的模型，大部分人都持怀疑态度，说AI到底靠不靠谱？”但现在，“从上到下，大家都在积极拥抱这门技术”。

　　他回忆，接洽的客户中，一向对信息安全谨慎的医院，都在主动了解ChatGPT类产品，“态度有180度的大转变”。

热门的AI对话赛道，让中国公司和研究机构前仆后继。

　　2月20日晚，复旦大学邱锡鹏教授团队发布国内首个类ChatGPT应用MOSS，因访问量太大停机。

复旦MOSS回应服务器崩溃：模型还不成熟，完成初步验证将开源

2月27日，秘塔科技发布大模型产品“对话写作猫”，成为首个国产公开可用的类ChatGPT产品。用户可以通过与AI对话的形式，获得回答或生成内容，完成写文案、文生图等AI生成内容（AIGC）的任务。

　　秘塔科技CEO闵可锐回复南风窗称：“最近比较忙，算是在最一线做相关产品落地探索。”

　　AI赛道的火热，从招聘市场可见一斑。

脉脉CEO林凡透露，这段时间，科技巨头相继加快在AIGC的布局。猎头、企业HR都在发布大量AIGC技术高薪岗位，力求抢占先机。

　　专注自然语言处理的AI企业——追一科技的CEO吴悦对南风窗表示，ChatGPT之所以在业界掀起狂潮，是因为证实了大语言模型（LLM）的可行之处。

升级更新后的GPT-4，处理文字内容的上限拓展到2.5万个字符，是ChatGPT的8倍

“自然语言处理（NLP）技术过去有个特点，多任务多模型，每个任务都有一个小模型。例如，搜索有它专门的NLP系统，推荐有推荐的NLP。”

　　由于小模型很分散，从商业角度来看，“比较难规模化”，吴悦说。

　　ChatGPT的出现，“论证了大语言模型可以执行多任务”。他解释，当训练一个模型可以同时满足多种需求，“经济效应便有机会最大化”。

他回忆，团队过去几年在研究大模型的底层算法，但一直没将它工程化为产品，“时机还不成熟”。

　　现在，乘着ChatGPT的东风，是时候投资押注了。

　　进场的玩家

火热归火热。上述公司负责人都认为，入局大语言模型是一件门槛很高的事情。

　　不是每个团队都有做OpenAI的本领和底气。

　　张家兴分析，对于互联网大厂，有充足的算力、人力和数据资源，可以持续投入千亿参数以上的大模型，构建自己的技术壁垒。

吴悦告诉南风窗，ChatGPT背靠至少1750亿参数的大模型，在商业化过程中也有短板。

　　比如，运行和训练成本高昂。这将阻碍“最后一公里”场景的落地。

“我们判断，OpenAI推出的通用大模型，需要结合场景进行专门的training（训练）。”

　　他举例，都是基于GPT-3.5模型，ChatGPT和必应搜索引擎的表现却不同。“ChatGPT和必应（的模型）可能有各自的任务，都要进行专门训练。”

对于希望拥抱AI的企业而言，高昂的训练成本将成为一大阻碍。据披露，GPT-3训练一次的成本约为140万美元（约合960万元）。

国盛证券基于参数数量和token数量估算，GPT-3训练一次的成本约为140万美元

但在强势的OpenAI和公众瞩目下，互联网大厂只能迎战。

　　匆匆推出Bard的谷歌，遇到了相似难题。

2月22日，谷歌母公司Alphabet董事长约翰·亨尼斯透露，大型语言模型的对话成本，可能是传统搜索引擎的10倍以上。谷歌因此必须降低运营成本，但这一过程并不容易。

　　“最坏情况，（降成本）需要几年时间。”

　　高昂的成本，注定了这并非回报率快的生意。

张家兴分析，如果训练出类ChatGPT的大模型，“模型的尺寸如此巨大，如果没有底层算力技术的进步，也没法以很低的成本服务到每个人”。

根据国盛证券估算，今年1月，平均每天约有1300万访客使用ChatGPT，对应芯片需求为3万多片英伟达A100GPU。这些流量带来的初始投入成本约为8亿美元（约合55亿元），每日电费在5万美元左右（约合34万元）。

对于一些更大的LLM模型（如拥有2800亿参数的Gopher和拥有5400亿参数的PaLM），训练成本介于200万美元至1200万美元之间

权衡之下，吴悦认为，对于像追一科技这种面向企业服务的AI公司，做百亿级别参数的大模型，才是较为可行的方案。

“知识的深度和广泛性决定了系统的难度与复杂度。大厂对标完整复制ChatGPT，创业公司则可以基于语言理解，结合领域内知识，形成垂直领域或者行业ChatGPT。”

　　他判断：“训练百亿级模型不是一个太高的门槛。千亿级和百亿级模型之间，训练成本可能是百倍的差距。”

张家兴也同意，千亿级大模型和百亿级大模型适合的场景不同，玩家自然也会分化。

　　拥有技术、算力和资源的百度等大厂适合前者，即所有功能聚合到一个模型，具有通用性。在面向消费者（to C）端，需求多样，很适合 “万能”的千亿级模型。

而面向企业（to B），需求可以事先定义，却往往需要具体定制。

　　“这时，百亿级模型体现出定制成本低和训练速度快等优势。”

上述业界人士都有相似的设想。随着投入AI大模型的公司越来越多，商业化的场景和机遇也愈加多样。而千亿甚至更高参数的国产大模型，将来可能成为基础模型，服务其他企业进行私有化部署和改造。

　　理想与现实

　　以发展自然语言大模型为路径的AI，在许多技术乐观派看来，给人类社会带来了充满想象力的未来。

埃隆·马斯克形容，ChatGPT是不亚于iPhone的发明。比尔·盖茨将其比作“不亚于重新发明互联网”。

郑叔亮告诉南风窗，ChatGPT让各行各业变得兴奋，但同时带来紧张跟焦虑，“（即将）抢了很多人的饭碗，也会把既有商业模式和结构打破”。

　　他介绍，大语言模型出圈后，各类应用场景已经应接不暇。教育、游戏、心理等领域，都会迎来大突破。

ChatGPT回答关于AIGC“抢饭碗”的问题

郑叔亮透露，公司近日接到游戏公司的一些需求——开发“智能NPC（非玩家角色）”，以提供沉浸式、交互体验好的游戏。

教育也会是AI大模型广泛应用的版块。他介绍，在创新型教育的趋势下，当前的互联网教育研发，围绕着策划、内容创作、编排脚本等展开，是一个特别长的链路。

　　但拥有了智能大模型后，“一些关键环节可以提供AI服务，帮老师们减负”。今后，“老师们可能更多是AI训练师的角色了”。

相似地，吴悦也在AI领域看到了质变的希望。他创办的AI公司深耕金融、运营商、政务的垂直领域，基于深度学习向企业提供对话机器人的服务。“接下来我们要把已有的行业、已知的场景从深度学习升级到大模型。”

他希望，升级后的AI不仅能智能对话，还能分析数据，“还可以同时完成不同媒介的任务，如语音、数字人……”

在OpenAI官方发布的视频中，GPT-4能够识别随手画的草图为一个关于网站的草图，然后快速生成了这个网站的全部代码并创建网站

ChatGPT惊艳的表现，给予人工智能公司前行和突破的信心。但这些业内负责人同时表示，看待新技术应保持冷静。

科学家张家兴告诉南风窗，ChatGPT的出现揭示了AI几十年发展的一大趋势：工程化。“AI原本是大学和实验室中一些天才科学家做出的创造性工作，现在却变成了OpenAI这种举公司之力几百人合作的项目。”

　　“如何协调这么多算法和工程专家合作训练一个模型，是一个很不容易的管理问题。”

　　CEO吴悦担心的也是工程的部分。

他坦言，训练一个大模型，即使大方向确定，将它落地的过程仍有很多问题待解。

“哪怕我的方法确定，原理确定，但工艺上的打磨要根据不同的任务，训练不同的大模型。如数据源怎么选取；选取完后怎么生成高质量的数据；基于高质量数据，强化学习算法怎么设计……”

　　“这其中会有很多的试验，以及许多工业性的系统有待构建。”吴悦说。

　　郑叔亮也表示，资金在当中不是最关键的。“关键是，怎样在具有商业化前景的领域，尽快把我们的技术变成预想的现实。”

上述匿名的AI行业人士告诉南风窗，虽然GPT模型的技术原理已经对外公开，但在具体操作上，怎样做出类似ChatGPT良好的交互效果，存在很多未知数。

“说白了，就算把操作方法告诉了你，做出来的东西还可能不是同一个玩意。”

　　一众公司都在摸着石头过河。

　　吴悦说，先发优势也很重要。“谁先做出来，进入到商业的闭环、技术的闭环，就能占到先发优势。”

　　押注“摩尔定律”

　　世人在为ChatGPT澎湃。

2月27日，OpenAI公司CEO山姆·奥特曼（Sam Altman）在社交媒体上发言：“新版摩尔定律很快就要来了，宇宙中的智能数量每18个月就会翻一倍。”

这是一段颇具争议的发言。要是这番话放在往日，可能被视为狂人语录。但现在，多的是相信奥特曼的拥趸。

　　广泛用在半导体领域的摩尔定律，在上世纪60年代由英特尔联合创始人摩尔提出。大意是说，随着需求和技术的增强，集成电路可容纳的晶体管数目，每隔18个月便会增加一倍。

增长之余，成本并没有上升。

　　摩尔定律跟随着20世纪末半导体产业的繁荣得到验证。显然，奥特曼想让AI变成下一个革新人类的半导体业。

OpenAI公司CEO山姆·奥特曼

ChatGPT给人工智能业界注入了强心剂，同时将入局者引入大手笔烧钱、大举押注的方向。

　　张家兴告诉南风窗，ChatGPT预示了AI行业模型化发展趋势。

　　“AI模型化在说明，AI的成本从复杂系统构建，变成了大模型训练需要的算力。

ChatGPT千亿模型几百万美元一次的训量成本，就是AI模型化之后的代价。”

　　处在追赶状态的中国公司，只能放手一搏，拼命抓住难得的公众关注。

在张家兴看来，“OpenAI是对GPT系列模型持续探索和打磨了至少3年，才有了如此领先的ChatGPT”。“中国版ChatGPT想追上，要付出很多时间。这个过程，大多数公司能否坚持下来，也是巨大的未知数。”

　　郑叔亮说，中国拥有很好的AI发展环境，受地域、语言文化、政策等保护，也拥有较大的市场体量。

“当下唯一要做的事情还是开放。打破各家之间的竞争壁垒，以开放的姿态拥抱新时代，而不是再次陷入恶性竞争的态势。”

　　百度的文心一言也许不如众人的高期待。但可以肯定的是，这只是开始。

文中配图部分来源于视觉中国，部分来源于网络

　　作者 | 吴大宇

　　编辑 | 向由

　　新媒体编辑 | 吴擎

ChatGPT编程

版权声明： 发表于 2023-04-17。
转载请注明：谁能玩转ChatGPT | 非常AI

地平线：芯片算力并非越大越好，还得比使用效率

4344

上海车展最受关注20款智能车

4339

无人Robotaxi和交警杠上了！双方僵持不下，乘客急得跳脚

4345

特斯拉4680电池产量提高且成本降低，赛博皮卡、小钢炮都将搭载

4334

马云已回国，去了这所学校，还谈了ChatGPT

4336

国产AI跟ChatGPT热侃：话家常、斗智商、互相夸赞

4336

谁能玩转ChatGPT

ChatGPT再革新，它的“野心”终于有所显露

5天吸粉超百万！能写诗编程的ChatGPT，让跨境人玩嗨了

相关文章

站内搜索

相关文章