盘和林：ChatGPT具备上下文语义理解能力和逻辑能力

新闻 2023-03-13

436 0

封面新闻记者吴雨佳

五天超过百万用户，两个月获得上亿用户。ChatGPT的火爆肉眼可见，这家企业的创始人包括马斯克和彼得蒂尔等知名大佬，后又背靠微软，从微软获得了数据（比如微软小冰采集的对话数据，比如GitHub的开源代码库）、算力（微软Azure是全球前三云服务供应商）、资本（微软数轮入资，今年还将投资几十亿美元）等方面的全面支持。可以说整个硅谷的资源都被调动起来聚焦到ChatGPT身上。

如何看待近期大热的ChatGPT？2月13日，浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员接受采访时指出，ChatGPT的优势在于，它真的有用。之前很多人将人工智能叫做人工“智障”，因为其他人工智能往往答非所问，或者你要按照人工智能习惯的方式来提问才能得到正确答案，而ChatGPT具备上下文语义理解能力，逻辑能力。如果你问的问题它不懂，它就会向你反问，要你补充问题的信息，最终通过一问一答找到你真正需要的问题答案。

在文本创作，在知识数据搜索，在代码书写等方面，ChatGPT都有优于谷歌等搜索引擎的用户体验，这让AI领域深耕多年的谷歌艳羡不已，也让其他一众聊天机器人黯然失色。而一旦用户数量达到一定规模，通过用户的提问，在线数据将支持ChatGPT的数据训练集进一步丰富。可以说ChatGPT让AI达到了一个奇点，而这个奇点之后有可能是一轮AI领域的“宇宙大爆炸”。

国内也有很多聊天机器人，但相比ChatGPT还有很大差距，大多数国内AI都是一问一答，且有的时候还会误解用户的意思，让人啼笑皆非。国内AI为什么会和美国的ChatGPT拉开差距呢？原因是多方面的：

其一，从技术资本层面，最大的限制来自于算力、算法、数据。算力方面，我国的数据中心多面向软件应用环境，比如游戏服务器外包，真正面向AI的算力非常少，又或者需求不高，而算力本身是非常昂贵的，模型越大，数据越多，数据训练AI所要消耗的费用就越大，一次集中算力训练需要几百万美金的算力，这是国内AI公司不能负担的。

数据方面，国内数据普遍质量不高，一方面是因为数据本身积累上的问题，比如小冰的免费AI对话来积累数据，比如GitHub这样的代码开源网站比较缺乏。另一方面是因为数据管理较为严格，部分数据文本需要审批才可以被人工智能企业使用，减慢了数据价值释放。

算法方面，我国AI开发者有思维惯性，过度依赖于开源内容，对大模型缺乏探索创新。当然，算力、算法、数据的问题有些也是资本问题，没钱导致没办法进行大模型、大数据量的训练，但有些也是管理需要改进的地方。

其二，从管理层面，数据要素流通需要进一步打通，除此之外，我国对AIGC的内容创作也要采取开放包容的态度。AIGC作为技术黑箱，其产出内容往往是不可知的，在输出内容方面要允许AIGC犯错误，让AI企业敢于在技术上突破。

综上，一方面要堆钱，算力、数据、算法都要钱。另一方面要松绑，宽松能够让技术生长速度更快。但短期比较迫切的要做一件事，如果ChatGPT开源，当然皆大欢喜，国产势必跟上，如果ChatGPT不开源，我们是否应该引进ChatGPT，引进ChatGPT理由有两个：一个是看看ChatGPT是否在国内存在合规障碍，属于抛砖引玉，如果ChatGPT可行，国内企业就会模仿，另一个是因为ChatGPT对代码写作和内容创作来说是一种生产力工具，能够提高内容产量。

盘和林表示，中国人工智能近些年的进步是巨大的。当前，全球人工智能发展呈现中美两国引领、主要国家激烈竞争的总体格局。中国人工智能发展成效显著，人工智能创新水平已经进入世界第一梯队，与美国的差距进一步缩小。

而ChatGPT热潮席卷全球的背后，同样给我国一个深刻的思考，人工智能作为未来产业、经济社会发展中一项变革性技术与关键性力量，深刻影响着未来世界竞争格局。于中国而言，在人工智能发展领域并非到了“刀枪入库马放南山”，反而恰恰如中国的一句话俗话说：逆水行舟不进则退，所以，我们在人工智能技术及产业发展上依然任重而道远，须臾松懈不得。

ChatGPT办公