盘和林:ChatGPT具备上下文语义理解能力和逻辑能力

新闻 2023-03-13
436

封面新闻记者 吴雨佳

五天超过百万用户,两个月获得上亿用户。ChatGPT的火爆肉眼可见,这家企业的创始人包括马斯克和彼得蒂尔等知名大佬,后又背靠微软,从微软获得了数据(比如微软小冰采集的对话数据,比如GitHub的开源代码库)、算力(微软Azure是全球前三云服务供应商)、资本(微软数轮入资,今年还将投资几十亿美元)等方面的全面支持。可以说整个硅谷的资源都被调动起来聚焦到ChatGPT身上。

如何看待近期大热的ChatGPT?2月13日,浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员接受采访时指出,ChatGPT的优势在于,它真的有用。之前很多人将人工智能叫做人工“智障”,因为其他人工智能往往答非所问,或者你要按照人工智能习惯的方式来提问才能得到正确答案,而ChatGPT具备上下文语义理解能力,逻辑能力。如果你问的问题它不懂,它就会向你反问,要你补充问题的信息,最终通过一问一答找到你真正需要的问题答案。

在文本创作,在知识数据搜索,在代码书写等方面,ChatGPT都有优于谷歌等搜索引擎的用户体验,这让AI领域深耕多年的谷歌艳羡不已,也让其他一众聊天机器人黯然失色。而一旦用户数量达到一定规模,通过用户的提问,在线数据将支持ChatGPT的数据训练集进一步丰富。可以说ChatGPT让AI达到了一个奇点,而这个奇点之后有可能是一轮AI领域的“宇宙大爆炸”。

国内也有很多聊天机器人,但相比ChatGPT还有很大差距,大多数国内AI都是一问一答,且有的时候还会误解用户的意思,让人啼笑皆非。国内AI为什么会和美国的ChatGPT拉开差距呢?原因是多方面的:

其一,从技术资本层面,最大的限制来自于算力、算法、数据。算力方面,我国的数据中心多面向软件应用环境,比如游戏服务器外包,真正面向AI的算力非常少,又或者需求不高,而算力本身是非常昂贵的,模型越大,数据越多,数据训练AI所要消耗的费用就越大,一次集中算力训练需要几百万美金的算力,这是国内AI公司不能负担的。

数据方面,国内数据普遍质量不高,一方面是因为数据本身积累上的问题,比如小冰的免费AI对话来积累数据,比如GitHub这样的代码开源网站比较缺乏。另一方面是因为数据管理较为严格,部分数据文本需要审批才可以被人工智能企业使用,减慢了数据价值释放。

算法方面,我国AI开发者有思维惯性,过度依赖于开源内容,对大模型缺乏探索创新。当然,算力、算法、数据的问题有些也是资本问题,没钱导致没办法进行大模型、大数据量的训练,但有些也是管理需要改进的地方。

其二,从管理层面,数据要素流通需要进一步打通,除此之外,我国对AIGC的内容创作也要采取开放包容的态度。AIGC作为技术黑箱,其产出内容往往是不可知的,在输出内容方面要允许AIGC犯错误,让AI企业敢于在技术上突破。

综上,一方面要堆钱,算力、数据、算法都要钱。另一方面要松绑,宽松能够让技术生长速度更快。但短期比较迫切的要做一件事,如果ChatGPT开源,当然皆大欢喜,国产势必跟上,如果ChatGPT不开源,我们是否应该引进ChatGPT,引进ChatGPT理由有两个:一个是看看ChatGPT是否在国内存在合规障碍,属于抛砖引玉,如果ChatGPT可行,国内企业就会模仿,另一个是因为ChatGPT对代码写作和内容创作来说是一种生产力工具,能够提高内容产量。

盘和林表示,中国人工智能近些年的进步是巨大的。当前,全球人工智能发展呈现中美两国引领、主要国家激烈竞争的总体格局。中国人工智能发展成效显著,人工智能创新水平已经进入世界第一梯队,与美国的差距进一步缩小。

而ChatGPT热潮席卷全球的背后,同样给我国一个深刻的思考,人工智能作为未来产业、经济社会发展中一项变革性技术与关键性力量,深刻影响着未来世界竞争格局。于中国而言,在人工智能发展领域并非到了“刀枪入库马放南山”,反而恰恰如中国的一句话俗话说:逆水行舟不进则退,所以,我们在人工智能技术及产业发展上依然任重而道远,须臾松懈不得。

版权声明: 发表于 2023-03-13。
转载请注明:盘和林:ChatGPT具备上下文语义理解能力和逻辑能力 | 非常AI

相关文章