谁有能力改变 ChatGPT 的命运?看起来仍然是 OpenAI。
在 ChatGPT 成为科技领域的焦点之后,人们不断探讨 AI 的下一阶段发展,多模态成为众多学者关注的焦点。如今,OpenAI 推出了多模态预训练巨型模型 GPT-4,为我们带来了令人瞩目的升级:强大的图像识别能力;文字输入限制提升至 25,000 字;回答准确性显著提高;能生成歌词、创意文本并实现风格变换。OpenAI 工程师在介绍视频中表示:“GPT-4 是全球首款高体验、高能力的先进 AI 系统,我们希望尽快将其推广至广大用户。”
为了彻底改变这个领域,OpenAI 发布了论文(更像是技术报告)、System Card,将 ChatGPT 升级为 GPT-4 版本,并开放了 GPT-4 的 API。此外,微软营销主管在 GPT-4 发布后立即表示:“如果你在过去六周的任何时候使用过新的必应预览版,那么你已经提前体验了 OpenAI 最新模型的强大功能。”没错,微软的新必应已经率先采用了 GPT-4。接下来,让我们共同欣赏这场震撼的发布。
目录
GPT-4:我的 SAT 分数为 710,我也能成为律师
GPT-4 是一款强大的多模态大型模型,能够处理图像和文本输入并生成准确的文本回答。实验结果显示,GPT-4 在各种专业测试和学术基准上的表现与人类相媲美。例如,在模拟律师考试中,GPT-4 的成绩位于考生前 10%,而 GPT-3.5 的成绩则处于倒数 10%。
OpenAI 在 6 个月内通过对抗性测试程序和 ChatGPT 的经验教训,对 GPT-4 进行了持续的迭代优化,使其在真实性和可控性等方面取得了有史以来最好的成果。
过去两年里,OpenAI 重建了整个深度学习技术栈,与 Azure 合作,为其工作负载从零开始设计了一台超级计算机。一年前,OpenAI 首次尝试在训练 GPT-3.5 时使用这台超级计算机,随后发现并修复了一些错误,改进了其理论基础。这些改进使 GPT-4 的训练运行获得了空前的稳定性,使 OpenAI 能够提前准确预测 GPT-4 的训练性能,这也是第一个实现这一成果的大型模型。OpenAI 表示,将继续专注于可靠的扩展,进一步改善方法,以帮助实现更强大的预测性能和未来规划能力,这对安全性至关重要。
OpenAI 通过 ChatGPT 和 API(候补名单)发布了 GPT-4 的文本输入功能。为了实现更广泛的图像输入功能,OpenAI 正在与其他公司展开合作。
OpenAI 还发布了用于自动评估 AI 模型性能的框架 OpenAI Evals,并将其开源。OpenAI 希望这样做能让更多人发现模型中的不足之处,从而帮助 OpenAI 进一步改进模型。
GPT-3.5 和 GPT-4 之间的差别非常细微。当任务复杂度达到一定阈值时,差异就会显现出来 —— GPT-4 比 GPT-3.5 更可靠、更有创意,能够处理更微妙的指令。为了了解这两个模型之间的差异,OpenAI 在各种基准测试和一些为人类设计的模拟考试上进行了实验。
目前,许多机器学习基准测试都是用英语编写的为了初步了解 GPT-4 在其他语言上的能力,研究团队使用 Azure Translate 将 MMLU 基准 —— 一套涵盖 57 个主题的 14000 个多项选择题 —— 翻译成多种语言。在 26 种测试语言中的 24 种上,GPT-4 的表现优于 GPT-3.5 和其他大型语言模型(如 Chinchilla、PaLM)的英语性能。
与许多使用 ChatGPT 的公司一样,OpenAI 表示他们内部也在使用 GPT-4,因此 OpenAI 同时关注大型语言模型在内容生成、销售和编程等方面的应用效果。OpenAI 还利用 GPT-4 协助人们评估 AI 输出,这是 OpenAI 策略的第二阶段。OpenAI 不仅是 GPT-4 的开发者,同时也是其用户。
总之,GPT-4 是一款强大的多模态大型模型,在多种专业测试和学术基准上的表现与人类水平相当。OpenAI 通过不断地迭代优化和改进,使其在真实性、可控性等方面取得了前所未有的成果。GPT-4 在多种语言上的性能表现也十分出色,为未来 AI 发展奠定了坚实的基础。
GPT-4:我擅长处理梗图
GPT-4 能够处理文本和图像输入,这一新功能与纯文本处理相辅相成,使用户可以处理各种视觉或语言任务。
具体来说,当人们提供由散乱文本和图像组成的输入时,GPT-4 能生成相应的文本输出(如自然语言、代码等)。在许多领域,例如包含文本和照片的文档、图表或屏幕截图,GPT-4 展示出与纯文本输入相当的能力。此外,它还可以通过在纯文本语言模型上开发的测试时间技术(如少样本和思维链提示)进行增强。
风险与缓解策略
OpenAI 表示,研究团队一直致力于对 GPT-4 进行迭代,使其从训练开始就具备更高的安全性和一致性。相关工作包括预训练数据的筛选和过滤、评估和专家参与、模型安全改进以及监测和执行。
GPT-4 面临着与之前模型类似的风险,如生成有害建议、错误代码或不准确信息。同时,GPT-4 的额外能力带来了新的风险。为了了解这些风险的程度,团队聘请了 50 多位来自 AI 对齐风险、网络安全、生物风险、信任与安全以及国际安全等领域的专家,对模型在高风险领域的行为进行对抗性测试。这些领域需要专业知识进行评估,专家的反馈和数据为缓解策略和模型改进提供了依据。
ChatGPT 直接升级至 GPT-4 版
GPT-4 发布后,OpenAI 直接升级了 ChatGPT。ChatGPT Plus 订阅者可以在 chat.openai.com 上获得具有使用上限的 GPT-4 访问权限。
要访问 GPT-4 API(它使用与 gpt-3.5-turbo 相同的 ChatCompletions API),用户可以注册等待。OpenAI 会邀请部分开发者体验。
爱喳猫AiChat小程序 :全球同步最新ChatGPT