ChatGPT4.0正式发布：谁能革ChatGPT 的命？直接升级！

新闻 2023-03-16

434 0

谁有能力改变 ChatGPT 的命运？看起来仍然是 OpenAI。

在 ChatGPT 成为科技领域的焦点之后，人们不断探讨 AI 的下一阶段发展，多模态成为众多学者关注的焦点。如今，OpenAI 推出了多模态预训练巨型模型 GPT-4，为我们带来了令人瞩目的升级：强大的图像识别能力；文字输入限制提升至 25,000 字；回答准确性显著提高；能生成歌词、创意文本并实现风格变换。OpenAI 工程师在介绍视频中表示：“GPT-4 是全球首款高体验、高能力的先进 AI 系统，我们希望尽快将其推广至广大用户。”

为了彻底改变这个领域，OpenAI 发布了论文（更像是技术报告）、System Card，将 ChatGPT 升级为 GPT-4 版本，并开放了 GPT-4 的 API。此外，微软营销主管在 GPT-4 发布后立即表示：“如果你在过去六周的任何时候使用过新的必应预览版，那么你已经提前体验了 OpenAI 最新模型的强大功能。”没错，微软的新必应已经率先采用了 GPT-4。接下来，让我们共同欣赏这场震撼的发布。

GPT-4：我的 SAT 分数为 710，我也能成为律师

GPT-4 是一款强大的多模态大型模型，能够处理图像和文本输入并生成准确的文本回答。实验结果显示，GPT-4 在各种专业测试和学术基准上的表现与人类相媲美。例如，在模拟律师考试中，GPT-4 的成绩位于考生前 10%，而 GPT-3.5 的成绩则处于倒数 10%。

OpenAI 在 6 个月内通过对抗性测试程序和 ChatGPT 的经验教训，对 GPT-4 进行了持续的迭代优化，使其在真实性和可控性等方面取得了有史以来最好的成果。

过去两年里，OpenAI 重建了整个深度学习技术栈，与 Azure 合作，为其工作负载从零开始设计了一台超级计算机。一年前，OpenAI 首次尝试在训练 GPT-3.5 时使用这台超级计算机，随后发现并修复了一些错误，改进了其理论基础。这些改进使 GPT-4 的训练运行获得了空前的稳定性，使 OpenAI 能够提前准确预测 GPT-4 的训练性能，这也是第一个实现这一成果的大型模型。OpenAI 表示，将继续专注于可靠的扩展，进一步改善方法，以帮助实现更强大的预测性能和未来规划能力，这对安全性至关重要。

OpenAI 通过 ChatGPT 和 API（候补名单）发布了 GPT-4 的文本输入功能。为了实现更广泛的图像输入功能，OpenAI 正在与其他公司展开合作。

OpenAI 还发布了用于自动评估 AI 模型性能的框架 OpenAI Evals，并将其开源。OpenAI 希望这样做能让更多人发现模型中的不足之处，从而帮助 OpenAI 进一步改进模型。

GPT-3.5 和 GPT-4 之间的差别非常细微。当任务复杂度达到一定阈值时，差异就会显现出来 —— GPT-4 比 GPT-3.5 更可靠、更有创意，能够处理更微妙的指令。为了了解这两个模型之间的差异，OpenAI 在各种基准测试和一些为人类设计的模拟考试上进行了实验。

目前，许多机器学习基准测试都是用英语编写的为了初步了解 GPT-4 在其他语言上的能力，研究团队使用 Azure Translate 将 MMLU 基准 —— 一套涵盖 57 个主题的 14000 个多项选择题 —— 翻译成多种语言。在 26 种测试语言中的 24 种上，GPT-4 的表现优于 GPT-3.5 和其他大型语言模型（如 Chinchilla、PaLM）的英语性能。

与许多使用 ChatGPT 的公司一样，OpenAI 表示他们内部也在使用 GPT-4，因此 OpenAI 同时关注大型语言模型在内容生成、销售和编程等方面的应用效果。OpenAI 还利用 GPT-4 协助人们评估 AI 输出，这是 OpenAI 策略的第二阶段。OpenAI 不仅是 GPT-4 的开发者，同时也是其用户。

总之，GPT-4 是一款强大的多模态大型模型，在多种专业测试和学术基准上的表现与人类水平相当。OpenAI 通过不断地迭代优化和改进，使其在真实性、可控性等方面取得了前所未有的成果。GPT-4 在多种语言上的性能表现也十分出色，为未来 AI 发展奠定了坚实的基础。

GPT-4：我擅长处理梗图

GPT-4 能够处理文本和图像输入，这一新功能与纯文本处理相辅相成，使用户可以处理各种视觉或语言任务。

具体来说，当人们提供由散乱文本和图像组成的输入时，GPT-4 能生成相应的文本输出（如自然语言、代码等）。在许多领域，例如包含文本和照片的文档、图表或屏幕截图，GPT-4 展示出与纯文本输入相当的能力。此外，它还可以通过在纯文本语言模型上开发的测试时间技术（如少样本和思维链提示）进行增强。

风险与缓解策略

OpenAI 表示，研究团队一直致力于对 GPT-4 进行迭代，使其从训练开始就具备更高的安全性和一致性。相关工作包括预训练数据的筛选和过滤、评估和专家参与、模型安全改进以及监测和执行。

GPT-4 面临着与之前模型类似的风险，如生成有害建议、错误代码或不准确信息。同时，GPT-4 的额外能力带来了新的风险。为了了解这些风险的程度，团队聘请了 50 多位来自 AI 对齐风险、网络安全、生物风险、信任与安全以及国际安全等领域的专家，对模型在高风险领域的行为进行对抗性测试。这些领域需要专业知识进行评估，专家的反馈和数据为缓解策略和模型改进提供了依据。