模型跳票 OpenAI凌晨大新闻把网友整懵了奥特曼草莓

作者： 2024年08月09日消费浏览

机器之心报道

编辑：泽南、杜伟

昨晚，很多人彻夜未眠，都在等待 OpenAI 的「大新闻」。

因为在本周三，OpenAI 创始人、CEO 山姆・奥特曼突然在 X 上发了一张照片。

奥特曼虽然偶尔会发一些心灵鸡汤，但大多数的推文都是在宣传公司的产品，人们看法很快达成了一致——此中必有深意。

有人展开解读：四个红草莓，其中还有一个未成熟的青色草莓，这不妥妥地是在说下一代 AI 大模型 GPT-5 要来了吗？

奥特曼在回应网友时也在暗示，惊喜马上就来。

这激起了人们的好奇心，预测 GPT-5 发布的时间从草莓成熟所需要的 4 到 6 个星期，很快发展到了就在明天。

那就不用等了。今天凌晨，答案揭晓了。

OpenAI 发布了基于最新一代大模型 GPT-4o 的全面安全评估。

新发布的 GPT-4o System Card 是一份研究文件，概述了 OpenAI 在发布最新模型之前采取的安全措施和风险评估。

GPT-4o 于今年 5 月公开发布。在首次亮相之前，OpenAI 使用了一组外部红队或试图寻找系统弱点的安全专家来查找模型中的关键风险。

在如今的大模型领域，这是一种相当标准的做法。新的安全测试将更多的精力集中在 GPT-4o 的音频功能上，OpenAI 检查了一系列风险，例如 GPT-4o 可能会创建未经授权的某人声音克隆、色情和暴力内容或复制的受版权保护的音频片段（比如一段流行音乐）。如今结果的发布似乎意味着语音功能即将全面上线。

值得关注的是，根据 OpenAI 自己制定的框架，研究人员认为 GPT-4o 新增的语音对话能力在整体上并不会显著增加风险，但个在别领域上具有「中等」风险。

具体来说，总体风险水平取自四个总体类别中的最高风险评级：网络安全、生物威胁、说服力和模型自主性。除了说服力之外，所有这些都被认为风险较低，研究人员发现 GPT-4o 的一些写作样本可能比人类书写的文本更能左右读者的观点 —— 尽管该模型的样本总体上并不更有说服力。

GPT-4o 是 OpenAI 推出的最新一代自回归全向模型，它接受文本、音频、图像和视频的任意组合作为输入，并生成文本、音频和图像的任意组合的输出。它在文本、视觉和音频方面进行端到端训练，这意味着所有输入和输出都由同一个神经网络处理。

OpenAI 表示，GPT-4o 可以在短短 232 毫秒内响应音频输入，平均反应时间为 320 毫秒，与人类对话中的响应时间相似。它在英文和代码文本上的表现与 GPT-4 Turbo 相当，在非英语语言文本上的表现有显著提升，同时 API 速度也更快、价格便宜 50%。与现有模型相比，GPT-4o 在视觉和音频理解方面尤其出色。

OpenAI 发言人 Lindsay McCallum Rémy 表示，System Card 包括由内部团队创建的准备情况评估，以及 OpenAI 网站上列出的外部测试人员，即模型评估与威胁研究 (METR) 和 Apollo Research，这两家公司都在为 AI 系统建立评估。

评估方式。

这不是 OpenAI 发布的第一个 System Card。此前，GPT-4、具有视觉能力的 GPT-4 和 DALL-E 3 也经过了类似的测试，研究结果也已发布。但 OpenAI 此次发布新版本 dSystem Card，可能是由于一直以来自身在安全方面被批评做出的应对。

许多人呼吁 OpenAI 需要更加透明，不仅应该公开模型、训练数据（如是否使用 YouTube 视频训练），还包括其安全测试的过程。在 OpenAI 和许多领先的人工智能实验室所在的加州，州参议员正希望通过一项法案来规范大型语言模型，其中包括限制公司如果其人工智能被用于有害方式，将承担法律责任。但 GPT-4o System Card 带给外界的最大信息是，尽管有一群外部 Red Team 成员和测试人员，但其中很多都依赖于 OpenAI 自己来评估自己。

与此同时，OpenAI 也宣布任命卡耐基梅隆大学（CMU）机器学习系教授兼主任 Zico Kolter 为公司董事会成员。Zico 的工作主要集中在人工智能安全性、一致性和机器学习分类器的稳健性上，专业知识涵盖新型深度网络架构、数据理解对模型影响的创新方法，以及评估 AI 模型稳健性的自动化方法。

果然网友们纷纷表示「不满意」。有人发问，你要发的「草莓」（可能的下一代大模型）呢？PS：果然没有草莓。