比OpenAI的DALL

作者： 2024年10月29日直播浏览

美东时间10月28日周一，AI模型分析平台Artificial Analysis公布的独立AI模型基准测试显示，一个大众陌生的“神秘”图像生成模型击败了 Midjourney、Black Forest Labs 和 OpenAI 的模型。

这个新模型名为red_panda，在Artificial Analysis的图生文AI模型排行榜上，它比位居第二的模型——Black Forest Labs旗下的 Flux1.1 Pro 高出约 40 个 Elo 点。

Artificial Analysis使用 Elo评级制度比较其测试的各种模型的性能。Elo最初是为衡量国际象棋选手相对技能水平而开发的排名系统。

与AI标准的测评平台Chatbot Arena 类似，Artificial Analysis 也通过众包对模型进行排名。对于评估图像模型，Artificial Analysis 的做法是，随机选择两个模型，对模型提供独特的提示词，然后展示提示词以及模型生成的结果，由用户选择他们认为哪个模型生成的图像能更好地反映提示词的要求。下图为red_panda生成的图像示例。