SimpleQA 宣布开源 OpenAI 新基准 专治大模型 胡言乱语

IT之家 10 月 31 日消息,当地时间 30 日,OpenAI 宣布,为了衡量语言模型的准确性,将开源一个名为 SimpleQA 的新基准,可衡量语言模型回答简短的事实寻求(fact-seeking)问题的能力。

OpenAI 表示,目标是使用 SimpleQA 创建一个具备以下特点的数据集:

SimpleQA 将是一个 简单但具有挑战性 的基准,用于评估前沿模型的事实准确性。SimpleQA 的主要限制在于其范围 —— 尽管 SimpleQA 准确,但它只在短查询的受限设置中测量事实准确性,这些查询是事实导向的,并且有一个可验证的答案。

OpenAI 表示,模型在短回答中表现出的事实性是否与其 在长篇、多事实内容中的表现 相关,这仍是个 悬而未决 的研究课题。其希望 SimpleQA 的开源能够进一步推动 AI 研究的发展,使模型更加可信并富有可靠性。

IT之家附有关地址:

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://srwj168.com.cn/keji312/29641.html
宁波兄弟净赚90亿 电池边角料卖到全球
专为年轻人打造!荣耀GT系列官宣 首款产品年底发布