全球最强GPU芯片已量产 老黄继续打破摩尔定律 下一代Rubin曝光

机器之心报道

机器之心编辑部

昨晚,英伟达创始人、CEO 黄仁勋在 2024 年 COMPUTEX 科技大会上又为全球发烧友们、显卡买家们带来了一场重磅演讲。

经典皮肤(皮衣)老黄亮相。

在会上,黄仁勋分享了有关 AI 芯片及架构、加速计算、AI 理解物理世界、机器人的成果和洞见。

量产版 Blackwell 亮相

下一代 AI 平台 Rubin 两年后到来

今年 3 月,英伟达在其一年一度的 GTC 大会上官宣了 2080 亿晶体管的 Blackwell 芯片。它是英伟达首个采用 MCM(多芯片封装)设计的 GPU,在同一个芯片上集成了两个 GPU。

近三个月过去了,Blackwell 芯片发展到了哪一步了?

老黄现场果然没让人失望,拿出了最新量产版的 Blackwell。他表示,这款当今世界上最强大的 GPU 已经投入了生产。

黄仁勋称,短短八年时间,英伟达使得 AI 算力从 2016 年 Pascal 的 19 TFLOPS 提升到了 2024 年 Blackwell 的 20000 TFLOPS,整整提升了 1000 倍。这一速度几乎超越了摩尔定律在最佳时期的增长。

AI 算力提升的同时,成本也在逐年下降。

黄仁勋以训练 GPT-4(1.8 万亿参数)为例,八年时间,该模型的能耗从 2016 年的 1000+GWh 下降到了如今的 3GWh,下降了 350 倍。这里他甚至还为 token 定了一个中文译名 —— 词元。

集成了 Blackwell 芯片的最新 DGX 超算系统在各方面都实现了质的提升。

与上一代 Hopper 系统相比,Blackwell 系统的 NVLink 域集成 72 个 GPU、性能提升了 9 倍,NVLink 带宽增加了 18 倍,AI 算力提升了 45 倍,供能提高了 10 倍。

此外,黄仁勋还公开了 Blackwell 后三代芯片路线图,即 Blackwell Ultra(2025 年)、Rubin(2026 年)和 Rubin Ultra(2027 年)。这也是下一代 AI 平台 Rubin 首次亮相。

黄仁勋表示,英伟达将保持一年一次的更新节奏,确保所有产品实现 100% 架构兼容。不过,他并没有透露关于 Rubin 的更多细节。

可以看到,英伟达推出全新 GPU 的速度始终跑在了其他公司的前头。有人对此表示,由于缺少强有力的竞争对手,现在英伟达只能与摩尔定律展开竞争了。

图源:X@Sentdex

当然,英伟达这些年的成功在其股票市值上得到了很好地体现。最近几天的市值一度达到了 2.8 万亿美元,与市值第一的苹果之间的差距越来越小。

游戏助手 Project G-Assist

Project G-Assist 是一个由 RTX 驱动的 AI 助手,为 PC 游戏和应用提供上下文感知的帮助。

一般来讲,PC 游戏拥有广阔的世界和复杂的机制,即使是高级玩家也会感到挑战。Project G-Assist 旨在让玩家能够方便地获取游戏和系统方面的知识。

Project G-Assist 可以接收玩家的语音或文本输入,同时还可以获取游戏窗口中的快照。这些快照被输入到 AI 视觉模型中, 从而提供上下文感知和特定于应用程序的理解。之后 LLM 输出一个富有洞察力和个性化的响应 —— 要么是文本,要么是 AI 语音。

为了展示 Project G-Assist 的潜力,英伟达还和 Studio Wildcard 展开合作,上新了一系列展示:例如通过按下快捷键或使用唤醒短语,AI 助手可以帮助玩家解答问题。

AI 助手还能建议玩家是否应该避开游戏中的恐龙,或者提供建议来驯服特定的野兽。

此外,Project G-Assist 在性能调优方面也非常有用。

通过一个简单的提示,Project G-Assist 可以评估玩家的系统配置和性能,并立即调整以获得最佳体验。

通过一个简单的提示,Project G-Assist 可以评估您的系统配置和性能,并立即进行调整以获得最佳体验。

AI 助手还能够跟踪并绘制帧率、功率使用、PC 延迟以及其他硬件统计数据的图表,并在被提示时提出改善这些指标的方法。

NVIDIA NIM 彻底改变了模型部署方式

现在,全球 2800 万开发者都可以借助 NVIDIA NIM 轻松地创建生成式 AI 应用。NIM 是一种推理微服务,通过以经过优化的容器的形式提供模型,以部署在云、数据中心或工作站上。

NIM 还能帮助企业实现基础设施投资的效果最大化。例如,与未使用 NIM 的情况相比,在 NIM 中运行 Meta Llama 3-8B 所能生成的加速基础设施 AI token 可以提升 3 倍。

Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近 200 家技术合作伙伴正将 NIM 集成到他们的平台中,加快生成式 AI 部署到特定领域应用中的速度,例如 copilots、代码助手、数字人虚拟形象等。从 Meta Llama 3 开始,在 Hugging Face 上现已开始提供 NIM。

NVIDIA 机器人技术

NVIDIA 正在引领价值 50 万亿美元的工业数字化变革,其通过开发者计划提供对 NIM 的访问权限,以促进 AI 创新。

黄仁勋展示了 Foxconn 如何利用 NVIDIA Omniverse、Isaac 和 Metropolis 创建数字孪生,通过结合视觉 AI 与机器人开发工具来实现增强的机器人设施。

NVIDIA Isaac 平台为开发者构建 AI 机器人提供强大的套件,包括由 AI 模型以及 Jetson Orin、Thor 等超级计算机驱动的 AMR、工业机械臂和人形机器人。

「机器人和物理 AI 正在成为现实,而不仅是出现在科幻小说。这真的令人兴奋,」黄仁勋补充道。

全球电子行业领导企业正在将 NVIDIA 自主机器人技术集成到他们的工厂中,利用 Omniverse 中的模拟功能来测试和验证物理世界的新一代 AI。全球 500 多万台预编程机器人也在此行列中。

「机器人将遍布所有工厂。工厂将实现对机器人的统筹,而这些机器人将制造新的机器人产品,」黄仁勋解释道。


GTX11系列显卡什么时候发布?

今天刚发布的消息。 8月20日上午11点30分在库比蒂诺,Stuart Oberman将介绍NVIDIA的下一代主流的GPU图形芯片。 从HotChips大会的惯例来看,大家介绍的都会是已经在市面上公布的产品,这证明,新的GPU会在8月20日之前就亮相。

酷睿i系列处理器介绍以及如何选择

新酷睿处理器从发布到现在也有很长一段时间了,几乎市面上所有的主流笔记本都能见到它。 “32nm”,“超线程技术”,“智能处理器”和“睿频加速”等词语也开始被大家所接受。 我们将在后面为大家详细解剖这些术语,为大家理性选择合适的处理器作参考。 首先还是要介绍下新酷睿家族的身份。 我们以酷睿i5-450M举例说明:“i”是酷睿处理器的标志,“5”是主流级别处理器,相对应的“7”和“3”分别对应高端和入门级别。 数字450代表处理器的详细规格,同型号处理器,数字越大说明越高端。 字母“M”代表移动版CPU,如果前面出现了“Q”、“L”和“U”,则分别代表着“四核处理器”、“低电压处理器”和“超低电压处理器”。 下面我们来为大家详解一下上面提到的一些术语。 1、“32nm技术”:我们都知道在PC业界英特尔大名鼎鼎的“摩尔定律”:其实这得益于英特尔大名鼎鼎的“摩尔定律”:简单地说就是集成电路芯片上所集成的晶体管的数目,每隔18个月就翻一番;微处理器的性能每隔18个月就提高一倍,而价格下降一半。 由此可以推测,到了未来笔记本处理器的制程更加先进:到了2011年底,采用22纳米制造工艺的处理器开始量产。 也许AMD和Intel的竞争会加速摩尔定律的失效 新酷睿i犀利处理器家族均采用了业界最强的英特尔32nm Nehalem微架构,新一代32nm高K制造工艺让芯片可以做的更小,新技术的采用在减小芯片体积的同时带来了极低的能量损耗,这使得核心的发热量大为减少。 而这种技术就也同时催生了一个新技术,即“一颗芯片,两颗核心”――集成显示核心单元(GPU)被封装在处理器(CPU)?取J?据传输速度获得大幅度提升。 i5的“双U同芯”,令人羡慕可惜笔者的电脑没有这种芯 2、“睿频加速技术”:我们经常会在各种导购行情中看到某某处理器,可通过睿频加速技术到多少GHz,指的就是支持“睿频加速(Turbo Boost)技术”的处理器。 它是指在CPU中都加入睿频加速,使得CPU的主频可以在某一范围内根据处理数据需要自动调整主频。 它是基于Nehalem架构的电源管理技术,通过分析当前CPU的负载情况,智能地完全关闭一些用不上的核心,把能源留给正在使用的核心,并使它们运行在更高的频率,进一步提升性能;相反,需要多个核心时,动态开启相应的核心,智能调整频率。 睿频加速非常的灵活和强大 Turbo Mode功能是一项可以充分使用处理器工作效率的技术。 它能让内核运行动态加速。 可以根据需要开启、关闭以及加速单个或多个内核的运行。 如在一个四核的Nehalem处理器中,如果一个任务是单线程的,则可以关闭另外三个内核的运行,同时把工作的那个内核的运行主频提高,这样动态的调整可以提高系统和CPU整体的能效比率。 3、“超线程技术”:是利用特殊的硬件指令,把两个逻辑内核模拟成两个物理芯片,让单个处理器都能使用线程级并行计算,进而兼容多线程操作系统和软件,减少了CPU的闲置时间并提高的CPU的运行效率的技术。 新酷睿双核处理器均拥有2个物理线程和两个逻辑线程,需要说明的是超线程不是双核变四核,当两个线程都同时需要某一个资源时,其中一个要暂时停止并让出资源,直到这些资源闲置后才能继续被使用,因此应用超线程技术的双核处理器不等于四核处理器,在这一点上经常会有消费者误会。 超线程技术之前就出现了,但同时拥有睿频加速技术和超线程技术还是头一次。 超线程技术的直观表现 经过详细的解剖分析,我们已经能够对酷睿i系列家族成员有了一个更为清晰的认识。 让我们来看看他们分别适合什么样的人群吧。

摩尔定律是否会或已经被打破?未来计算机硬件的性能提升主要会靠怎样的方式实现?

摩尔定律到目前为止还没有打破,未来计算机性能主要靠构架实现,还有云计算。

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://srwj168.com.cn/keji312/19619.html
米兰已抵达梅州确认第二次执教 粤媒 玉昆也曾接触过他
亲妈逼我嫁给一个中年人 高考当天我死在了考场 高考前一个月