加速一切！黄仁勋 2026年将推出下一代AI平台Rubin Blackwell现在投产

作者： 2024年06月03日科技浏览

6月2日周日，英伟达CEO黄仁勋在COMPUTEX技术大会前夕发表重磅讲话。COMPUTEX台北国际电脑展即将在中国台湾举行。英伟达是人工智能浪潮的主要受益者，伴随着投资者的疯狂追捧，其已成为全球市值最高的芯片制造商，一举一动备受市场关注。

先来一个花絮：老黄逛台北夜市，受到明星般追捧，网友们感叹：这是科技CEO的时代啊！

黄仁勋周日洋洋洒洒讲了许多， 如果用一句话来总结他最新的讲话，英伟达官网文章给出了最简洁有力的概括：加速一切。

黄仁勋表最新表示，英伟达计划每年升级其AI加速器，并宣布将于2025年推出Blackwell Ultra芯片，以及计划在2026年推出一个名为Rubin的下一代平台。英伟达还推出了新的工具和软件模型。

英伟达将生成式人工智能AI的兴起视为一场新的工业革命。 黄仁勋表示：

对于黄仁勋所说的创新，网友们更直白：别人就没在创新。

黄仁勋在演讲中表示， 期望AI这项技术向个人电脑转向的过程中，英伟达可以发挥重要作用。 当前，英伟达希望扩大其客户群，不再局限于少数云计算巨头。此前英伟达的收入大部分来自这些云计算巨头。作为扩张客户群的一部分，黄仁勋预计更多的各行各业的公司、外加政府机构，将采用AI。

黄仁勋强调英伟达的降本能力

黄仁勋表示：“我们正在看到计算膨胀。”随着需要处理的数据量呈指数级增长，传统的计算方法无法跟上，只有通过英伟达的加速计算方式才能降低成本：

黄仁勋强调英伟达的降本能力——英伟达正在降低将数据转化为智能的成本。“加速计算是可持续计算。”他阐释了GPU和CPU的组合如何实现最高可达100倍的加速，同时仅将功耗提高三倍，每瓦性能比单独使用CPU高出25倍。“买的越多，省的越多。”

黄仁勋声称，使用英伟达的技术可以节省98%的成本、减少97%的能耗，并称这是“CEO数学”，虽然不精确，但却是正确的。

英伟达降本能力太强大，粉丝反问，给我一个客户们突然不再想要这些芯片的理由：

Blackwell芯片现在投产

黄仁勋表示，英伟达的加速平台正在全面投产，无论是通过配备众多英伟达RTX功能的AI个人电脑和消费者设备，还是通过使用英伟达全套计算平台构建和部署AI工厂的企业。 英伟达的Blackwell芯片现在投产。

对于Blackwell芯片，黄仁勋说，“即使是摩尔定律在其最佳时期，Blackwell所能实现的计算量与之相比，也是令人难以置信的。每当我们提高计算强度时，成本就会降低。我们所做的是，通过Blackwell卓越的计算能力，训练一个具有2万亿参数和8万亿tokens的GPT-4模型的能耗，能耗降低至1/350。”

对此，网友表示，英伟达没有强大的竞争对手，只能跟摩尔定律相互PK了，无敌是多么的寂寞：

一年的节奏

黄仁勋介绍了关于芯片产品年度升级周期的计划，表示英伟达打算每年都升级AI加速器/AI芯片。他重申此前提到的一年的节奏，“我们公司有一个一年的节奏。我们的基本理念非常简单：按照一年的节奏构建整个数据中心规模，将其分解并以零部件的形式销售给您，并将一切推向技术的极限。”

黄仁勋公布了包括Blackwell Ultra和后续芯片的计划：

黄仁勋透露，Rubin平台将具备全新的GPU、一款新的基于Arm架构的CPU，以及配备NVLink 6、CX9 SuperNIC和X1600融合InfiniBand/以太网交换机等先进网络。黄仁勋没有提供更多关于即将推出的产品的详细规格。

行业携手英伟达，打造AI工厂

英伟达最初是通过销售台式电脑游戏卡起家的，这一背景在电脑制造商们推崇更多AI功能时派上了用场。微软公司及其硬件合作伙伴正在利用Computex大会展示带有AI增强功能的新款笔记本电脑，品牌名为Copilot+。这些即将上市的大多数设备都基于英伟达的竞争对手高通公司提供的一种新型处理器，这种处理器可使它们在一次充电后使用更长时间。

虽然这些设备可以应对简单的AI功能，但添加英伟达的显卡将大大提高它们的性能，并为像游戏这样的热门软件带来新功能。英伟达表示，像华硕电脑这样的PC制造商正在提供这种电脑。

英伟达联合全球范围内多家顶级电脑制造商发布了一个以英伟达Blackwell架构支撑的系统“列阵”，配置Grace CPUs、NVIDIA网络设备和基建，以支持企业打造AI工厂和数据中心，从而推动下一波生成式人工智能突破。

据黄仁勋介绍，华硕、技嘉、超微电脑、ASRock Rack、Ingrasys、Inventec、Pegatron、QCT、Wistron以及Wiwynn等公司，它们提供云计算、赋能以及边缘人工智能系统，这些产品将搭载英伟达的GPU和网络配件。黄仁勋直言：“下一次工业革命已经拉开了序幕。”

为了帮助软件开发商为PC带来更多新功能，英伟达还在提供工具和预训练的AI模型：它们将处理复杂的任务，比如决定是在机器本身上处理数据还是通过互联网将其发送到数据中心。

MGX平台新设计

英伟达还发布了基于其芯片的服务器计算机的新设计。英伟达的MGX模块化参考设计平台现在支持Blackwell，包括为大型语言模型推理、检索增强生成（RAG）和数据处理设计的GB200 NVL2平台。

任何服务器系统构建者都可以使用这些参考设计来节省开发时间，同时确保设计和性能的一致性。惠普和戴尔等公司正在使用英伟达的MGX平台，以便更快地将企业和政府机构使用的产品推向市场。

甚至连英伟达的竞争对手AMD和英特尔也在利用MGX，将他们的处理器与英伟达的芯片放在一起使用。AMD和英特尔也支持MGX平台，并计划首次推出他们自己的CPU主机处理器模块设计。

下一代网络Spectrum-X

英伟达早前宣布的产品，如用于网络的Spectrum X，现在已经普遍可用并被广泛采用。黄仁勋公布了每年发布Spectrum-X产品的计划，以满足人工智能对高性能以太网网络的需求。

英伟达的Spectrum-X是首款为人工智能AI构建的以太网结构，与传统以太网结构相比，其网络性能提高了1.6倍。它加速了AI工作负载的处理、分析和执行，进而加速了人工智能解决方案的开发和部署。Spectrum-X到2026年或可扩展到数百万GPU。

CoreWeave、GMO Internet Group、Lambda、Scaleway、STPX Global和Yotta是首批采用Spectrum-X的人工智能云服务提供商，旨在为其人工智能基础设施带来极致的网络性能。

分析称，英伟达的Spectrum产品线是其以太网方案的主力产品，特别受到公司高层的重视。 据预测，Spectrum产品线可能在当年达到数十亿美元的收入规模。英伟达采取“先InfiniBand再以太网”的商业策略，GPU推出时优先推广利润较高的InfiniBand交换机，随后推广以太网产品。

英伟达的NIM

英伟达的推理微服务（简称NIM，黄仁勋称其为“盒子里的人工智能”）也有进一步的亮相。这些微服务是一组中间软件和模型，可以帮助公司更快地推出AI服务，而无需担心底层技术。英伟达表示将免费提供NIM产品的访问权限，部署这些服务的公司随后需要向英伟达支付使用费。

借助英伟达的NIM，全球2800万开发者现在可以轻松创建生成式AI应用程序。

NIM还可以使企业能够最大化其基础设施投资。例如，在NIM中运行Meta Llama 3-8B，在加速基础设施上生成的AI tokens数量比不使用NIM时最高多3倍。英伟达的近200家技术合作伙伴，包括Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI和Synopsys，正在将NIM集成到他们的平台中，以加速特定领域应用的生成式AI部署，如copilots、代码助手、数字人类化身等。

Hugging Face现在也开始提供NIM，首先推出的是Meta Llama 3。黄仁勋表示，“今天我们刚刚在Hugging Face上发布了完全优化的Llama 3，你可以在那里试用。你甚至可以将它带走。所以你可以在云端运行，在任何云端运行，下载它，放到你自己的数据中心，并可以为你的客户提供服务。”

面向GeForce RTX AI电脑平台推出AI助理

英伟达的RTX AI个人电脑，由RTX技术驱动，计划通过超过200款RTX AI笔记本电脑和500多款AI驱动的应用和游戏，来彻底改变消费者的体验。

英伟达为数字人推出G-Assist和ACE数字人技术NIM软件：

英伟达还为微软Windows Copilot Runtime推出用于RTX加速API的小语言模型（SLM）。微软和英伟达正在合作，帮助开发者通过简单的API访问，将新的生成式AI功能引入他们的Windows本地（也即直接在Windows系统上运行的应用程序）和网络应用。这些功能包括RTX加速的SLM，使设备上运行的RAG功能成为Windows Copilot Runtime的一部分。

英伟达机器人技术

英伟达正引领50万亿美元的工业数字化转型，各行业纷纷拥抱自主运营和数字孪生技术——这些虚拟模型提升了效率并降低了成本。通过其开发者计划，英伟达提供了访问NIM的途径，促进AI创新。

黄仁勋强调了机器人和AI在未来发展中的重要性：

黄仁勋推广数字孪生技术，该技术可以在英伟达称为Omniverse的虚拟世界中使用：

英伟达Isaac平台为开发者提供了一个强大的工具包，用于构建AI机器人，包括自主移动机器人（AMRs）、工业机械臂和类人机器人，这些机器人由AI模型和Jetson Orin、Thor等超级计算机提供支持。黄仁勋还强调了Isaac在提升工厂和仓库效率方面的作用，全球巨头如比亚迪电子、西门子、泰瑞达机器人和Intrinsic都在采用其先进的库和AI模型。

英伟达的IGX平台专为边缘计算而设计，可以在本地处理数据，而无需依赖集中式的云服务器。该平台旨在满足严格的监管和安全标准，这在医疗行业尤为重要，因为涉及到患者的安全和数据的保护。IGX平台适用于需要高度可靠性和实时处理的场景，包括医学技术中的诊断成像、机器人手术和患者监护，以及工业应用中的自动化机器人和智能制造系统。

像ADLINK、Advantech、ONYX等公司与英伟达合作，基于IGX平台开发并提供解决方案。

网友评论说：黄仁勋揭晓了他的机器人大军，无需惊慌（暂时的）！

最后

整场演讲下来，也有网友觉得老黄并没有说什么新东西，但是，他就是用同样的圣经布道，用很多生成式AI的影片、音乐、和语音。最后用情感连结门徒（X）合作伙伴们，呼吁大家一起迈向AI未来的光明坦途。

缩小半导体工艺尺寸能走多远?

特约撰稿莫大康推动半导体业进步有两个轮子，一个是工艺尺寸缩小，另一个是硅片直径增大，而且总是尺寸缩小为先。由半导体工艺路线图看，2013年应该进入14纳米节点，观察近期的报道，似乎已无异议，而且仍是英特尔挑起大樑。尽管摩尔定律快“寿终正寝”的声音已不容置辩，但是14nm的步伐仍按期走来，原因究竟是什么? 传统光刻技术与日俱进当尺寸缩小到22/20nm时，传统的光刻技术已无能力，必须采用辅助的两次图形曝光技术。提高光刻的分辨率有3个途径：缩短曝光波长、增大镜头数值孔径NA以及减少k1。显然，缩短波长是最主要的，而且方便易行。目前市场的193nmArF光源是首选，再加入浸液式技术等，实际上达到了28nm，几乎已是极限(需要OPC等技术的帮助)。所以Fabless公司NVIDIA的CEO黄仁勋多次呼吁工艺制程在22/20nm时的成本一定相比28nm高。其理由是当工艺尺寸缩小到22/20nm时，传统的光刻技术已无能为力，必须采用辅助的两次图形曝光技术(DP)。从原理上讲，DP技术易于理解，甚至可以3次，或者4次。但是这样带来两个大问题，一个是光刻加掩模的成本迅速上升，另一个是工艺的循环周期延长。所以业界心知肚明，在下一代光刻技术EUV尚未到来之际，采用DP是不得已而为之，实际上在技术上的可行性并不是问题，更多的是要从经济层面做出取舍的决定。 193nm光刻技术在计算的光刻技术辅助下，包含两项关键的创新，一个是同时带OPC(光学图形修正)的两次图形曝光技术，另一个是采用一种倒转的光刻技术来改善困难的布局复制，可以在局部区域达到最佳化。因此可以相信，传统的193nm浸液式光刻技术加上两次图形曝光技术(DP)，甚至4次，从分辨率上在2015年时有可能达到10nm，这取决于业界对于成本上升等的容忍度。 7nm还是5nm 除了工艺尺寸缩小之外，产业尚有多条路可供选择，如450mm硅片、TSV 3D封装等。何时能够达到7nm或者5nm，截至今日尚无人能够回答，因为EUV何时进入也不清楚。乐观的估计可能在2015年或2016年。如果真能如愿，可能从10nm开始就采用EUV技术，一直走到5nm。但是目前业界比较谨慎，通俗一点的说法仍是两条腿走路。在今年的Semicon West上各厂家的反应也是如此。 Nikon正努力延伸193nm的浸液式技术，甚至包含450mm硅片;而ASML由于获得英特尔、三星及台积电的支持，正加快NXE 3300B实用机型的发货。据说已经有6台NXE 3100 EUV设备在客户处使用，累积产出硅片已达片。另外，下一代EUV设备NXE 3300B已开始安装调试，计划2013年共发货5台，另有11台NXE 3300B的订单在手及7台订单在讨论中。 ASML正在准备450mm光刻机，它是客户共同投资计划中的一部分。公司有信心将3台EUV的营收落实在2013年的销售额之中。 ASML在2013年展览会的演讲中详细描绘了业界期待已久的EUV光源路线图，近期Cymer公司已推出了专为ASML光刻机配置的40W极紫外(EUV)光源，工作周期高达每小时30片，并计划在2014年时NXE 3300B中的光源升级达到50W，相当于43WPH水平。而100W光源可能要等到2015年或2016年，相当于73WPH。至于何时出现250W EUV光源，至少目前无法预测，除非等到100W光源成功，并有出彩的表现。 500W光源写进路线图中是容易的，但是未来能否实现还是个问题。只要实现73WPH，可以认为EUVL已达到量产水平，因为与多次曝光技术相比，它的成本在下降。在10nm节点以下如果继续釆用MP多次曝光技术，则可能需要4x甚至8x的图形成像技术。因为从理论上讲，硅晶格大小约0.5nm，通常大于10个晶格尺寸，即约5nm时，才可能有好的硅器件功能，所以可以认为5nm是工艺尺寸的最终极限。预测在2024年以后半导体产业可能发生革命性变化，电荷不再是传输信息的唯一载体，同时计算架构也可能发生革命。另外，ASML、IMEC及Applied Materials等共同协作，认为采用EUV技术有可能达到小于7nm，由于EUV技术同样也可采用DP两次图形曝光技术来提高分辨率。随着半导体产业的继续发展，之后的每一个工艺节点进步都要付出极大的代价，要求达到财务平衡的芯片产出数量巨大。现在市场上已很难找出几种能相容的产品，因此未来产业面临的经济层面压力会越来越大。然而除了尺寸缩小之外，产业尚有多条路可供选择，如450mm硅片、TSV 3D封装，FinFET结构与III-V族作沟道材料等，此外还有应用商店。而站在客户立场，他们并非知道芯片的内部构造，仅是需要价廉、实用，而又方便使用的电子终端产品。

有一个GTX480的显卡。和一个8核AMD。求大神给个配置。玩大型游戏。的

升级显卡玩大型游戏就没有压力了

GTX2000系列究竟是Volta还是Pascal升级版

可能推出Ampere（安培）架构（还是要看明年发布会）伏特成本太高，目前只出了一款针对顶级科学计算的：计算卡TeslaV100AMD今年旗舰VEGA在游戏卡表现不佳，超高功耗同时，游戏性能无法匹敌GTX1080TI（非完整版GP102核心）2000系列，还是叫1100，倾向2000最后还是看明年发布会用 Volta的确2060很强，想战1080还是不可能，因为NVIDIA会刀法阉割，在没有强敌不可能让甜品卡打上代次旗舰（除非AMD发布要出更厉害卡，给压力）英伟达掌门黄仁勋在近日的一次电话会议中明确表示：“在短时间内，甚至在下一个假日期间，我觉得Pascal架构将仍然立于不败之地。 ”言下之意就是Pascal架构将继续服役，这让那些期待下一代Volta架构显卡的人们感到失望。对此老黄也在会上否认了Volta的消息，他说：“我们目前没有透露任何有关Volta架构游戏卡的消息，我现在能说的就是，目前产品线上还有很多为玩家们准备的新东西，也有更多为他们准备的新科技。 ”英伟达年内或不会换代，黄仁勋：Pascal是不可战胜的。也就是说，Pascal架构可能不会止步于GTX1080 Ti，之后应该还会有新的基于该架构的显卡型号，当然也有可能会出一些性价比更高的中端卡。现在AMD刚刚公布了基于Vega架构的游戏级显卡，性能单从数据上看和GTX 1080相当，但由于显卡还没有上市，所以是否会对英伟达的现有产品线构成威胁还不得而知。尽管老黄对Pascal很有信心，但也不排除会即时调整策略的可能性，这主要是看AMD的战斗力如何了。