距离A100、H100被禁售已经过去一年半,如今英伟达对华售卖阉割版的难度却一再升高。
近期,Jeffries分析师表示,美国在10月会对半导体出口管制进行年度审查,届时“很可能”禁止英伟达H20向中国销售。而 禁售的方式有三种可能:特定产品禁令、降低计算能力上限,以及限制内存容量。
英伟达计划为中国推出新的特供版AI芯片,这个消息自黄仁勋3月官宣Blackwell后就没停过。目前主流的消息是, 英伟达计划推出的是B200的“阉割版”B20。
但远在中国的众多中小创业者们明白: 不管是论价格,还是论获取难度,英伟达的最新款高端AI芯片也大概率最多与自己“云端相见”。
AI创业者Jason告诉字母榜(ID:wujicaijing),他的公司之前的方向是AI应用层,除了通过云服务租A100和H100的算力之外,本地部署的是50张英伟达V100芯片,以及英伟达3090显卡。
这样的选择既是因为初创企业要追求性价比,压缩成本,也是因为做AI应用层的业务其实并不需要极高的算力。V100是英伟达在2017年发布的计算卡,彼时V100八卡服务器官方售价是102万元。而Jason的50张V100是“900元每张捡的”二手货,3090显卡是以每张5000元的价格收来的。
从2022年底开始,英伟达的最强大的芯片都因美国升级半导体出口管制而出口中国受阻,不管是A100,还是Blackwell之前最强大的H100,都无法在中国正规售卖。在那之后,美国针对高端芯片的出口管制越来越严格,英伟达从A800、H800,到H20、L20、L2,推出了一款又一款“中国特供版”芯片。
对于大多数创业者来说,特供版不仅性能远不及“原版”,价格也令人望而却步。一位卖家告诉字母榜,H20八卡服务器的售价在130万元左右。IT时报曾报道,H20的主要需求方还是百度、阿里、腾讯和字节等互联网大厂。
Jason称,H20主要是拿来做推理,但是“用H20不如用4090”, 因为后者够用,而且H20作为商用芯片,“商用有折旧率,折价比较多,机房大概几年换一批,普遍不保值,比如V100当年卖几万,现在只能卖几千,也就五六年时间,如果不是AI潮,最多值500。”
不止一位业内人士向字母榜表示,自己偏好使用英伟达RTX4090,这款2022年10月推出的旗舰产品原以游戏显卡为名问世,但也备受AI行业的青睐,同样也受到了美国芯片出口管制的影响。
华兮云的英伟达RTX4090备货
AI超算供应商浙江华兮云科技有限公司也介绍称,“目前最好用的是4090”,不过“也要看配置、组网、显卡”,很多客户的需求其实4090就能满足,而且性价比来看也比较好。该工作人员还补充称,本月公司就要上100台4090。
对于英伟达将在中国推出新特供产品、B200的“阉割版”B20的消息,Jason不感到兴奋,直说“看性价比”,而华兮云方面表示也尚未在业内听到相关消息。
此前路透社曾报道英伟达已经就B20有中国的浪潮信息展开合作,但后者已经回应称该消息不属实。
今年3月19日,黄仁勋在美国加州圣何塞SAP中心登台,主题演讲大开大合,名为《见证AI的变革时刻》。
老黄很少吹牛,英伟达官宣新一代Blackwell架构,并推出芯片B200和超级芯片GB200。“新核弹”是外界对英伟达新产品的形容,彼时刚升任英伟达研究经理的Jim Fan感慨摩尔定律已经按不住这家公司了。
但来自苹果的一次实验探索,稍稍阻挡下了英伟达的前进步伐。黄仁勋或许已成为全世界最不期待Apple智能上线的人。
北京时间7月30日,苹果发表了一篇技术论文,其中有这样一则信息:支撑Apple智能的两个AI模型,都是在谷歌的云端芯片上进行预训练的。
一来,谷歌的自研芯片为TPU张量处理器,此前多用于谷歌内部使用,而不对外出售。此番却出手抢走了大客户。二来,苹果此前曾在5月被《华尔街日报》爆料,正在为其数据中心服务器开发自研芯片,如今没有用上自研芯片,却依然没有选择英伟达。这足以令英伟达有些尴尬。
苹果“晾着”英伟达,是英伟达如今处境的一个缩影。英伟达的股价在今年前六个月上涨了150%,然而在7月份接连暴跌,占市值下跌幅度最大的八次中的四次。
此外,英伟达近期坏消息不断:被传新芯片B200将延迟三个月甚至更久才能交付;美国司法部针对其展开两项反垄断调查。
与之相对的,是不断传出的“中国特供版”消息——据多家外媒报道,英伟达计划向中国推出B200的阉割版B20。并且,英伟达还有可能会针对中国出售搭载最新芯片的服务器,以服务器来弥补特供芯片的性能。如果该消息属实,这将会是英伟达首次针对中国市场专门推出一款服务器产品。
上述举措也表明,尽管面临重重阻碍,但英伟达不仅没有放弃,还为中国市场做出更大的努力。
2022年底ChatGPT掀起的AI浪潮已经翻涌了近两年,英伟达也从一家芯片巨头一跃成为全世界市值最高的公司之一。如今AI赛道逐渐回归理性,竞争对手也慢慢形成围剿之势,中国变成了英伟达越来越难舍弃的市场。
对于中国AI赛道上的大量中小初创企业来说,英伟达中国特供版芯片并非他们的关注重点。而 对于特供版芯片的主要采买方——中国的大型互联网企业来说,选择英伟达也只是当下的最优解 。
英伟达在2023年10月推出了为中国量身定制的HGX H20、L20 PCle、L2 PCle,其中H20是备受瞩目的“矮子里的将军”,阉割版里的最强款。然而,一个月之后,随着英伟达跳票、H20推迟到次年第一季度交付的消息,使得不少企业转向国产芯片。
彼时中国基金报报道,百度已经为200台服务器向华为订购了1600个昇腾910B芯片。周鸿祎不久后也在乌镇峰会上表示,360采购了1000多个华为AI芯片,比百度还早。
到了今年上半年,又传出企业观望、华为等国产厂商竞争,英伟达H20在华销售疲软的消息。5月,传出H20下调价格的消息,原因指向两点,一点是H100不缺货并开始降价,H20随之下调,另一点是华为昇腾910B与之竞争,且初始售价后者更有优势。
下半年,H20在中国的销售似乎迎来转机。前不久,芯片行业咨询公司SemiAnalysis预测,H20芯片有望在当前财年提振该公司中国区业绩,今年有望交付超过100万张H20芯片。按照单芯片1.2万美元到1.3万美元的售价计算,仅H20就可以为英伟达贡献超过120亿美元的营收,这个数字超过上一财年英伟达中国区的整体营收。IT时报的报道指出,H20的销售抬头,主要是因为英伟达的生态优势,以及华为昇腾910B供货紧张。
这对英伟达来说,只能算作短暂的快乐,因生态优势和竞对供应紧张而获得的转机并不能言稳固。下一代“中国特供版”芯片很有可能在路上,但英伟达的挑战颇多。
除了传言中可能推出的B200的“阉割版”B20之外,据The Information报道,英伟达还计划为中国新版特供芯片搭配服务器。在中国专门推出一款服务器,这个动作英伟达此前未曾有过,此举是为了以服务器让特供芯片性能表现最大化,弥补“阉割版”的不足。
以搭载服务器当“一揽子”方案的消息如果为真,将是英伟达在禁售束缚之下做的新尝试。
坏消息是,市场再次传出英伟达最新芯片交付推迟的消息。据The Information近日的报道,英伟达已经向客户表示,B200将延迟发布三个月或更长时间,批量出货时间或将延迟到明年的第一季度(原计划今年10月就开始批量生产)。
此处提到的“客户”中不乏科技巨头,据报道,Meta已经定下价值至少100亿美元的订单,微软也在近几周内将其订单规模增加20%,并计划在明年第一季度前为OpenAI准备好5.5万到6.5万个GB200。
有理由怀疑,B200的延迟交付也将影响英伟达向中国市场推出阉割版的节奏。报道中称延迟交付的原因是在生产时发现了“设计缺陷”。
虽然英伟达尚未证实推出B20的消息,但几乎不会有人怀疑这将会发生。
比起2022年英伟达初次受到AI芯片的出口禁令,如今这家芯片巨头更加难舍中国市场。
中国庞大的芯片需求自然是首要驱动力。 2022财年和2023财年,中国内地及香港地区分别为英伟达贡献71.11亿美元、57.85亿美元的营收,分别占其总营收的31.7%和25.9%。
然而,由于美国的芯片禁令,英伟达在中国却面临失速风险。2024财年,英伟达包含内地和港澳地区的中国市场营收止步百亿美元,占比滑至16.9%。
今年5月,英伟达发布2025财年第一季度(截至2024年4月28日)的业绩报告,在数据中心业务上,英伟达来自中国客户的营收占比已经从2023财年的19%,降低至2024财年的中个位数百分比(5%)。
对于中国本土芯片制造商发起的竞争,黄仁勋也心知肚明:“我们在中国的业务确实比过去的水平下滑很多。由于技术限制,现在在中国的竞争更加激烈。这些都是事实。”几天之后,黄仁勋再提中国芯片企业,称中国有很多GPU初创企业,不要低估中国在芯片领域的追赶能力。
从某种角度来看,美国的芯片禁售令虽然给中国AI企业在这波浪潮之中增加了难度,但同时也为中国本土的芯片制造商提供了发展的空间。从黄仁勋的角度来看,这无疑是危险的, 时钟滴答响,留给英伟达在“阉割”之中破局的时间不多了。
这还不是英伟达更加难舍中国市场的全部因素。相比于2022年底,ChatGPT掀起千模大战,英伟达销售额和股价齐飞冲天,如今英伟达正在面临越来越不确定的局面。
仅在今年,就有OpenAI的CEO山姆·奥特曼(Sam Altman)7万亿芯片网络野心被爆料,微软开发类似英伟达网卡ConnectX-7的替代品,想提高其自研芯片Maia的性能。而谷歌TPU创造者乔纳森·罗斯(Jonathan Ross)创办的技术公司Groq,则叫嚣其新产品可以威胁到英伟达。
苹果投向谷歌的怀抱则是英伟达的噩梦又向前了一步:在自研芯片之外,一家财力雄厚的科技巨头加入AI之战,却没有选择英伟达。
在竞争之外,英伟达还面临着越来越强烈的监管压力。先是7月法国竞争管理局证实,正在对英伟达疑似违反市场竞争的行为进行调查。紧接着,8月,美国司法部针对英伟达展开两项反垄断调查。
英伟达的股价在今年前六个月上涨了150%,然而美联储降息落后,华尔街也对于科技股施加重压,多重因素影响下,英伟达股价“终于”在7月份接连暴跌,占市值下跌幅度最大的八次中的四次。
在这种情况下,英伟达需要,也必须保住在中国市场的影响力。 这波AI浪潮虽然热闹,如今前路却也迷雾重重,英伟达是否会摸到天花板,甚至应了“AI泡沫论”的“诅咒”跌落神坛,谁都说不准。
在整整四年前,2020年8月,英伟达公布2021财年第二季度财报,季度数据中心的收入才首次超过游戏业务。如今,数据中心已经取代游戏,成为英伟达的核心业务。但这一步,黄仁勋铺垫了多年。
如今的英伟达,也同样需要为未来做打算,既要保持信心,也得“留一手”。一个有意思的数据是,据英伟达2025财年第一季度财报,该季度汽车业务在总营收中占比仅有1.2%,却是英伟达在数据中心业务之外,唯一实现环比增长的业务。而在英伟达官方公布的汽车业务合作伙伴中,中国车企与智驾方案供应商占比超过80%。
从这个角度来看,中国特供AI芯片的意义也许并不仅仅在AI,还在于英伟达需要在中国拥有持续的、可作为未来支点的影响力,哪怕是面临一次次被阉割的命运。
参考资料:
硅基研究室:《中国大陆营收占比暴跌,美国芯片禁令“刺伤”英伟达》
赛博汽车:《感谢中国车企,英伟达缓过来了》
钛媒体:《英伟达“过山车”式股价背后,AI芯片巨头地位并非不可动摇》
IT时报:《性能“阉割”的英伟达H20为何会大卖?》
半导体行业观察:《3万亿芯片公司,也在夹缝求生?》
英伟达已确认RTX 4090 D显卡将于北京时间2023年12月28日22:00发布,同时可以确认RTX 4090 D没有公版,但MSRP的价格不变。
根据之前的爆料来看,RTX 4090 D属于中国特供版显卡,搭载AD102-250GPU核心,旨在取代面临出口风险的RTX 4090。
参数方面,RTX 4090 D基准频率将从RTX 4090的2235MHz提高到2280MHz,而加速频率仍会维持在2520MHz,同时TGP功耗也从450W下调到425W。
规格参数
规格层面,RTX 4090预计打开128组SM,集成个CUDA、96MB二级缓存,匹配24GBG6X显存等,单精度浮点性能超70T。
RTX 4090搭载CUDA+24GB显存。 性能方面,英伟达称在完整的光线追踪游戏中,与上一代采用DLSS2的RTX 3090 Ti相比,采用DLSS3的RTX 4090的性能提升可达4倍。 在现代游戏中,RTX 4090的性能提升高达2倍,同时保持了相同的450W功耗。
RTX 4090具有760亿个晶体管、个CUDA核心和24GB高速镁光GDDR6X显存,在4K分辨率的游戏中持续以超过100FPS运行。
以上内容参考:网络百科-RTX 4090
对比4090及4090D:国区“特供”与原版相比有何区别?
2023年12月28日,英伟达推出了GeForce RTX 4090D显卡,与一年前的4090相比,其特性和表现有哪些差异?特别是在当前热门的大模型推理和AI绘画场景中,两者的表现如何呢?在规格对比上,4090D基于NVIDIA的Ampere架构,核心型号虽相同(AD102),但CUDA核心数量显著减少,约为4090的90%,从16,384个下降到14,592个。 4090D的基准频率略有提升,从2235MHz增至2280MHz,加速频率均为2520MHz。 而4090则拥有完整的AD102核心,CUDA、Tensor和RT核心分别为16,384、512和128个,性能更为强大。 在实际性能方面,CUDA核心的减少对图形渲染和物理模拟有显著影响。 4090D的512 Tensor Core减少到456,导致TPC数量差距明显,影响了高分辨率和帧率的图形处理能力,物理模拟效果可能会受影响。 在AI推理上,4090D的单精度和双精度浮点运算性能分别比4090低约5%和2.6%,而在AI绘画测试中,512*512分辨率下,4090D落后约10%,但随着分辨率提高,效率有所提升。 在价格方面,值得注意的是,4090D在性能上低于4090,但某些云服务器市场上,4090D的价格却高于4090,购买时务必留意。 推荐选择UCloud的4090云服务器,价格优惠,性能强劲,且提供独立IP、预装模型和优质售后服务,目前还有9.9元/天的特惠活动,性价比极高。
显卡天梯图2024最新版独立显卡性能排名
显卡是电脑中最核心的硬件之一,对于游戏党来说,显卡是决定游戏画质和流畅度的关键因素。 而随着AI人工智能技术的不断发展,AI绘画逐渐成为了备受关注的领域,选购一款性能出色的显卡,能够为你大大提高工作效率。
不少小白对电脑一窍不通,判断一张显卡的性能,往往都是看显存大小,其实这是一种选购误区,其实对于小白来说,最好的方式就是查看最新的显卡天梯图,来判断一张显卡的性能好坏,尤其是对比N卡和A卡的时候,下面装机之家晓龙分享一下台式电脑显卡天梯图2024年3月新版,除了N卡和A卡独显之外,还加入了intel独显以及常见核显进行对比,来看看吧。
显卡天梯图
小知识:
显卡主要分为两大阵营,即NVIDIA和AMD,NVIDIA和AMD为显卡核心芯片厂商,显卡搭载着NVIDIA GPU芯片,我们称之为N卡,而搭载着AMD GPU芯片,称之为A卡。
NVIDIA和AMD自家显卡称之为公版,公版指的是NVIDIA或AMD在新品发布之初,原厂设计(或者授权设计)的PCB版型,包括电路、接口、用料、散热都方面都是有统一标准的,而且显卡的核心频率也都一致,并指定OEM厂商生产的显卡。
不过绝大数消费者购买的显卡都是非公版,例如华硕、微星、技嘉、影驰、七彩虹、耕升、盈通、索泰、映众、铭瑄、蓝宝石、迪兰等品牌均为均为OEM厂商,采用的均为NVIDIA和AMD提供的GPU芯片,我们称之为“非公版”,相同GPU芯片显卡的情况下,这些OEM厂商会设计不同的显卡外观、做工用料、接口、灯效、散热,并划分低端、中端、高端多个版本卖不同的价格,包括有些型号的显卡在核心频率预设高一些,当然性能差异不会太大,主要还是做工用料和散热的区别。
目前N卡在市场份额占有率最大,产品线相对更加丰富,并在高端显卡市场遥遥领先,在技术上相对更有优势,例如在光追技术,DLSS技术等,优化上也更胜一筹,而A卡相对性价比更高,同级别显卡,价格更为实惠。
一、装机之家桌面版显卡天梯图
装机之家桌面版显卡天梯图的N卡包含了部分老旧型号、10系列、16系列、20系列、30系列以及新推出的40系列显卡。 而A卡主要是部分老旧型号、RX5000系列、RX6000系列以及新推出的RX7000系列显卡。 需要说明一下,本显卡天梯图主要是台式电脑显卡各个型号的性能排名,不包括笔记本移动版显卡型号。
桌面版显卡天梯图2024年3月版
注:显卡天梯图上的芯片型号越高,则代表性能越强,显卡天梯图具备时效性,新显卡推出,天梯图也会随之更新。
二、市场常见显卡选购:
第一阶梯:(1080P分辨率,适合轻量级游戏)
N卡:
GT1030 D5:相对比较便宜的亮机卡,性能比RTX750强一些,除了亮机使用,比较适合LOL、穿越火线、地下城、梦幻西游之类的轻量级网游,畅玩腾讯全家桶。 例如在1080P高画质下,可以稳定130帧-150帧左右,畅玩英雄联盟完全没有问题。 但如果想要畅玩绝地求生之类的网游,建议GTX1650起。
GTX1630:虽然是新推出的16系显卡,也可以玩一些主流网游,但是性价比极低,个人觉得定价完全不合理,性能还不如GTX1050Ti,真不如加一两百元考虑GTX1650,或者选RX6400。
GTX1650:适合玩一些主流网游和腾讯全家桶,也是1080P主流网游的起步卡,比较适合1080P高画质玩玩绝地求生、CSGO、APEX英雄、彩虹六号、鬼泣5、生化危机7之类的游戏完全没有问题,中画质玩玩古墓丽影、GTA5、孤岛惊魂5、战地5之类单机游戏也没有问题。 同价位,注重性能建议上RX6500XT,性能强于GTX1650S,近乎GTX1660。
A卡:
RX6400:RX 6400对标的就是GTX1650,两者性能水平近似,参考GTX1650的性能即可。
第二阶梯:(1080P分辨率下玩主流游戏)
N卡:
RTX3050:RTX3050性能介于GTX1660S和GTX1660Ti之间,至于RTX3050性能,你可以理解为GTX1660S升级版,性能仅有一点点小优势,多了一个光追和DLSS技术,还有一个优势就是无矿卡风险。 这张显卡性价比不高,差不多价位建议A卡的RX6600 8G。
RTX4060 8G:RTX4060 8G相当于RTX3060 12G的升级版,目前已经完全取代RTX3060,也不用担心矿卡的风险,RTX4060在性能领先了15-18%,并在功耗上更低,游戏功耗仅为115W,更安静清凉,并且支持全新的DLSS3技术,在1080P高画质下满足目前一切游戏,2K分辨率高画质下也可满足大多数3A游戏。
A卡:
RX6500XT:游戏的表现也是RX6500XT是要略强于GTX1650S,领先6%左右的样子,定位1080P主流网游的显卡,在1080P高画质下满足大多数网游和部分单机,玩玩绝对求生、守望先锋、德军总部:新血脉、古墓丽影:暗影、巫师3,部分要求略高的游戏开到中画质也可以畅玩了,例如孤岛惊魂5、战争机器5、地平线:零之曙光,无矿卡风险,对于千元级显卡,性价比还是不错的。
RX6600:RX6600这款显卡的性能介于RTX2060与RTX3060之间,RX6600相比RTX2060领先了7%,仅仅落后于RTX3060大概6%左右,但是价格便宜了好几百,性价比高。
RX7600:AMD新发布的RX7600是一款用于替代RX6650XT的一款显卡,性能略超RTX3060,对于这样的性能,高画质下满足1080P和2K下部分3A游戏完全足够了。
第三阶梯:(2K分辨率玩游戏)
N卡:
RTX4060Ti:用于取代RTX3060Ti的一块显卡,性能相比RTX3060Ti G6X领先了10%左右,仅落后RTX3070大概3%左右。 显卡到了这个级别建议上2K显示器,在2K下满足大多数的单机游戏,2K最高画质,例如全面战争:三国、幽灵行动、刺客信条:奥德赛、刺客信条:英灵殿、无主之地3、荒野大镖客:救赎、全面战争:特洛伊、 幽灵行动:断点、杀出重围:人类分裂、杀手2、孤岛惊魂6等等,不一一举例了。
RTX4070:RTX4070定位在2K分辨率下追求高帧率的游戏玩家,游戏性能表现与RTX3080互有胜负,性能取代上一代RTX3080,不过RTX4070是支持DLSS3技术的,借助DLSS3这样的黑科技可以实现游戏帧数暴增。
RTX4070SUPER:RTX4070Super相比RTX4070领先了18%左右,仅落后RTX4070Ti只有7%左右。
A卡:
RX6750GRE:RX6750GRE新推出不久,有10G和12G版本,建议优先考虑12G版本,性能表现更好,介于RX6700XT和6750XT之间,但是性价比更具优势,AMD推出这张卡就是为了打RTX4060,无论是显存容量、性能、价格都碾压RTX4060,性能更接近RTX4060Ti,相当于用RTX4060价格,买了一张RTX4060Ti。
RX7800XT:RX7800XT对标的是RTX4070,不仅相比RTX4070更实惠,性能相比RTX4070略强一些,最关键的是RX7800XT配备了16GB大显存,满足2K下所有游戏,甚至可以满足大多数4K游戏,适合追求性价比的游戏玩家,如果涉及光追游戏,建议考虑RTX4070。
第四阶梯:(4K分辨率玩游戏)
N卡:
RTX4070Ti:2K分辨率下,RTX4070Ti的游戏性能表现与RTX3090Ti互有胜负,基本属于同一水平,不过在4K分辨率下,RTX4070Ti的性能只能与RTX3080Ti相当,适合2K通吃,4K分辨率下胜任绝大数3A游戏。 RTX4070TiSUPER推出后,RTX4070Ti即将停产。
RTX4070Ti SUPER:相当于RTX4070Ti的升级版,2K和4K分辨率下,RTX4070TiSuper相比RTX4070Ti分别领先了7%、10%。
RTX4080:RTX4080性能相比上一代卡皇RTX3090Ti强了大概25%左右,RTX4080完全可以胜任4K分辨率游戏需求。
RTX4080SUPER:RTX4080 SUPER这张卡算是SUPER中提升最少的显卡,和RTX4080性能差异极小,领先幅度仅1%左右。
RTX4090:RTX4090性能很强悍,相比上一代旗舰卡皇RTX3090Ti提升了70%左右,4K分辨率下游戏通吃,包括赛博朋克2077这种游戏大作,4K最高画质不开DLSS都可以达到80多帧畅玩,全面开启4K时代。 由于RTX4090被美丽国限制芯片进口,目前RTX4090溢价较高,如果非必要选择,各位玩家请绕行。
RTX4090D:RTX4090禁售后,英伟达推出中国特供版的RTX4090D,相当于阉割后的RTX4090,性能低了5-10%左右。
A卡:(高端考虑A卡的玩家较少)
RX7900XT:与RX7900XT对标的显卡是RTX4070Ti,7900XT在2K分辨率比4070Ti要强10%左右,4K下性能差距会进一步拉大到17%左右,不过光追不如RTX4070Ti,如果考虑到光追无疑是RTX4070Ti。
RX7900XTX:和RTX4080同一个档次,传统性能相比4080性能强5%,不过光追性能和生产力落后太多,二者基本差不多水平,在游戏上基本互有胜负,买不买RX7900XTX,还需要看行情,价格要比RTX4080便宜不少,毕竟光追等技术和游戏优化还是N卡好。
以上就是装机之家分享的台式电脑显卡天梯图2024年3月最新版,通过最新显卡天梯图能够快速的帮助装机用户对比出显卡之间的性能强弱,尤其N卡和A卡的对比,以帮助大家选购显卡,希望本文能够帮助到大家。