博亚体育BOYA AI数据中心, 投资崩溃点在那里?


本文将基于GPU、HBM和电力成本,反向推算出“东谈主工智能数据中心投资的崩溃点”。
对东谈主工智能数据中心的投资昭着已达到前所未有的水平。微软、谷歌、亚马逊和Meta等超大规模数据中心巨头竞相每年投资数千亿好意思元。据TrendForce预测,到2026年,这四大超大规模数据中心巨头的总投资额将高达7550亿好意思元(图1)。按1好意思元兑160日元的汇率筹画,这格外于约120.8万亿日元,卓越了日本2025财年的国度预算(一般账户预算总和约为115万亿日元,数据来源:日本财务省)。

图1:前 4 大超大规模数据中心运营商对数据中心的豪恣老本投资
之是以需要如斯多量的投资,是因为东谈主工智能劳动器中使用的AI半导体价钱飞涨。以源头的AI半导体制造商NVIDIA的GPU为例,其面前的旗舰架构“Blackwell”中,单颗“B200”GPU的价钱在500万至800万日元之间,一台配备8颗B200 GPU的“DGX B200”劳动器的价钱在4000万至7000万日元之间,而基于该劳动器的AI机架的价钱则高达数亿至10亿日元(图2)。由于构建AI数据中心需要大批部署这些AI机架,因此每个超大规模数据中心运营商的投资额皆卓越1000亿至2000亿好意思元。

图2:NVIDIA GPU AI 劳动器和数据中心(Hopper、Blackwell、Rubin)的订价结构
然则,这如故超出了“增长投资”一词所能阐发注解的限度,而更像是“为了竞争而进行的军事开导”。
在这种情况下,有一个很少被获胜参谋的关键问题:“这项投资确切不错收回成本吗?”天然东谈主工智能激越强调的是强劲的需乞降技艺翻新,但关于老本密集型行业来说,最终的问题是投资能否收回成本。
本文将东谈主工智能数据中心的成本结组成见为三个要素:GPU、宽带内存(HBM)和电力。此外,本文诈欺微软和谷歌公开的施行数据,对现时东谈主工智能投资的收入结构进行了定量分析。基于此分析,本文试图估算“崩溃线”,即投资无法收回的临界点。
请细心,天职析侧重于GPU基础设施按小时计费带来的获胜收入,并不包括东谈主工智能带来的迤逦收入(举例搜索告白质料莳植或SaaS价值加多)。阅读本文时,请难忘这少许。
绵里藏针地说,好意思国超大规模数据中心运营商在东谈主工智能数据中心看似豪恣的投资很可能如故注定失败。借用动漫《北斗神拳》中健次郎的一句名言:“你如故死了。”
从微软和谷歌的案例看投资规模的现实
图3以量化面孔展示了微软和谷歌的施行投资规模。基于这些数据,它充分阐发了微软和谷歌(Alphabet 的子公司)在数据中心规模的投资规模之宏大令东谈主矜重。

图3:微软和谷歌的施行投资规模
微软的案例
字据微软2025财年年度叙述,老本支拨(不包括固定金钱和设备)瞻望将达到645亿好意思元。此外,该公司默示,投资(主要用于东谈主工智能基础设施)瞻望将卓越800亿好意思元。
与微软云业务1680亿好意思元的营收比拟,老本支拨约占营收的38%,或字据公司声明约为48%。经常情况下,在平稳的基础设施业务中,老本支拨很少卓越营收的30%,因此这一比例极其目生。
更蹙迫的是,折旧用度已达220亿好意思元。这意味着以前的投资包袱如故动手影响公司的损益,并且这种包袱在将来几年可能会链接加多。此外,如上图1所示,微软2026年的老本支拨瞻望将达到1900亿好意思元,约为上年的2.4倍。因此,微软的利润和亏蚀瞻望将大幅下降。
谷歌的案例
与此同期,谷歌母公司Alphabet正在进行更大规模的投资。其2025年的老本支拨达到914亿好意思元,其中大部分将用于劳动器和数据中心等技艺基础设施。比拟之下,谷歌云的年收入约为588亿好意思元,商业利润约为139亿好意思元。
天然,这914亿好意思元的老本支拨不仅维持云筹画业务,也维持公司范围内的基础设施,举例搜索引擎和东谈主工智能计划平台。然则,即使其中一半用于云筹画劳动,也仍然高达约457亿好意思元,约占云筹画销售额的80%,约为商业利润的3.3倍。即便辩论到这少许,昭着面前的投资规模与传统的文书模式存在显赫偏差。
此外,与微软近似,谷歌2026年的合座老本支拨瞻望将达到1800亿至1900亿好意思元,约为上一年的2.4至2.5倍。鉴于如斯高的老本支拨水平,不难思象,收回对云筹画业务的投资将变得愈加迂曲。
东谈主工智能数据中心的成本结构
这项多量投资的原因在于东谈主工智能数据中心特有的成本结构。源头,咱们将估算东谈主工智能数据中心的成本结构和商场范围(图4)。

图4:AI 数据中心的成本结构和商场范围
源头,咱们来望望GPU。面前的AI基础设施险些全皆依赖于NVIDIA的GPU。举例,H100系统的单价臆想在2.5万好意思元到4万好意思元之间,具体价钱取决于设立,而一个包含8个H100的劳动器机架价钱将达到约300万好意思元。此外,GB200系列的机架价钱瞻望将高涨至数百万好意思元(约350万好意思元到550万好意思元)。
另一个蹙迫身分是投资对象不是单个GPU,而是“集群单元”。在面前的AI数据中心,每个集群部署数千到数万个GPU已是司空见惯,单个集群的投资额从数亿好意思元到约7亿好意思元不等。
其次是HBM显存。在H100和GB200芯片中,每个GPU经常配备6到8个HBM堆栈。HBM的单价会字据代数和合约条件而有所不同,但据称HBM3/3E的单价在1000好意思元到1500好意思元之间。因此,每个GPU的HBM成本约为10000好意思元,这在GPU价钱中占了格外大的比例。
更蹙迫的是供应适度。HBM商场险些全皆由三家公司主导:SK海力士、三星电子和好意思光科技。非常是,据称SK海力士在先进HBM商场占有卓越50%的份额。这种供应连合度酿成了一种扼制价钱下降的结构。
第三,还有功耗问题。东谈主工智能数据中心的功耗比传统云平台高出几个数目级(图5)。举例,H100 的 TDP(注:热瞎想功耗,指冷却芯片所需的臆想最大发烧量)约为 700W,而 GB200 的 TDP 则在 1kW 级别。若是设立一个包含 10,000 个 GPU 的集群,仅 GPU 本身的功耗就将达到 10MW,加上收罗和冷却等其他功耗,总功耗将达到20-30MW。

图5:东谈主工智能数据中心的年度功耗和总成本
回到图5的阐发注解,换算成年耗电量,一个20兆瓦的系统需要20兆瓦×24小时×365天≈1.75亿千瓦时/年。假定电价为0.14好意思元/千瓦时,则年电费约为2500万好意思元。施行上,辩论到冗余设立和冷却损耗,凤凰彩票app2026世界杯最新下载成本达到每年3500万好意思元傍边的情况并不格外。
因此,GPU(老本支拨)、HBM(供应适度)和电力(运营支拨)这三个要素皆会跟着规模的扩大呈指数级增长。收尾,东谈主工智能基础设施的成本仍然居高不下,并且似乎很难像以前那样通过规模延迟来责备成本。
传统的归附模式不行行
传统云基础设施受益于规模经济,这收货于劳动器单元成本的抓续下降和诈欺率的提高。摩尔定律和诬捏化技艺的朝上使得单台劳动器好像跟着时分的推移“以更低的成本处分更多劳动”,这为归附模子提供了维持。然则,东谈主工智能数据中心的情况则截然不同。图6展示了其成本结构的前提条件,图 7则展示了基于这些条件筹画出的东谈主工智能数据中心归附线。

图6:AI 数据中心归附模子筹画的假定

图7:AI 数据中心投资回收期筹画
假定运转投资7亿好意思元用于开导一个领有1万个GPU的集群(包括GPU、劳动器、收罗和冷却系统),并出于管帐筹算将其摊销在5年内,则每年的摊销用度为1.4亿好意思元。加上3500万好意思元的电力成本和3500万好意思元的运营成本(调整、东谈主员成本、数据中心房钱等),每年的总成本约为2.1亿好意思元。
由此可知,归附所需的每个GPU 的计费成本不错用以下公式默示。
所需计费成本= 年度总成本 ÷ (GPU 数目 × 8760 小时 × 往常运行时分)
假定运行率为70%,2.1亿好意思元 ÷ (10,000 × 8,760 小时 × 0.7) ≈ 约 3.43 好意思元/GPU 小时
换句话说,除非每块GPU在接近恒定的运行条件下每小时至少产生3.43好意思元的收益,不然投资无法收回。这是“下限”,而非“平均值”,若是诈欺率下降,所需的单元成本还会更高。
然则,在施行商场中,生成式东谈主工智能推理的价钱正在赶快下降。举例,据报谈,大规模言语模子(LLM)的应用标准编程接口(API)价钱在2023年至2025年间将降至原价的十分之一以下。此外,开源模子的激增进一步加重了价钱竞争。
关键在于,尽管API价钱大幅下降,但GPU、HBM和电力成本施行上却在高涨。此时,传统的归附模式已不再可行。东谈主工智能基础设施正在从“规模越大,上风越昭彰”的模式转向“规模越大,固定成本风险越高”的模式。那么,归附会在什么规模下变得不行能呢?让咱们基于微软和谷歌的真正数据来分析归附条件
回收线的现实
正如前文所述,微软每年抓续投资600亿至800亿好意思元,而到2025年,其折旧用度已卓越200亿好意思元。若是微软试图用微软云的运渔利润来支付这220亿好意思元的折旧用度,将会大幅责备其云业务的运渔利润率。另一方面,谷歌云业务的运渔利润为139亿好意思元,博亚体育BOYA而其仅云业务的老本支拨就高达约457亿好意思元,这意味着即使按单年筹画,其投资额也卓越了运渔利润的三倍。
这标明存在结构性问题。东谈主工智能基础设施必须保抓极高的投资文书率能力盈利。然则,现实情况是,东谈主工智能劳动的价钱正不才降,GPU和HBM的成本仍然很高,而电力成本却在上升。
在上述三个身分同期作用的环境下,投资回收的条件会赶快恶化。不错说,现时的AI投资如故干涉了一种结构性逆境:除非同期兑现极高的诈欺率和极高的单价,不然很难收回投资。
投资为何仍需链接
那么,这种对老本设备的豪恣投资会放缓吗?谜底是含糊的。
微软剩余践约义务约为3680亿好意思元,标明商场需求仍然卓越供应。谷歌也明确默示,筹谋进一步扩大老本支拨,以知足东谈主工智能和云筹画的需求。关键在于,这两家公司皆不是因为预期好像收回投资才进行投资的。违反,它们是被动链接投资的,因为住手投资就意味着在竞争中过时。
现时的东谈主工智能投资如故从追求利润最大化退换为致力幸免失败。咱们应该将东谈主工智能投资视为如故干涉“徒然战”阶段,而非“增长”阶段。
唯一这种结构抓续下去,东谈主工智能激越就会链接延迟,但其里面会积累一种无法挽救的风险体式的“误解”。这种误解会在某个节点一霎流露出来。这便是下一章将要推崇的“崩溃线”。
探索崩溃线
如上所述,判断东谈主工智能投资的可抓续性不仅需要辩论GPU的数目,还需要辩论HBM、电力以及总共电力基础设施。本文将以一个领有10000个GPU的集群为例,定量地展示投资回收在何种规模下将变得不行能——即所谓的“崩溃线”。
从GPU数目倒推,HBM和功耗按如下面孔加多:
源头,咱们假定一个由10,000 个 GPU 组成的集群。图8炫夸了每个集群所需的年功耗以及所需的等效核电站数目。

图8:故障线所需功耗的物理规模
假定每个GPU配备8个HBM堆栈,则所需的HBM总量将达到80,000个堆栈。每个堆栈24GB,觉得约为1.92PB。此外,就功耗而言,假定每个GPU的功耗为1kW,而总共设施(包括冷却、变电站和收罗负载)的功耗约为其两倍,则一个领有10,000个GPU的集群的设施负载约为20MW。
年耗电量约为175.2吉瓦时(GWh),除以一座1吉瓦级核电站以90%负荷运行的年发电量,格外于约0.022座反映堆的发电量。反过来说,这意味着一座核电站只可知足约45个所在的用电需求,若是东谈主工智能集群大规模延迟,不新建核电站将无法知足需求。
歇业线的界说
如上所述,假定一个领有10,000个GPU的集群,运转投资7亿好意思元,分5年摊销,年运营成本3500万好意思元,年电力成本约为3500万好意思元,则年度总成本约为2.1亿好意思元。在这种情况下,盈亏均衡条件不错用第三章中花样的以下公式默示。
所需计费成本= 年度总成本 ÷ (GPU 数目 × 24 小时 × 365 天 × 往常运行时分)
假定诈欺率为70%,则每 GPU 小时的计费成本约为 3.43 好意思元。本文将此称为“临界点”。换句话说,一朝 AI 劳动价钱低于此水平,或者诈欺率低于此假定值,投资就无法收回成本。
需要细心的是,出于管帐筹算而接受的5年摊销期联系于NVIDIA GPU的技艺周期(经常每两年傍边更新换代一次)而言是一个较为乐不雅的假定。在后文所述的崩溃状态③中,咱们将分析这种缩小的摊销期对收入结构的影响。
崩溃一霎发生
在典型的基础设践诺业中,利润率会缓慢下降。然则,在固定成本极高的AI数据中心,一朝利润率低于某个水平,盈利才略就会赶快恶化,原因有以下三点。
第一,GPU 和 HBM 的运转投资巨大且固定。
第二,电力和冷却负荷很高,并且谢却易责备。
第三,另一方面,由于竞争,所需的计费单元价钱(商场价钱)将会下降。
因此,东谈主工智能投资的恶化经过并非线性而非线性。换句话说,并非“情况缓慢恶化,然后变得愈加艰难”,而是“一朝越过某个临界点,损失就会一霎变得巨大”。这便是歇业线的本色。
面前,让咱们定量筹画东谈主工智能数据中心发生故障的三种场景。每种场景的共同条件如图9所示。

图9:筹画 AI 数据中心故障线的常见条件
三种崩溃状态
图10炫夸了三种故障场景的仿真收尾。

图10:东谈主工智能数据中心发生故障的三种场景模拟
第一,软件崩溃。
最有可能出现的情况是东谈主工智能公司之间伸开强烈的价钱竞争。若是计费价钱降至每GPU小时2.90好意思元,诈欺率降至65%,则所需计费价钱将高涨至3.69好意思元,导致每年损爽约4490万好意思元。然则,如图10所示,天然现阶段并未出现绝对崩溃,但利润已全皆销毁,投资复苏也悄然走向失败。即使名义需求得以保管,里面老本后果也在急剧下降。
第二,硬件崩溃。
下一个风险是电力、制冷和装置等施行成本的高涨。若是3好意思元的计费率和55%的诈欺率,再加上电价高涨和设施负荷加多,所需的计费率将跃升至4.7好意思元,导致每年约8170万好意思元的损失。图10 炫夸,在此阶段,赤字急剧扩大。这是一个典型的例子,阐发基础设施成本而非需求奈何破坏盈利才略。
第三,金融崩溃。
最严重的后果是财务上的崩溃。即使计费率为每间3.20好意思元,入住率为60%,由于折旧期缩小(从5年缩小到4年)以及8%的老本成本,施行计费率也需达到每间5.73好意思元,导致每年亏蚀约1.33亿好意思元。因此,如图 10 底行所示,此阶段的损失已达到无法承受的水平(每年 1.33 亿好意思元)。这种情况的本色在于,老本商场在设备发生物理故障之前就认定该项投资“无法收回”。
失效以“非线性”面孔发生
图11炫夸了AI 数据中心诈欺率与所需计费成本之间的关系。需要细心的是,这种关系并非线性关系。

图11:AI 数据中心将出现故障的规模
入住率为70% 时,所需单元成本约为 3.43 好意思元;但当入住率降至 60% 时,所需单元成本将上升至近 4 好意思元;若是入住率进一步降至 50%,所需单元成本将跃升至近 5 好意思元。
图11 所示的“崩溃区域”直不雅地展示了这种非线性关系。商场价钱区间(2.5 至 3.0 好意思元:基于 AWS、Azure、Lambda Labs 等平台的 H100/H200 小时费率范围)如故跌入该区域深处,面前的 AI 劳动价钱很可能已从结构上低于盈亏均衡点。
功耗适度:东谈主工智能是一个国度基础设施问题
更蹙迫的是,东谈主工智能投资的规模化获胜依赖于电力基础设施。如图12所示,10,000 个 GPU 大致需要 20 兆瓦 (MW) 的电力,100,000 个 GPU 需要 200 兆瓦 (MW) 的电力,而 1,000,000 个 GPU 则需要 2,000 兆瓦 (MW)(= 2 吉瓦 (GW))。这意味着不仅需要扩建数据中心,还需要扩建电力供应基础设施本身。

图12:功耗从 10,000 个 GPU 到 100,000 个 GPU 再到 1,000,000 个 GPU 急剧加多
若是咱们把这些电力转变为核能:
10,000 个 GPU 的集群:0.02 个单元
100,000 GPU 集群:0.2 个单元
百万GPU集群:2.2个单元
东谈主工智能投资的延迟昭着等同于电力基础设施的延迟。东谈主工智能数据中心不再只是是IT行业的问题,而是如故演变为波及电力、地皮和开导才略的“国度供给才略问题”。
东谈主工智能投资濒临的“崩溃”
面前对东谈主工智能数据中心的投资不仅无利可图,并且在物理上也难以抓续。商场价钱下落、诈欺率下降、电力成本高涨或老本商场收紧——哪怕其中任何一个身分皆可能立即导致数据中心崩溃到临界点。并且,这种崩溃不会缓慢发生,而是在跨越某个临界点后一霎爆发。这不再只是是半导体行业的问题,而是关乎国度电力供应才略的问题。
2026年4月3日,日本首相高市早苗会见了好意思国大型超大规模数据中心运营商微软总裁布拉德·史姑娘,并对该公司在日本数据中心投资约100亿好意思元默示宽容。然则,正如本文所示,此类投资不仅无利可图,并且耗电量巨大,其结构还会给国度基础设施带来包袱。在东谈主工智能激越的背后,有必要闲逸地评估日本将要付出的代价规模。
*声明:本文系原作家创作。著述内容系其个东谈主不雅点,本身转载仅为共享与参谋,不代表本身赞誉或认可,如有异议,请关联后台。
思要取得半导体产业的前沿洞见、技艺速递、趋势领悟博亚体育BOYA,关切咱们!

备案号: