Token爆發(fā) AI算力全鏈漲價(jià) 開(kāi)啟“能效競(jìng)爭(zhēng)”時(shí)代
關(guān)鍵詞: 算力漲價(jià) 算力 算力銀行 算力超市
算力,正成為AI時(shí)代最稀缺的“硬通貨”,目前全鏈價(jià)格不斷攀升。 海外英偉達(dá)H100一年期租賃價(jià)格漲幅近40%;國(guó)內(nèi)云廠商集體調(diào)價(jià)——騰訊云Tencent HY 2.0 Instruct模型輸入價(jià)上漲463%后再次整體提價(jià)5%,阿里云平頭哥真武810E等算力卡產(chǎn)品上調(diào)5%~34%,百度智能云相關(guān)服務(wù)上調(diào)5%~30%,科大訊飛智算平臺(tái)AI推理服務(wù)漲價(jià)8%,商湯科技SenseCore大模型訓(xùn)練費(fèi)用平均上浮12%,智譜2月以來(lái)3次提價(jià)……近期算力產(chǎn)品全鏈漲價(jià),持續(xù)兩年多的AI“價(jià)格戰(zhàn)”驟然逆轉(zhuǎn)。 這是短期供需錯(cuò)配的周期性波動(dòng),還是AI驅(qū)動(dòng)下的趨勢(shì)性上漲?產(chǎn)業(yè)未來(lái)的競(jìng)爭(zhēng)焦點(diǎn)將落在哪里?近日,記者采訪了工信部信息通信經(jīng)濟(jì)專家委員會(huì)委員盤(pán)和林與中國(guó)信通院云計(jì)算與數(shù)字化研究所總工程師郭亮,深度探尋算力漲價(jià)潮背后的產(chǎn)業(yè)變革趨勢(shì)。 Token激增是算力漲價(jià)潮的“核心引擎” “漲價(jià)的根源是人工智能的需求驅(qū)動(dòng)。”盤(pán)和林認(rèn)為,其中既包括AI訓(xùn)練所帶來(lái)的算力消耗,也包括AI應(yīng)用爆發(fā)所激發(fā)的推理算力需求。 郭亮分析,漲價(jià)包含四方面因素:一是硬件成本“逆向”暴漲。高帶寬內(nèi)存(HBM)存儲(chǔ)與高端芯片處于絕對(duì)賣方市場(chǎng),2026年第一季度存儲(chǔ)價(jià)格翻倍,硬件采購(gòu)及運(yùn)維成本高企。二是需求結(jié)構(gòu)從訓(xùn)練轉(zhuǎn)向推理。隨著AI智能體爆發(fā),推理端的Token調(diào)用量激增。推理屬于持續(xù)性運(yùn)營(yíng)支出,海量并發(fā)帶來(lái)的電力和帶寬成本已超出云廠商的補(bǔ)貼上限。三是商業(yè)模式從“圈地”轉(zhuǎn)向“盈利”。早期算力價(jià)格戰(zhàn)已完成初步生態(tài)綁定,在財(cái)務(wù)壓力下,廠商必須通過(guò)提價(jià)來(lái)覆蓋昂貴的算力折舊。四是算力資源的戰(zhàn)略性稀缺。全球高端算力租賃容量告急,電力配額緊張,供需極度失衡,導(dǎo)致價(jià)格失去下行空間。 此前兩年多時(shí)間里,云廠商以“燒錢(qián)換市場(chǎng)”的邏輯持續(xù)降價(jià),Token成本被壓縮至每百萬(wàn)Token不到一元。但當(dāng)前,復(fù)雜推理讓單日調(diào)用費(fèi)用高達(dá)數(shù)百元,價(jià)格不斷上漲,此前大模型的免費(fèi)公測(cè)也同步結(jié)束。 “行業(yè)集體提價(jià)是從‘燒錢(qián)擴(kuò)規(guī)模’轉(zhuǎn)向‘商業(yè)可持續(xù)’的必然結(jié)果。”郭亮表示,這宣告廉價(jià)算力時(shí)代終結(jié),將進(jìn)入以利潤(rùn)為導(dǎo)向的“價(jià)值重估”階段。 談及價(jià)格競(jìng)爭(zhēng),盤(pán)和林認(rèn)為,此前云計(jì)算廠商尚未發(fā)掘出具有大規(guī)模用戶黏性的AI應(yīng)用場(chǎng)景,多數(shù)廠商采購(gòu)的算力服務(wù)器主要應(yīng)用于AI模型訓(xùn)練環(huán)節(jié),而非直接面向企業(yè)或個(gè)人用戶提供算力服務(wù)支持。今年以來(lái),以“龍蝦熱”“歡樂(lè)馬”為代表的AI開(kāi)源作品涌現(xiàn),憑借其創(chuàng)新性與易用性極大激發(fā)了普通用戶對(duì)云計(jì)算產(chǎn)品的使用熱情,不僅顯著推動(dòng)了Token銷售量的爆發(fā)式增長(zhǎng),更進(jìn)一步帶動(dòng)了算力資源及存儲(chǔ)服務(wù)的整體需求提升。 存儲(chǔ)與芯片是算力價(jià)格上漲的“成本推手” 當(dāng)前,算力產(chǎn)業(yè)鏈的漲價(jià)態(tài)勢(shì)從上游硬件蔓延至下游服務(wù),包括國(guó)內(nèi)外主流云廠商在內(nèi)的數(shù)十家企業(yè),相繼上調(diào)了AI算力及相關(guān)服務(wù)的價(jià)格。那么,在算力產(chǎn)業(yè)鏈中,哪些環(huán)節(jié)是漲價(jià)的根源? 郭亮認(rèn)為:“從算力產(chǎn)業(yè)鏈的結(jié)構(gòu)來(lái)看,存儲(chǔ)供應(yīng)、先進(jìn)封裝、芯片制造和晶圓生產(chǎn)都對(duì)算力漲價(jià)產(chǎn)生了影響。” 具體而言,在存儲(chǔ)供應(yīng)方面,尤其是HBM和高容量閃存方面,隨著模型參數(shù)規(guī)模持續(xù)擴(kuò)大、多模態(tài)交互日益普及,推理任務(wù)對(duì)內(nèi)存帶寬的要求已超越了對(duì)算力本身的追求,比如三星、SK海力士等廠商的HBM產(chǎn)能在2026年之前便已被長(zhǎng)期訂單鎖定。在CoWoS等先進(jìn)封裝技術(shù)方面,盡管晶圓制造產(chǎn)能正在擴(kuò)張,但將計(jì)算芯片與HBM堆疊集成的先進(jìn)封裝工藝擴(kuò)產(chǎn)周期較長(zhǎng)、技術(shù)門(mén)檻較高。即便晶圓供應(yīng)充足,若無(wú)法完成封裝出貨,市場(chǎng)上的算力資源仍將處于缺貨狀態(tài)。在晶圓生產(chǎn)環(huán)節(jié),相比存儲(chǔ)與封裝,先進(jìn)制程的晶圓產(chǎn)能雖同樣緊俏,但在全球主要代工廠大規(guī)模擴(kuò)建的背景下,其產(chǎn)能釋放節(jié)奏相對(duì)可預(yù)期,已不再是當(dāng)前價(jià)格波動(dòng)的主要推手。 “漲價(jià)主要集中在兩個(gè)環(huán)節(jié)。”盤(pán)和林分析說(shuō),“一是算力服務(wù)器本身的價(jià)格上漲,例如英偉達(dá)等廠商的AI算力服務(wù)器;二是云計(jì)算廠商提供的算力及存儲(chǔ)租賃服務(wù)價(jià)格上調(diào)。” 其中,算力服務(wù)器漲價(jià)主要源于兩個(gè)因素:一方面,芯片制造能力受限,核心瓶頸在于光刻機(jī)產(chǎn)能無(wú)法滿足AI產(chǎn)業(yè)快速發(fā)展的需求。另一方面,存儲(chǔ)芯片不足,內(nèi)存芯片自身存在固有產(chǎn)能周期,而AI需求的爆發(fā)式增長(zhǎng)進(jìn)一步加劇了供不應(yīng)求的局面。存儲(chǔ)芯片產(chǎn)能的擴(kuò)張通常需要3年左右,即便考慮到廠商已提前布局,至少也需要1~2年才能有效緩解供給壓力。 算力漲價(jià)是一場(chǎng)加速產(chǎn)業(yè)出清的壓力測(cè)試 “此輪漲價(jià)是一場(chǎng)‘壓力測(cè)試’。”郭亮形象地概括,它將加速產(chǎn)業(yè)出清,告別粗放的發(fā)展時(shí)代,邁向高門(mén)檻、高效率的Token生產(chǎn)和使用“深水區(qū)”。 此輪算力漲價(jià)正在深刻重塑整個(gè)AI產(chǎn)業(yè)鏈的競(jìng)爭(zhēng)格局,對(duì)頭部廠商、中小企業(yè)產(chǎn)生不同影響。 對(duì)于頭部廠商,郭亮認(rèn)為,漲價(jià)將有助于利潤(rùn)與生態(tài)修復(fù)。一方面,提價(jià)緩解了云廠商巨額的算力折舊壓力,使其從“虧損獲客”轉(zhuǎn)向“質(zhì)量增長(zhǎng)”;另一方面,頭部廠商憑借自研芯片帶來(lái)的成本優(yōu)勢(shì),可能進(jìn)一步壓縮二線云服務(wù)商的生存空間,強(qiáng)化自身在算力生態(tài)中的控制地位。 對(duì)于中小企業(yè),盤(pán)和林分析說(shuō):“算力漲價(jià)將顯著增加中小企業(yè)和個(gè)人用戶使用AI的成本。”當(dāng)前,多數(shù)中小企業(yè)主要依賴在云端購(gòu)買算力與存儲(chǔ)資源完成模型訓(xùn)練,為AI應(yīng)用提供算力支持。如果AI能夠產(chǎn)出更多價(jià)值、創(chuàng)造更多利潤(rùn),中小企業(yè)很可能選擇忽視短期成本上升,選擇“AI+”戰(zhàn)略來(lái)提升經(jīng)營(yíng)效率與市場(chǎng)競(jìng)爭(zhēng)力。 郭亮總結(jié)道:“算力產(chǎn)業(yè)高質(zhì)量發(fā)展將加速‘脫虛向?qū)崱!彼懔Τ杀靖咂髮⑹沟谩癙PT創(chuàng)業(yè)”逐漸失去土壤。行業(yè)的投資重心將從純模型研發(fā)轉(zhuǎn)向能夠產(chǎn)生實(shí)際流水、算力投入產(chǎn)出比更高的商業(yè)化場(chǎng)景。 “算力銀行”與“算力超市”將為中小企業(yè)量身減負(fù) 面對(duì)算力供需緊張態(tài)勢(shì),政策端已加速破局。今年4月,工業(yè)和信息化部發(fā)布《關(guān)于開(kāi)展普惠算力賦能中小企業(yè)發(fā)展專項(xiàng)行動(dòng)的通知》,推出“算力銀行”與“算力超市”兩大創(chuàng)新模式,直擊中小企業(yè)算力成本痛點(diǎn)。 郭亮表示:“專項(xiàng)行動(dòng)是針對(duì)2026年AI算力成本激增的問(wèn)題,為中小企業(yè)量身定制的‘減負(fù)’方案,關(guān)鍵在于有效落實(shí)兩項(xiàng)創(chuàng)新業(yè)務(wù)。” “算力銀行”類似金融銀行模式,將散落的閑置算力資源化、標(biāo)準(zhǔn)化、金融化,通過(guò)“零存整取”和跨域調(diào)度實(shí)現(xiàn)普惠供給。 具體分四步:首先,資源歸集(存款),將不同品牌、規(guī)格的算力標(biāo)準(zhǔn)化為“標(biāo)準(zhǔn)算力單元”,像吸收存款一樣,將科研機(jī)構(gòu)、云廠商、企業(yè)的富余算力接入中國(guó)算力平臺(tái)。其次,資源池化(金庫(kù)),利用平臺(tái)將分散的服務(wù)器整合為虛擬資源池,跨地域調(diào)度,平衡波峰波谷,解決“有的地方卡死,有的地方閑死”的問(wèn)題。再次,按需配給(貸款),企業(yè)像申請(qǐng)貸款一樣按需下單。中小企業(yè)通過(guò)“算力券”或按量付費(fèi)等靈活套餐,低成本獲取高性能算力。最后,價(jià)值清算(結(jié)算),建立計(jì)量與返利機(jī)制,提供方獲得收益或未來(lái)優(yōu)先使用權(quán),使用方按實(shí)支付,政府通過(guò)平臺(tái)數(shù)據(jù)實(shí)現(xiàn)精準(zhǔn)補(bǔ)貼。 “一家自動(dòng)駕駛初創(chuàng)公司需要大量算力處理路測(cè)數(shù)據(jù),而某大學(xué)實(shí)驗(yàn)室的算力夜間閑置。通過(guò)算力銀行,實(shí)驗(yàn)室存入算力獲得未來(lái)積分;初創(chuàng)公司用政府發(fā)放的‘算力券’低價(jià)提取算力,避開(kāi)公有云高峰高價(jià)。”郭亮舉例說(shuō)明。 “算力超市”的核心是算力資源的“商品化”與“便捷化”,讓企業(yè)像網(wǎng)購(gòu)一樣獲取AI算力。 其中包括四個(gè)關(guān)鍵環(huán)節(jié):一是資源標(biāo)準(zhǔn)化上架,將底層硬件性能轉(zhuǎn)化為標(biāo)準(zhǔn)化商品,按Token數(shù)、單精度浮點(diǎn)運(yùn)算能力、核時(shí)計(jì)費(fèi)的算力規(guī)格計(jì)算,消除技術(shù)門(mén)檻。二是智能搜索與比價(jià),基于中國(guó)算力平臺(tái)中小企業(yè)專區(qū),實(shí)現(xiàn)動(dòng)態(tài)比價(jià)和算力選型,自動(dòng)推薦成本低、延遲低的算力包,解決信息不對(duì)稱等問(wèn)題。三是開(kāi)箱即用服務(wù),預(yù)裝模型環(huán)境和開(kāi)發(fā)工具,用戶可一鍵部署主流大模型鏡像和數(shù)據(jù)集,實(shí)現(xiàn)“下單即運(yùn)行”,縮短開(kāi)發(fā)周期。四是普惠政策與支付結(jié)算,對(duì)接政府補(bǔ)貼,支持“算力券”直接結(jié)算,提供預(yù)付、后付、包年包月等模式,平臺(tái)承擔(dān)QoS監(jiān)控確保真實(shí)性能。 “如果說(shuō)算力銀行負(fù)責(zé)的是底層的‘資源流動(dòng)’,解決的是‘資源流動(dòng)’問(wèn)題;那么算力超市負(fù)責(zé)的就是前端的‘用戶體驗(yàn)’,解決的是‘交易門(mén)檻’問(wèn)題,讓算力變得看得見(jiàn)、買得起、好上手。”郭亮認(rèn)為,這兩個(gè)創(chuàng)新業(yè)務(wù),將算力從高門(mén)檻的“資本密集型資產(chǎn)”轉(zhuǎn)變?yōu)橄袼㈦娨粯拥摹凹从眉锤缎托畔⒒A(chǔ)設(shè)施”,是中小企業(yè)在2026年算力競(jìng)爭(zhēng)中突圍的關(guān)鍵。 針對(duì)中小企業(yè)的困境,盤(pán)和林建議要做好兩手準(zhǔn)備:一是企業(yè)主動(dòng)與云計(jì)算廠商合作,推動(dòng)傳統(tǒng)算力服務(wù)向“算力超市”“算力銀行”創(chuàng)新模式升級(jí),依托其市場(chǎng)經(jīng)驗(yàn)與資源優(yōu)勢(shì),降低算力基礎(chǔ)設(shè)施建設(shè)成本;二是政府引導(dǎo)國(guó)企跨領(lǐng)域融合金融、通信、算力資源,構(gòu)建業(yè)務(wù)生態(tài)體系。他特別強(qiáng)調(diào),企業(yè)是產(chǎn)業(yè)發(fā)展的核心主體,必須通過(guò)市場(chǎng)化機(jī)制充分激發(fā)其積極性;政府則需配套“算力券”補(bǔ)貼、利率貼息等精準(zhǔn)政策工具,加速創(chuàng)新模式落地生效,最終實(shí)現(xiàn)中小企業(yè)從“被動(dòng)承壓”到“主動(dòng)受益”的實(shí)質(zhì)性轉(zhuǎn)變。 未來(lái)算力產(chǎn)品價(jià)格或?qū)⒈3州^高水平 面向未來(lái),此輪漲價(jià)是周期性波動(dòng)還是趨勢(shì)性上漲? 盤(pán)和林認(rèn)為,答案取決于AI應(yīng)用能否真正創(chuàng)造價(jià)值。算力漲價(jià)的長(zhǎng)期性本質(zhì)取決于AI應(yīng)用的價(jià)值轉(zhuǎn)化能力。若AI僅停留在“玩具”層面,缺乏實(shí)際生產(chǎn)力支撐,此輪漲價(jià)將如曇花一現(xiàn)般短暫;若AI成為驅(qū)動(dòng)產(chǎn)業(yè)變革的生產(chǎn)力工具,其漲價(jià)則將演變?yōu)榫哂谐掷m(xù)性的趨勢(shì)性特征。 基于當(dāng)前產(chǎn)業(yè)態(tài)勢(shì),盤(pán)和林判斷:“趨勢(shì)性價(jià)格上漲的概率更大。”AI仍處于技術(shù)爆發(fā)周期,算力產(chǎn)業(yè)將長(zhǎng)期維持“需求激增—供給滯后”的緊平衡狀態(tài),短期內(nèi)算力供給難以匹配需求增速。然而,未來(lái)尚存不確定性——AI究竟是泡沫還是生產(chǎn)力工具,仍需市場(chǎng)持續(xù)驗(yàn)證。 郭亮提出:“此輪漲價(jià)是‘短期供需錯(cuò)配’與‘長(zhǎng)期成本剛性’共同作用的結(jié)果。”他預(yù)計(jì),算力價(jià)格的高位震蕩將持續(xù)至2027年初。隨著全球先進(jìn)制程產(chǎn)能逐步釋放、CoWoS封裝瓶頸得到突破以及HBM4內(nèi)存的大規(guī)模交付,當(dāng)前由極度缺貨所導(dǎo)致的溢價(jià)將逐步回落。盡管短期內(nèi)的極端漲幅會(huì)趨于平抑,但由于能源成本、地緣政治溢價(jià)以及芯片制造工藝正逼近物理極限,算力的價(jià)格中樞仍將保持在較高水平,其中高性能算力將獲得更多溢價(jià)。 郭亮進(jìn)一步表示,未來(lái)產(chǎn)業(yè)發(fā)展將有三大趨勢(shì)。首先,算力將從通用走向異構(gòu),昂貴的處理器(GPU)不再是唯一解。針對(duì)特定算法優(yōu)化的ASIC專用芯片將大規(guī)模普及,企業(yè)也將不再盲目追求萬(wàn)億參數(shù)級(jí)別的模型,而是通過(guò)模型蒸餾等技術(shù),在更廉價(jià)的算力上實(shí)現(xiàn)高效運(yùn)行。其次,需求重心將從訓(xùn)練轉(zhuǎn)向推理,推理所消耗的Token量將逐步超越訓(xùn)練階段。大規(guī)模推理任務(wù)對(duì)實(shí)時(shí)性和并發(fā)性的要求,使得算力供給必須更加靈活。為降低單次調(diào)用的成本,產(chǎn)業(yè)將加速向低功耗推理芯片及端云協(xié)同模式轉(zhuǎn)型。最后,算力將真正成為“新電力”,實(shí)現(xiàn)基礎(chǔ)設(shè)施化。 “未來(lái)競(jìng)爭(zhēng)的勝負(fù)手,將聚焦‘能源調(diào)度+算力能效+算法優(yōu)化’的綜合成本控制能力。”郭亮判斷,從這個(gè)意義上說(shuō),漲價(jià)正是算力行業(yè)的“成年禮”——它將倒逼整個(gè)產(chǎn)業(yè)從粗放的擴(kuò)張模式轉(zhuǎn)向極致的能效競(jìng)爭(zhēng)。(記者 李瑞璐)
【責(zé)任編輯:朱家齊】