“過(guò)去一臺AI服務(wù)器裝四張顯卡,現在客戶(hù)要的都是能裝八張甚至十張顯卡的高端設備?!?2月18日,在2023?AI?Tech?Day暨首屆人工智能生態(tài)發(fā)展峰會(huì )現場(chǎng),服務(wù)器廠(chǎng)商正展示全新升級的AI大模型服務(wù)器。中國證券報記者在現場(chǎng)了解到,AI大模型迭代速度越來(lái)越快,廠(chǎng)商對智能算力投入大幅增加,支持存儲和訓練的高端AI服務(wù)器的需求激增。不少AI服務(wù)器廠(chǎng)商今年訂單都集中在高端AI服務(wù)器上。?
業(yè)內人士表示,隨著(zhù)AI大模型加速迭代,智能算力已成為稀缺資源。未來(lái)較長(cháng)一段時(shí)間內,我國AI服務(wù)器市場(chǎng)維持供不應求狀態(tài),國產(chǎn)AI芯片市場(chǎng)規模增長(cháng)迎來(lái)關(guān)鍵窗口期。?
高端AI服務(wù)器搶手?
當前,大模型廠(chǎng)商產(chǎn)品迭代如火如荼。據百川智能創(chuàng )始人、CEO王小川介紹,目前百川大模型保持每個(gè)月一次模型數據的迭代。?
AI大模型正帶動(dòng)AI服務(wù)器算力需求持續擴張。安擎計算機相關(guān)負責人告訴記者,2023年,由于行業(yè)投資趨于謹慎,判別式AI應用場(chǎng)景收縮,AI服務(wù)器市場(chǎng)整體銷(xiāo)售臺數同比有所下降,但訂單金額同比將會(huì )呈現增長(cháng)態(tài)勢。這是由于A(yíng)I大模型算力需求集中爆發(fā),成為智能算力的最大需求方。?
“AI大模型廠(chǎng)商都在加快迭代速度,客戶(hù)根本等不起你去建機房,而是希望拎包入住?!兵櫜┕煞莞笨偛?、英博數科CEO周韡韡告訴記者,“我們現在都是找一些已經(jīng)建好的機房,然后把設備放進(jìn)去,快速組網(wǎng),調試好后交付給客戶(hù)。AI大模型的發(fā)展讓人看到的不僅是效率提升,似乎全行業(yè)迭代周期都在縮短?!?
高端AI服務(wù)器設備十分緊俏?!按竽P陀柧毸钄祿ぴ?#xff0c;AI大模型廠(chǎng)商需要的是能夠支持存儲和訓練的高端AI服務(wù)器。因此各服務(wù)器廠(chǎng)商目前都在升級芯片規格、擴大卡組數量,向高端AI服務(wù)器方向升級?!鄙鲜霭睬嬗嬎銠C相關(guān)負責人稱(chēng)。?
我國智能算力資源稀缺。艾瑞咨詢(xún)發(fā)布的《2023年中國智能計算中心行業(yè)發(fā)展白皮書(shū)》顯示,2022年,中國智能算力規模占全部算力的比重為22%;從服務(wù)器結構來(lái)看,2022年,我國通用服務(wù)器占服務(wù)器總量比重為93.2%,而AI服務(wù)器僅占服務(wù)器總量的6.8%。多位業(yè)內人士表示,未來(lái)較長(cháng)一段時(shí)間內,我國AI服務(wù)器市場(chǎng)維持供不應求狀態(tài)。?
算力產(chǎn)業(yè)鏈迎利好?
隨著(zhù)AI大模型算力需求強勁,今年以來(lái),國內算力產(chǎn)業(yè)鏈公司接連斬獲新訂單。?
12月4日,鴻博股份公告稱(chēng),子公司英博數科向百川智能提供一定規模的英偉達智算服務(wù)器,及其所有的算力資源以及配套軟件應用和技術(shù)服務(wù),涉及交易總金額預計達313.82億元。據周韡韡介紹,截至2023年12月,英博數科累計簽約額超18億元。?
公開(kāi)資料顯示,神州數碼在10月29日至11月19日期間共簽訂四筆銷(xiāo)售神州鯤泰品牌昇騰AI服務(wù)器訂單,合同總金額達6.24億元。?
青云科技10月15日公告稱(chēng),公司向高新興訊美科技股份有限公司采購6.84億元GPU服務(wù)器(含配套產(chǎn)品),并與客戶(hù)簽訂6.90億元銷(xiāo)售合同,向其銷(xiāo)售上述GPU服務(wù)器(含配套產(chǎn)品)。?
在A(yíng)I大模型浪潮的帶動(dòng)下,人工智能芯片、服務(wù)器、數據中心市場(chǎng)規模將顯著(zhù)提升。IDC預計,2023年中國人工智能芯片出貨量將達到133.5萬(wàn)片,同比增長(cháng)22.5%。?
人工智能服務(wù)器方面,IDC預計,2023年中國人工智能服務(wù)器市場(chǎng)規模將達到91億美元,同比增長(cháng)82.5%;2027年將達到134億美元,年均復合增長(cháng)率為21.8%。?
智算中心建設步伐加快。據不完全統計,截至2023年8月,全國已有超過(guò)30個(gè)城市建設智算中心。?
中信證券表示,AI的持續發(fā)展拉動(dòng)智能算力需求和建設水平提升,為光模塊、服務(wù)器等領(lǐng)域帶來(lái)持續增長(cháng)機會(huì )。?
做好生態(tài)建設?
AI大模型時(shí)代,進(jìn)口品牌GPU等高端芯片供應面臨周期波動(dòng)挑戰,為國產(chǎn)AI芯片加速推向市場(chǎng)打開(kāi)關(guān)鍵窗口。不過(guò),AI大模型的訓練、推理和海量數據存儲無(wú)一不需要高性能算力支撐,也對國產(chǎn)算力底層基礎設施能力和生態(tài)建設提出考驗。?
艾瑞咨詢(xún)產(chǎn)業(yè)數字化研究院負責人徐樊磊表示,在A(yíng)I大模型爆發(fā)之前,國內的智能算力資源主要用于推理端。AI大模型趨勢到來(lái),使國內廠(chǎng)商開(kāi)始推出訓練端的算力硬件產(chǎn)品和服務(wù),但目前相關(guān)產(chǎn)品能力比起全球領(lǐng)先算力能力仍有較大差距。?
業(yè)內人士表示,在計算層面,由于芯片廠(chǎng)商在開(kāi)發(fā)過(guò)程中使用的技術(shù)路線(xiàn)不同,導致芯片適配服務(wù)器等設備的開(kāi)發(fā)周期普遍很長(cháng)。在訓練層面,單芯片算力有限,而大模型訓練需要大規模的算力集群,需要算力系統具有靈活的算力擴展能力。在存儲層面,多模態(tài)大模型的訓練和推理對存儲提出了更高要求。?
近年來(lái),我國AI算力市場(chǎng)高度依賴(lài)英偉達GPU硬件和相應的軟件生態(tài)。周韡韡坦言,全球90%的AI工程師都在使用英偉達GPU配套的CUDA軟件生態(tài),這和英偉達GPU在全球的壟斷地位完全匹配?!耙恍﹪a(chǎn)GPU計算性能并非絕對不夠,而是若要把國產(chǎn)GPU和基于CUDA架構開(kāi)發(fā)的設備進(jìn)行適配,需要在調試和優(yōu)化上花費大量精力,導致用戶(hù)使用算力的效率下降?!?
然而,隨著(zhù)英偉達芯片進(jìn)口難度不斷提升,國產(chǎn)AI芯片自主創(chuàng )新任重道遠。?
記者梳理發(fā)現,浪潮信息、海光信息、希姆計算、中科通量、瀚博半導體、墨芯人工智能、摩爾線(xiàn)程、天數智芯、寒武紀、燧原科技等芯片公司推出了應用于不同場(chǎng)景的AI推理和訓練任務(wù)的芯片加速卡,涉及CPU、GPU、RISC-V等不同設計架構。?
海光信息表示,海光DCU兼容CUDA生態(tài),對文心一言等大多數國內外主流大模型適配良好。依托DCU可以實(shí)現LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型全面應用。?
如何進(jìn)一步提升國產(chǎn)AI芯片競爭力?中國工程院院士、清華大學(xué)教授鄭緯民認為,要開(kāi)發(fā)基于國產(chǎn)AI芯片的系統,這一過(guò)程中最重要的是做好生態(tài)建設?!皣a(chǎn)AI芯片只要達到國外芯片60%的性能,如果生態(tài)做好了,客戶(hù)也會(huì )滿(mǎn)意?!编嵕暶穹Q(chēng)。?
徐樊磊建議,做好自主創(chuàng )新要從人才、設施、科研和生態(tài)領(lǐng)域四方面突破,逐步提升智能算力設備軟硬件功能。在硬件方面,提高國產(chǎn)AI芯片的穩定性和兼容性,特別是提升芯片之間、服務(wù)器集群之間的數據傳輸效果。在軟件生態(tài)方面,降低適配門(mén)檻,讓開(kāi)發(fā)者逐漸使用國產(chǎn)芯片生態(tài)。
相關(guān)稿件