算力是數字經(jīng)濟的底座,一個(gè)國家適度超前布局算力基礎設施建設,有重要意義。
第三方市場(chǎng)調研機構IDC在《2021-2022全球計算力指數評估報告》中分析了包括美國、中國等15個(gè)重點(diǎn)國家的算力指數(根據多項指標測算的算力綜合指數)得出的結論是:算力指數平均每提高1點(diǎn),國家的數字經(jīng)濟和GDP將分別增長(cháng)3.5‰和1.8‰。
每一代網(wǎng)絡(luò )基礎設施都會(huì )催生新一代產(chǎn)業(yè)。不同算力基礎設施上,也會(huì )誕生不同的軟件。3G、4G網(wǎng)絡(luò )讓移動(dòng)互聯(lián)網(wǎng)誕生。在傳統的CPU算力上誕生了云。以GPU為代表的AI算力,則催生了ChatGPT和AI大模型。
2022年12月,微軟投資的AI創(chuàng )業(yè)公司OpenAI推出了聊天機器人ChatGPT。ChatGPT本質(zhì)是OpenAI自主研發(fā)的GPT-3.5語(yǔ)言大模型,該大模型包含近1800億個(gè)參數。2023年3月15日,OpenAI將該大模型迭代至GPT-4.0。GPT-3.5只是單模態(tài)大模型,只能回復文本。但GPT-4.0是多模態(tài)大模型,能同時(shí)實(shí)現圖像、文本輸入。GPT-4.0的回復準確度、語(yǔ)義理解力大幅提升。
今年2月,阿里、百度等中國企業(yè)宣布將研發(fā)類(lèi)ChatGPT產(chǎn)品,或將投入生成式AI的研發(fā)。3月16日,百度發(fā)布了對標ChatGPT的大語(yǔ)言模型“文心一言”。不過(guò),目前中國企業(yè)對外發(fā)布的大模型普遍是單模態(tài)的,且普遍面臨GPU算力不足的挑戰。
《財經(jīng)》在3月初與三位技術(shù)背景出身的專(zhuān)家進(jìn)行了一場(chǎng)對話(huà)。他們經(jīng)歷了中國產(chǎn)業(yè)技術(shù)發(fā)展的不同階段,擁有不同領(lǐng)域的專(zhuān)業(yè)視角。這場(chǎng)對話(huà)的主題是,“中國離算力自由有多遠”。我們在這場(chǎng)對話(huà)中探討了三大問(wèn)題:
智能算力是什么,為何興起?智能算力會(huì )帶來(lái)哪些產(chǎn)業(yè)變革?中國要如何科學(xué)規劃算力產(chǎn)業(yè)?
對話(huà)人簡(jiǎn)介:
新華三集團副總裁、計算存儲產(chǎn)品線(xiàn)總裁 徐潤安(新華三是國內重要的數字化解決方案提供商。新華三提供計算、存儲、網(wǎng)絡(luò )、5G、安全、終端等數字化基礎設施,客戶(hù)覆蓋百行百業(yè))
百度杰出系統架構師 王雁鵬(百度智能云業(yè)務(wù)2022年營(yíng)收177億元,正在成為集團的第二增長(cháng)曲線(xiàn)。3月16日,百度發(fā)布了對標ChatGPT的大語(yǔ)言模型“文心一言”)
獨立分析師,數字化行業(yè)專(zhuān)家 寧宇
主持人:《財經(jīng)》雜志副主編 謝麗容
以下是對話(huà)實(shí)錄精華版:
智能算力是什么,為何興起?
《財經(jīng)》謝麗容:ChatGPT的風(fēng)靡讓大家關(guān)注智能算力,就像多年前谷歌的AlphaGo戰勝?lài)迨澜绻谲姇r(shí),讓普通人認識了人工智能,算力是什么?尤其智能算力是什么?它是一種什么樣的資源?
寧宇:算力是通過(guò)對信息數據進(jìn)行處理,實(shí)現目標結果輸出的計算能力。算力會(huì )和算法、存儲一起構成我們數字社會(huì )的基礎。
徐潤安:大眾意義上理解的通用算力是CPU(中央處理器)。無(wú)論個(gè)人使用的電腦、手機,企業(yè)使用的服務(wù)器都最關(guān)心CPU主頻性能。這是衡量算力的一個(gè)重要指標。但數字化正在讓算力需求發(fā)生變化。CPU作為通用算力,已經(jīng)無(wú)法完全滿(mǎn)足新需求。異構算力,比如GPU(圖形處理器)、DPU(深度學(xué)習處理器)、NPU(神經(jīng)網(wǎng)絡(luò )處理器)通常被用來(lái)處理AI計算的需求。所以通常也被稱(chēng)為智能算力。
王雁鵬:智能算力和通用算力采用了不同的計算方法。以CPU為代表的通用算力,善于執行邏輯指令進(jìn)行高效率的計算。GPU為代表的智能算力,善于處理大量無(wú)邏輯關(guān)系數據的并行計算。
AI訓練和推理通常不涉及復雜控制指令,卻又依賴(lài)大量數據的并行運算。GPU/DPU/NPU這些專(zhuān)用處理器因此誕生。在過(guò)去的計算體系結構中,CPU要處理所有工作?,F在的計算體系結構形成了不同的分工。GPU/DPU/NPU會(huì )針對不同的場(chǎng)景去做深度的優(yōu)化定制。
《財經(jīng)》謝麗容:ChatGPT這類(lèi)AI應用正在讓智能算力需求爆發(fā)。2022年中國服務(wù)器出貨量約380萬(wàn)臺,AI服務(wù)器出貨量超25萬(wàn)臺,在大盤(pán)中占比約6.5%。哪些行業(yè)、哪些領(lǐng)域對智能算力有強需求?
徐潤安:典型的使用場(chǎng)景包括互聯(lián)網(wǎng)的搜索和推薦、零售電商業(yè)務(wù)數據分析;政府的智慧城市及治理,比如新華三已經(jīng)為杭州濱江、呼和浩特等60余個(gè)地市通過(guò)城市大腦進(jìn)行公共事務(wù)的輔助決策;自動(dòng)駕駛的仿真訓練,需要大量真實(shí)道路數據進(jìn)行模擬學(xué)習。
王雁鵬:百度在A(yíng)I領(lǐng)域投入很久,云業(yè)務(wù)標簽是“智能云”。我們提出了一個(gè)理念,叫AINative(AI原生)。也就是說(shuō),千行百業(yè)都可以使用AI算力和模型訓練。例如,金融機構反欺詐、鋼鐵工廠(chǎng)AI質(zhì)檢、能源企業(yè)的線(xiàn)路檢修都采用了百度類(lèi)似深度應用。這個(gè)趨勢未來(lái)會(huì )給各行業(yè)帶來(lái)翻天覆地的變化。不過(guò),這需要一段時(shí)間。
《財經(jīng)》謝麗容:這么多領(lǐng)域都要用到智能算力,那么資源相對充沛的通用算力是不能用,還是效率跟不上?從客戶(hù)需求來(lái)看,智能算力占比已經(jīng)超過(guò)甚至替代通用算力了?
徐潤安:這是計算效率的問(wèn)題。最常見(jiàn)的CPU算力是x86服務(wù)器芯片。x86芯片單核性能強、通用性好,但是AI場(chǎng)景通常需要多核、高并發(fā)、高帶寬的芯片。綜合考慮成本、效率,GPU/DPU/NPU這些專(zhuān)用處理器通常會(huì )處理得更好。
現代計算機是遵循馮·諾依曼架構設計的,這套架構已經(jīng)延續70多年??梢源_定的是,CPU作為中央處理器的地位在短期內不會(huì )改變。只是在數據挖掘等場(chǎng)景下,CPU的職能被其他專(zhuān)用芯片分擔了。CPU、GPU及其他AI芯片,這三種蛋糕的比例會(huì )有變化。不過(guò)未來(lái)會(huì )誕生新的計算機架構。
現在有一種理念叫做“多元算力”。過(guò)去10年大家通常只談x86計算架構。但計算芯片和計算進(jìn)程都在多元化,這是必然的趨勢。
王雁鵬:簡(jiǎn)單理解的話(huà),CPU像是大腦,它需要完成復雜的邏輯。GPU/DPU/NPU這些專(zhuān)用芯片就像四肢。它們不需要腦子太發(fā)達,只需要四肢足夠強壯,去解決需要解決的工作。
《財經(jīng)》謝麗容:把CPU/GPU/DPU/NPU這些算力資源組合在一起,什么樣的組合才是效率最高的?專(zhuān)用芯片是不是需要足夠大的規模,成本才會(huì )下降?
寧宇:通常情況下,特殊需求一定要足夠大的規模,才能支撐起專(zhuān)用芯片。專(zhuān)用芯片,需要規?;\作,才能更經(jīng)濟。多元算力持續增長(cháng),專(zhuān)用需求規?;瘮U張。這才會(huì )讓專(zhuān)用芯片的研發(fā)、生產(chǎn)、制造需求也不斷擴大。另一種場(chǎng)景是,傳統芯片無(wú)法完成新的工作。因此,哪怕成本更高,也需要用專(zhuān)用芯片去解決,企業(yè)自然而然也會(huì )去使用專(zhuān)用芯片。
徐潤安:是否使用專(zhuān)用芯片其實(shí)是種商業(yè)考量。所有活動(dòng)都要考慮投入產(chǎn)出比,追根溯源還是效率問(wèn)題。專(zhuān)門(mén)為一個(gè)算法或一個(gè)場(chǎng)景研發(fā)專(zhuān)用芯片,前提是可以產(chǎn)生足夠的效益,最終能覆蓋研發(fā)和制造成本。過(guò)去幾十年,x86架構芯片的生產(chǎn)成本降到了很低,因此CPU無(wú)法被替代。但是大模型和其他業(yè)務(wù)場(chǎng)景的出現,專(zhuān)用芯片的綜合計算效率更高,使得其他廠(chǎng)商有機會(huì )研發(fā)生產(chǎn)專(zhuān)用芯片。
《財經(jīng)》謝麗容:專(zhuān)用芯片需要面臨成本、效率這個(gè)矛盾。ChatGPT背后的AI大模型和生成式AI是不是也需要面臨類(lèi)似的矛盾?如何解決這些問(wèn)題?
王雁鵬:阻礙上一代AI技術(shù)大規模落地的瓶頸有三個(gè)。一是企業(yè)需要針對不同業(yè)務(wù)場(chǎng)景,定制不同的算法,研發(fā)成本很高。二是,AI的后面是人工,企業(yè)需要耗費大量人工去標注數據,人力有限且成本高昂。三是,語(yǔ)音、圖像、自然語(yǔ)言分別有不同的研究框架,三者無(wú)法融合。
大模型代表了新一代AI技術(shù),帶來(lái)了里程碑式的變化,解決了三個(gè)核心問(wèn)題。一是,一個(gè)通用的算法就可以應對過(guò)去數十種場(chǎng)景,落地空間變得更大。二是,數據無(wú)需人工標注,大量數據可以得到自動(dòng)訓練,而且模型結構是統一的。三是,語(yǔ)音、圖像、自然語(yǔ)言可以實(shí)現多模態(tài)融合,三者互相關(guān)聯(lián)。AI的思考方式會(huì )更符合人類(lèi)認知方式。上述三個(gè)變化,更通用的模型、大規模數據訓練、多模態(tài)融合,會(huì )帶來(lái)AI技術(shù)的井噴和AI應用的爆發(fā)。
寧宇:過(guò)去AI模型往往用于專(zhuān)業(yè)領(lǐng)域、專(zhuān)業(yè)場(chǎng)景。大模型讓AI能夠成為通用工具平臺,應對足夠多的場(chǎng)景。上層AI應用使用規模變大,會(huì )激發(fā)AI算力的需求,進(jìn)而會(huì )使得下層硬件可以衍生出專(zhuān)用AI場(chǎng)景的芯片、服務(wù)器。這是一個(gè)從專(zhuān)業(yè)到通用再到專(zhuān)業(yè)的產(chǎn)業(yè)循環(huán)。
徐潤安:AI從水平場(chǎng)景影響到了應用、硬件一個(gè)個(gè)不同的層次,這使得業(yè)務(wù)既解耦又打通。比如,底層的智能算力可以提供專(zhuān)用芯片,進(jìn)一步降低上層AI應用的成本。
智能算力會(huì )帶來(lái)哪些產(chǎn)業(yè)變革?
《財經(jīng)》謝麗容:AI技術(shù)這輪演變和創(chuàng )新會(huì )帶來(lái)大量新的機會(huì ),其中誰(shuí)會(huì )受益?是不是會(huì )有一批優(yōu)秀的創(chuàng )業(yè)公司誕生?未來(lái)會(huì )形成怎樣的產(chǎn)業(yè)生態(tài)?
徐潤安:生成式AI爆發(fā)會(huì )帶來(lái)巨大的算力消耗,那么第一輪機會(huì )是ICT企業(yè)的。頭部企業(yè)投入大模型研發(fā),對新華三這種ICT企業(yè)來(lái)說(shuō)就是機會(huì )。我們有更多機會(huì )服務(wù)好這些頭部客戶(hù),為他們建設基礎設施。
第二輪機會(huì )是頭部大公司的。頭部廠(chǎng)商開(kāi)發(fā)出大模型之后,可以利用平臺對外賦能。對外服務(wù)的過(guò)程,也是這些大公司受益的過(guò)程。
第三輪機會(huì )是各類(lèi)創(chuàng )業(yè)公司的。大公司研發(fā)出大模型后,會(huì )形成平臺生態(tài)。大量公司在平臺上,針對千行百業(yè)研發(fā)上層AI應用。黃教主(英偉達CEO黃仁勛)說(shuō),ChatGPT相當于iPhone。iPhone帶來(lái)了移動(dòng)互聯(lián)網(wǎng)的爆發(fā),大模型也是類(lèi)似的。這個(gè)過(guò)程中會(huì )有起有伏,有人成功有人失敗,但一定會(huì )有最終的受益者。
王雁鵬:在A(yíng)I領(lǐng)域,百度有芯片、框架、大模型和應用的全面積累。
我認為未來(lái)可能會(huì )形成三層生態(tài)?;A層是提供基礎大模型服務(wù)的企業(yè),只有大公司才有能力。因為這需要長(cháng)期投入,如資金、人力和技術(shù)積淀。第二層主要是各領(lǐng)域的公司。一些公司有較強的行業(yè)研究能力,可以基于大模型做各領(lǐng)域的專(zhuān)業(yè)應用。第三層是開(kāi)發(fā)者。他們只需要放開(kāi)手腳,把應用做好。開(kāi)發(fā)者一定是更繁榮和開(kāi)放的生態(tài)。
寧宇:大模型可能會(huì )讓AI產(chǎn)業(yè)出現類(lèi)似移動(dòng)互聯(lián)網(wǎng)誕生前后的產(chǎn)業(yè)變革。早年通信設備商為電信運營(yíng)商提供硬件,中國移動(dòng)、中國聯(lián)通、中國電信鋪設3G、4G高速通信網(wǎng)絡(luò )?;A設施建設完成后,移動(dòng)互聯(lián)網(wǎng)群雄并起。微信、淘寶、支付寶這些APP都因此誕生。
AI產(chǎn)業(yè)在中國發(fā)展很快,現在新華三這類(lèi)企業(yè)為大廠(chǎng)提供硬件,助力建設算力中心,大廠(chǎng)建成大模型,大模型上會(huì )雨后春筍般孵化出AI應用。AI產(chǎn)業(yè)鏈會(huì )重構,大中小企業(yè)都可以找到自己的定位。所以,黃教主才會(huì )說(shuō),ChatGPT出現不亞于iPhone誕生給產(chǎn)業(yè)帶來(lái)的沖擊。
要如何科學(xué)規劃算力產(chǎn)業(yè)?
《財經(jīng)》謝麗容:ChatGPT出現后,國內部分企業(yè)正在開(kāi)始追趕。但也有人質(zhì)疑,我們的算力、算法、數據實(shí)力能不能支撐中國做好類(lèi)似的應用?
王雁鵬:在A(yíng)I領(lǐng)域,中國和美國是絕對領(lǐng)先的。當前中國算力的確受到了一定制約。但從長(cháng)線(xiàn)來(lái)看,一定可以突破,我對此有信心。接下來(lái)的挑戰是,數據是不是夠多??陀^(guān)現狀是,中文數據豐富度小于英文,但模型的邏輯推理能力可以彌補這個(gè)短板。
寧宇:算力、算法、數據,這些要素其實(shí)中國都有。我們未來(lái)的問(wèn)題是監管這類(lèi)非技術(shù)因素。訓練內容如何監管、應用場(chǎng)景如何適配、社會(huì )如何跟進(jìn)技術(shù)發(fā)展,這都是挑戰。
《財經(jīng)》謝麗容:ChatGPT這類(lèi)生成式AI應用和大模型正在涌現。面向未來(lái),中國應該如何科學(xué)地規劃自己的算力產(chǎn)業(yè)?
王雁鵬:我們希望,算力的供給能像水電一樣簡(jiǎn)單。以CPU為代表的通用算力有標準的軟件、接口,在云上已接近水電。但是GPU/DPU/NPU這些異構算力,軟件復雜度越來(lái)越高。它的使用并不像CPU那樣簡(jiǎn)單。這意味著(zhù)我們需要芯片、框架、模型、應用都一體化整合發(fā)展。這樣才能把智能算力也變成CPU算力一樣標準化的水電資源。
徐潤安:我們需要摒棄過(guò)去幾十年看待算力的視角。過(guò)去是攤大餅似的買(mǎi)設備,堆砌算力,這種發(fā)展模式太粗放了。一方面我們需要應對多元算力的發(fā)展趨勢,讓算力得到更高效使用。另一方面,算力對電力消耗很大,所以這也催生了東數西算這樣的政策規劃。
此外,中國一直在提“算力網(wǎng)絡(luò )”概念,思考如何把國內的數據中心跨區域連接在一起。這是個(gè)系統工程。如果算力網(wǎng)絡(luò )建成,算力、存儲、網(wǎng)絡(luò )都可以統一調度,那么它會(huì )成為數字化變革的核心。新華三在去年推出了H3CUniServerG6新一代AI服務(wù)器,為此還搭配了智能管理中樞,這就像是算力操作系統?,F在的異構算力太多了,我們希望彌補這些鴻溝,讓企業(yè)能更簡(jiǎn)單、高效地使用AI算力。
寧宇:算力作為資源需要整體分配。對企業(yè)來(lái)說(shuō),需要不斷降低算力成本。對國家來(lái)說(shuō),需要對產(chǎn)業(yè)鏈的不同角色進(jìn)行重新定位。東數西算與碳中和等其他國家戰略是相互匹配的。就像中國建設高鐵、4G/5G網(wǎng)絡(luò )一樣,算力基礎設施建設也要有規劃。既要讓成本足夠經(jīng)濟,又要讓地區平衡發(fā)展,還要協(xié)調算力基建、AI應用的供需節奏。
把分散的服務(wù)器、數據中心簡(jiǎn)單匯總計算出中國總體算力,這種統計方式便于操作。但我個(gè)人并不完全贊同拿浮點(diǎn)運算總數去衡量一個(gè)國家的算力能力。政策方提“算力網(wǎng)絡(luò )”、“云網(wǎng)融合”概念,是因為算力相連成網(wǎng)絡(luò )之后才有意義。這就像局域網(wǎng)不成體系,互聯(lián)網(wǎng)才能創(chuàng )造產(chǎn)業(yè)價(jià)值。
《財經(jīng)》謝麗容:以電信行業(yè)為例,中國普通人的的通信自由,不為流量資費發(fā)愁的日子似乎是從4G開(kāi)始的。對中國來(lái)說(shuō),什么是算力自由?算力自由是什么狀態(tài)?
王雁鵬:我理解的算力自由是,算力要支撐算法的發(fā)展,不要限制人類(lèi)的想象力。從歷史發(fā)展來(lái)看,大型機/小型機被x86架構芯片取代,原因是大型機/小型機太昂貴,無(wú)法建成互聯(lián)網(wǎng)和云計算?;ヂ?lián)網(wǎng)讓廉價(jià)的x86架構芯片最終一統天下。Google在2003年-2006年發(fā)表的三篇論文又為云計算奠定理論基礎——用廉價(jià)的通用計算設備(x86架構,Linux系統)搭建低成本的計算集群。每個(gè)時(shí)代都可以重構不同的計算模式。這需要百度、新華三等企業(yè)在不同領(lǐng)域跨產(chǎn)業(yè)層的努力。
寧宇:第一是便宜,第二是易用。每一代通信技術(shù)迭代的周期是10年左右。電信運營(yíng)商在這個(gè)周期內,一方面要保證經(jīng)營(yíng)能夠覆蓋基站的建設、維護成本,另一方面要讓用戶(hù)增長(cháng)和網(wǎng)絡(luò )規模同步發(fā)展。在這兩個(gè)平衡的前提下提速降費,實(shí)現通信自由。未來(lái)如果有算力運營(yíng)商,或者說(shuō)是今天的云計算廠(chǎng)商,國家需要有宏觀(guān)政策指導產(chǎn)業(yè)演進(jìn)。讓資源供給、市場(chǎng)需求以及運營(yíng)商的收入能夠實(shí)現良好的匹配。
徐潤安:算力自由不是簡(jiǎn)單的攤大餅,核心是供需平衡。和通信產(chǎn)業(yè)不同的是,通信技術(shù)10年一次迭代,但算力是3年-5年一次,因為服務(wù)器的平均使用周期大約是4年。這會(huì )導致算力運營(yíng)商的成本是偏高的。算力設備采購后,3年內必須充分發(fā)揮作用。如果算經(jīng)濟賬,這會(huì )帶來(lái)很大的挑戰。
關(guān)于算力的技術(shù)演進(jìn),這需要端到端的優(yōu)化,產(chǎn)業(yè)鏈從上到下打破這壁壘。新華三和這類(lèi)云計算廠(chǎng)商、三大電信運營(yíng)商都需要探討這些需求。我們不能只生產(chǎn)、提供設備,我們需要對未來(lái)做出預測,進(jìn)行適當的投入,提前做技術(shù)布局。
相關(guān)稿件