近日,2024全球開(kāi)發(fā)者先鋒大會(huì )在上海舉行。為期兩天的大會(huì ),匯聚了國內外超過(guò)100家開(kāi)發(fā)者社區、100余家知名投資機構。OpenAI前高管扎克·卡斯、硅谷“創(chuàng )投之父”史蒂夫·霍夫曼等“大咖”也來(lái)滬與全球開(kāi)發(fā)者交流。在此次大會(huì )的舉辦地徐匯濱江,上海首個(gè)大模型創(chuàng )新生態(tài)社區已然成形。僅僅成立半年,就吸引了近60家大模型企業(yè),以及200余家產(chǎn)業(yè)鏈上下游企業(yè)資源匯聚。
以應用牽引,發(fā)布市級應用場(chǎng)景;培育生態(tài),做好算力、數據等關(guān)鍵要素供應;加大開(kāi)源、開(kāi)放力度,降低廣大創(chuàng )新創(chuàng )業(yè)團隊和中小企業(yè)的大模型訓練門(mén)檻……近年來(lái),上海積極培育人工智能產(chǎn)業(yè)沃土,逐漸成為大模型產(chǎn)業(yè)高密度創(chuàng )新的苗圃基地。
大模型產(chǎn)業(yè)“風(fēng)起云涌”
大會(huì )上,上海人工智能實(shí)驗室領(lǐng)軍科學(xué)家林達華用“風(fēng)起云涌”來(lái)形容近幾年全球大模型產(chǎn)業(yè)的發(fā)展。
2022年,ChatGPT橫空出世,大模型開(kāi)始走入大眾視野,成為全球焦點(diǎn)。2023年2月,Meta公司發(fā)布LLaMa并催生發(fā)展出開(kāi)源社區,大模型從“只會(huì )聊天的工具”,變成了有可能會(huì )進(jìn)入到“嚴肅生產(chǎn)領(lǐng)域”的生產(chǎn)力。邁入2024年,Sora的出世、Claude 3.0展現出的強大推理能力,以及馬斯克剛剛開(kāi)源的Grok,都代表著(zhù)整個(gè)行業(yè)處在“方興未艾”的賽道。
“大模型行業(yè)的發(fā)展有兩個(gè)非常重要的驅動(dòng)力量。一個(gè)是源于所有研究者和從業(yè)者對于技術(shù)理想的追求,不斷突破邊界,尋求越來(lái)越接近AGI(Artificial General Intelligence,人工通用智能)的大模型;同時(shí)產(chǎn)業(yè)界也看到了大模型帶來(lái)產(chǎn)業(yè)革命的可能性,無(wú)數企業(yè)投入巨大資源到這個(gè)賽道中。兩股力量交織在一起,形成了我們今天看到的大模型產(chǎn)業(yè)‘波瀾壯闊’的局面?!绷诌_華表示。
而在國內,大模型產(chǎn)業(yè)的發(fā)展同樣突飛猛進(jìn)。去年3月份,百度發(fā)布“文心一言”,此后,阿里巴巴的“通義千問(wèn)”、科大訊飛星火大模型、騰訊混元大模型陸續發(fā)布上線(xiàn)?;ヂ?lián)網(wǎng)大廠(chǎng)之外,華為、京東、字節跳動(dòng)、商湯科技,乃至三大電信運營(yíng)商、各科研院所和高校的大模型產(chǎn)品也不斷推出。有統計數據顯示,中國研發(fā)大模型的公司已有100多家,邁入“百模大戰”階段。
同時(shí),大模型行業(yè)也在不斷涌現出新的課題。以算力為例,微軟原全球執行副總裁沈向洋稱(chēng),發(fā)展大模型產(chǎn)業(yè),算力是門(mén)檻。隨著(zhù)大模型參數的增加,對算力的需求幾乎是幾何級增長(cháng)的。另外,包括ChatGPT在內,大模型還帶來(lái)了“一本正經(jīng)地胡說(shuō)八道”、“深度偽造”等倫理問(wèn)題,需要各方加強治理。
此外,當前主流的大模型都是建立在Transformer架構堆疊的基礎上,但這一架構對計算資源的消耗特別大。騰訊混元大模型算法負責人康戰輝表示,當下越來(lái)越多的企業(yè)看到了MoE(即:混合專(zhuān)家模型)展現出來(lái)的優(yōu)良特性,未來(lái)可能還會(huì )有更加高效的架構出來(lái)。
產(chǎn)業(yè)應用“繁花綻放”
有行業(yè)人士將2024年比作大模型應用的“元年”,認為行業(yè)的競爭焦點(diǎn)正在從基礎模型到應用遷移。從目前來(lái)看,大模型確實(shí)已經(jīng)落地到各行各業(yè),生根發(fā)芽。
“大模型+科學(xué)”可以產(chǎn)生哪些化學(xué)反應?上海人工智能實(shí)驗室青年科學(xué)家白磊介紹,實(shí)驗室發(fā)布“風(fēng)烏”大模型,可用以預測氣象。由于大氣系統的復雜性,全球中期天氣預報的有效性每10年才提高1天。此前,全球范圍內最好的物理模型有效預報時(shí)長(cháng)最大為8.5天,而“風(fēng)烏”達到了10.75天,且預測時(shí)間僅需30秒。
機器人與大模型的結合領(lǐng)域“具身智能”也是熱點(diǎn)?!皞鹘y的機器人需要編程,需要寫(xiě)固定的代碼,造成之前的人機交流非常僵硬?,F在,我們告訴機器人它的手臂快碰到天花板了,在沒(méi)有任何方向性指示的情況下,它能夠理解,且做出正確反應。這在傳統的機器人編程中,是不可想象的。我們期待,大模型能給機器人一顆通用的大腦?!?中電科21所高級專(zhuān)家劉一帆表示。
“過(guò)去藝術(shù)家們通過(guò)AI軟件進(jìn)行藝術(shù)作品的設計,今天有更多的藝術(shù)家通過(guò)AI完成藝術(shù)作品的創(chuàng )作。此外,從去年下半年開(kāi)始,包括電商、營(yíng)銷(xiāo)等領(lǐng)域,也有非常多的大模型產(chǎn)品涌現出來(lái)?!敝窍笪磥?lái)產(chǎn)品總監弓子健說(shuō)。
林達華認為,圍繞大模型應用,產(chǎn)業(yè)分工會(huì )逐漸形成?!白龌A模型的企業(yè)并不會(huì )壟斷一切。如果從業(yè)者能夠憑借自己在行業(yè)里積累的數據和經(jīng)驗,并基于自身的資源稟賦和數據優(yōu)勢積極尋找差異化發(fā)展路徑,最終形成競爭力,我們的大模型產(chǎn)業(yè)一定會(huì )‘一路繁花’?!?/p>
著(zhù)力建設“大模型之都”
人工智能是上海重點(diǎn)發(fā)展的三大先導產(chǎn)業(yè)之一。伴隨著(zhù)新一代人工智能的發(fā)展,大模型熱潮掀起,上海正在著(zhù)力建設“大模型之都”。
懷著(zhù)“栽好梧桐樹(shù),引得鳳凰來(lái)”的美好愿景,上海以徐匯西岸為核心,啟動(dòng)了首個(gè)人工智能發(fā)展集聚區建設。如今,作為上海首個(gè)大模型創(chuàng )新生態(tài)社區,誕生于徐匯人工智能產(chǎn)業(yè)沃土的“模速空間”,已成為大模型產(chǎn)業(yè)高密度創(chuàng )新的苗圃基地。
上海徐匯區委常委、副區長(cháng)俞林偉對“模速空間”名字的由來(lái)進(jìn)行了解釋。他說(shuō),“‘?!馕吨?zhù)成千上萬(wàn)的開(kāi)發(fā)者在這里創(chuàng )新創(chuàng )業(yè),百花齊放。這里是場(chǎng)景的試驗田,也是應用的孵化器?!佟瘎t指通過(guò)市、區攜手,為企業(yè)提供全方位的加速服務(wù)?!?/p>
轉眼間,“模速空間”掛牌已近半年。如今有超過(guò)60家大模型企業(yè)與他們身后200余家產(chǎn)業(yè)鏈上下游企業(yè)的資源匯聚在黃浦江畔這一方天地。
對于大模型企業(yè)來(lái)說(shuō),數據的體量、質(zhì)量、多樣性缺一不可,均對大模型能力的提升有重要意義。如何能夠生產(chǎn)大規模、高質(zhì)量的數據,也是各個(gè)大模型研發(fā)機構某種意義上“競爭壁壘”所在。
此外,算力同樣重要,不管是大模型研發(fā)企業(yè),還是應用類(lèi)公司,高算力成本都令人頭痛。如何提供普惠的算力,通過(guò)較低成本把大模型在垂直行業(yè)真正用起來(lái),讓更多的中小企業(yè)、個(gè)人開(kāi)發(fā)者加入大模型的開(kāi)發(fā)中,也是行業(yè)關(guān)注的問(wèn)題。
記者了解到,“模速空間”五個(gè)公共服務(wù)平臺作為“土壤雨露”,可為創(chuàng )新企業(yè)提供開(kāi)放數據、算力調度、能力評測、備案輔導、融資服務(wù)等公共服務(wù),提供關(guān)鍵要素保障。
以算力調度平臺為例,“模速空間”聯(lián)合運營(yíng)商和云廠(chǎng)商共同保障大模型企業(yè)算力,目前商湯、儀電、火山超5萬(wàn)張GPU可供調配。其開(kāi)放數據平臺依托浦江實(shí)驗室牽頭的大模型語(yǔ)料數據聯(lián)盟,持續開(kāi)源發(fā)布高質(zhì)量數據集,數據總量近5TB,下載量近14萬(wàn)次,行業(yè)覆蓋10余類(lèi)。
面向未來(lái),大模型產(chǎn)業(yè)的發(fā)展尚有許多挑戰。對此,上海已明確,未來(lái)將加強核心技術(shù)的突破,推動(dòng)智能芯片關(guān)鍵技術(shù)和應用適配,打造更多元開(kāi)放的智能計算生態(tài)。同時(shí),完善標準體系、安全準則、倫理規范,推動(dòng)人工智能、區塊鏈、元宇宙等前沿技術(shù)的開(kāi)發(fā)和應用。
上海市副市長(cháng)陳杰表示,未來(lái)上海將進(jìn)一步加大開(kāi)源開(kāi)放的力度,探索大模型的新型開(kāi)源和推廣模式,以降低廣大創(chuàng )新創(chuàng )業(yè)團隊、中小企業(yè)等大模型訓練的門(mén)檻,推出更多具有示范性、標志性的應用場(chǎng)景,來(lái)牽引大模型在金融、教育、醫療、制造等典型領(lǐng)域的垂直應用。(記者 杜康 上海報道)
相關(guān)稿件