大模型,洗牌開(kāi)始了AI大模型扇動(dòng)翅膀,掀起了歷史的波瀾。但沒(méi)人想到,浪潮僅僅卷過(guò)半年,就將迎來(lái)一次徹底的大洗牌。去年11月30日,ChatGPT正式發(fā)布,2個(gè)月用戶(hù)過(guò)億。今年6月,ChatGPT流量開(kāi)始下滑。網(wǎng)站與移動(dòng)客戶(hù)端流量環(huán)比下跌9.7%,用戶(hù)在網(wǎng)站的使用時(shí)長(cháng)下降8.5%。這被解讀成AI泡沫的一個(gè)征兆:初期新鮮感消失,AI要回到現實(shí);另一猜測,是OpenAI的對手強者如云,它并沒(méi)有真正的技術(shù)護城河。
谷歌內部文件泄密泄露:我們沒(méi)有護城河,OpenAI也沒(méi)有OpenAI迅速給GPT-4安排上Code Interpreter功能,賺足一波眼球?!斑@就是GPT-4.5!”人們歡呼。然而,Meta(前Facebook)突然動(dòng)手,直接將自己的大語(yǔ)言模型Llama 2開(kāi)源了。Llama 2的水平在GPT-3之上。它的免費開(kāi)源商用,簡(jiǎn)直是一次殺手級的突襲,堪稱(chēng)“AI大模型的安卓時(shí)刻”。這意味著(zhù),許多公司尚在研發(fā)的大模型,已被淘汰了。因為別人可以直接用開(kāi)源模型,免費的。國內的AI進(jìn)程,更加熱火朝天。今年3月,百度首個(gè)發(fā)布了“文心一言”,開(kāi)啟國產(chǎn)大模型“超越ChatGPT”之路。120天狂飆突進(jìn),互聯(lián)網(wǎng)科技公司、學(xué)術(shù)界大牛、大廠(chǎng)創(chuàng )業(yè)者、地方國家隊紛紛下場(chǎng)。國內發(fā)布了79款10億參數以上的大模型。
不過(guò),行業(yè)和專(zhuān)家都提出了質(zhì)疑:這么多的大模型,同質(zhì)化嚴重嗎?誰(shuí)的技術(shù)更強?誰(shuí)在更快進(jìn)入產(chǎn)業(yè),解決問(wèn)題?這個(gè)風(fēng)頭上,國際數據公司IDC發(fā)布了《AI大模型技術(shù)能力評估報告,2023》,想要設立一些標準。IDC圍繞產(chǎn)品技術(shù)、行業(yè)應用、服務(wù)生態(tài)三個(gè)維度,設計了36項評估標準,對頭部大模型進(jìn)行測評。目前,國內的百度、阿里、騰訊、華為、科大訊飛、360、商湯等14家廠(chǎng)商都在評估之中。
從結果看,百度的文心大模型3.5綜合評分最高。并且,在算法模型、行業(yè)覆蓋上,都拿到唯一的滿(mǎn)分。文心從發(fā)布后一直在迭代。文心大模型3.5相比之前,模型效果已提升了50%,訓練速度提升2倍,推理速度提升了30倍。多個(gè)公開(kāi)測評顯示,文心3.5的綜合能力已超過(guò)ChatGPT 3.5。在中文能力上,已有超出GPT-4的表現,拉平了中美的技術(shù)差。AI大模型第一戰正式結束,參賽者站在十字路口。超越GPT-3的開(kāi)源模型,還會(huì )繼續出現。通用大模型注定是少數人的游戲,留下技術(shù)最頂尖的。更多創(chuàng )業(yè)者將集中到中間層、應用層,在這些基礎模型之上做創(chuàng )新。IDC中國高級分析師楊雯表示:
AI大模型的主要價(jià)值體現在技術(shù)、應用以及商業(yè)化3個(gè)方面:在技術(shù)方面,AI大模型帶來(lái)了認知智能技術(shù)跨越式發(fā)展;在應用方面,AI大模型可以為人類(lèi)提供更加精準和高效的服務(wù);在商業(yè)化方面,AI大模型將會(huì )帶來(lái)軟件入口級的顛覆,并促進(jìn)上層生態(tài)發(fā)展。
國內大模型公司,在迅速形成共識:技術(shù)差距追平后,產(chǎn)業(yè)縱深和商業(yè)化能力,是下一階段的戰場(chǎng)。
大模型,扎堆進(jìn)產(chǎn)業(yè)前幾天,我們在WAIC世界人工智能大會(huì )上,幾乎只能看到中美的公司。行業(yè)客戶(hù)們圍在各個(gè)大廠(chǎng)的展臺前,最想知道兩件事:AI到底能解決什么問(wèn)題?怎么賣(mài),賣(mài)多少錢(qián)?
WAIC的現場(chǎng)目前的大模型參數規模太大,加上算力成本極高,暫時(shí)還無(wú)法降低價(jià)格。動(dòng)輒千萬(wàn)、上億的部署成本,讓人望而卻步。在具體的行業(yè)場(chǎng)景,尤其是一些專(zhuān)業(yè)性強、知識密度高的領(lǐng)域,大模型的表現也還不夠精準。行業(yè)大模型、產(chǎn)業(yè)落地、賦能千行百業(yè),成為各大廠(chǎng)商給出的標準答案。百度文心大模型,提出源于產(chǎn)業(yè)實(shí)踐,服務(wù)于產(chǎn)業(yè)實(shí)踐;華為云的盤(pán)古大模型,喊出了“不做詩(shī),只做事”,聚焦行業(yè)場(chǎng)景和垂直領(lǐng)域;騰訊云也認為,“企業(yè)需要的,是在實(shí)際場(chǎng)景中真正解決了某個(gè)問(wèn)題,而不是在100個(gè)場(chǎng)景中,解決了70-80%的問(wèn)題”,他們探索了超50個(gè)行業(yè)大模型的應用解決方案;京東言犀大模型,也是立足做產(chǎn)業(yè)大模型,要“把供應鏈做透 ,把大模型做實(shí)”。這些廠(chǎng)商身上,透出一股極為務(wù)實(shí)、“接地氣”的氣質(zhì)。這有些反常的。更多想象的AI研究者,在科研機構、實(shí)驗室里把技術(shù)打磨成熟,像ChatGPT,而非直接到行業(yè)中應用。背后真相是,僅在過(guò)去10年,國內就經(jīng)歷了兩輪AI創(chuàng )業(yè)潮。但幸存者寥寥。
“AI教父”Geoffrey Hinton2012年的ImageNet大賽,“圖靈三巨頭”中的杰弗里·辛頓以卷積神經(jīng)網(wǎng)絡(luò )奪冠,讓深度學(xué)習火了。學(xué)院派們下場(chǎng)創(chuàng )業(yè),如科大訊飛、商湯、曠視、云從等AI公司成為資本寵兒。
紀錄片AlphaGo劇照2016年,AlphaGo戰勝?lài)骞谲娎钍朗?#xff0c;AI真正意義上出圈了。AI創(chuàng )業(yè)和融資進(jìn)入高峰期,互聯(lián)網(wǎng)大廠(chǎng)全部入局。
2012-2023人工智能融資趨勢70%的中國AI公司成立于2014-2018年,但90%的公司到2019年還深陷虧損。在技術(shù)研發(fā)和產(chǎn)業(yè)落地之間,隔著(zhù)一個(gè)復雜的現實(shí)鴻溝。大部分創(chuàng )業(yè)者沒(méi)熬到今年的AI潮。而“活下來(lái)”的AI公司,也都領(lǐng)悟到了:人工智能一定要落地去解決問(wèn)題,才能形成良性的商業(yè)模式,才能持續創(chuàng )造價(jià)值。所以AI大模型們,都爭先恐后往行業(yè)里鉆。
千行百業(yè),用大模型重做一遍產(chǎn)業(yè)落地跑在前面的公司,都已布局了十幾年。他們從之前的云計算、互聯(lián)網(wǎng)+、企業(yè)軟件、新基建潮、產(chǎn)業(yè)互聯(lián)網(wǎng)時(shí)期,就在積累行業(yè)合作者和高質(zhì)量數據。在幫助行業(yè)數字化期間,他們就是從一線(xiàn)場(chǎng)景、復雜問(wèn)題、龐雜需求的摔打里練出來(lái)的。在IDC評估中,百度文心拿到了唯一的行業(yè)覆蓋度滿(mǎn)分,因為其AI在能源、金融、教育、城市、工業(yè)、醫療等領(lǐng)域都有布局和落地。
制造業(yè)的產(chǎn)業(yè)升級,是大家的期待。在2008年,中國有4500種商品要靠進(jìn)口,很多是技術(shù)和工業(yè)品,比如集成電路、屏幕、汽車(chē)、工業(yè)設備。到今天,我們很多技術(shù)實(shí)現了自立自強,比如大飛機、新能源汽車(chē)、液晶顯示面板。很多工廠(chǎng)的智能化,是從質(zhì)檢環(huán)節開(kāi)始的。過(guò)去,一條流水線(xiàn)要十幾個(gè)質(zhì)檢工人,人工的效率很低,即便之后有了工業(yè)視覺(jué)的輔助,也是一份辛苦、附加值很低的工作。顯示面板又是典型的高精產(chǎn)品,生產(chǎn)工序復雜、精密,良品率極為關(guān)鍵,幾微米的瑕疵也無(wú)法容忍。TCL與百度文心合作,構建了電子制造行業(yè)大模型。將訓練樣本減少30%-40%,還讓TCL兩個(gè)產(chǎn)線(xiàn)檢測mAP指標平均提升10%+,新產(chǎn)線(xiàn)冷啟動(dòng)效率提升3倍,產(chǎn)線(xiàn)上線(xiàn)開(kāi)發(fā)周期降低30%。而在汽車(chē)制造,百度與長(cháng)安汽車(chē)的合作又不同。汽車(chē)設計需要經(jīng)驗豐富的工程師,在2萬(wàn)多種零部件、幾十萬(wàn)個(gè)參數里,去尋找滿(mǎn)足需求的排列組合,再寫(xiě)成文檔、畫(huà)出圖紙。通過(guò)百度大模型,可以迅速進(jìn)行信息組合,自動(dòng)生成設計文檔,大幅減少了汽車(chē)研發(fā)的時(shí)間和成本。如果把行業(yè)大模型的能力,從一個(gè)工廠(chǎng)放大到一座城市,就是百度打造的智能交通解決方案。今年的五一,居民旅游出行達到高峰。假期前的最后一個(gè)工作日,北京城市的擁堵指數暴增了2.5倍,從二環(huán)堵到了六環(huán)。亦莊,成了當時(shí)北京唯一不堵車(chē)的“綠洲”。因為當地部署AI全域信控方案,亦莊300多個(gè)智能路口,都能根據車(chē)流量自動(dòng)調節紅綠燈。
同樣的AI交通已經(jīng)在國內69個(gè)城市落地。根據百度測算,這能讓通行效率提升15%-30%,從而拉動(dòng)GDP2.4%-4.8%的增長(cháng)。除此之外,百度文心還和浦發(fā)銀行打造金融行業(yè)大模型,與國家電網(wǎng)做電力大模型,還打造了政務(wù)、汽車(chē)、城市、航天、傳媒等11個(gè)行業(yè)大模型。數字化程度高的企業(yè),有數據積累、人才團隊、基礎設施,落地大模型應用相應也會(huì )走得更快。絕大部分中小企業(yè)還未數字化,他們并非沒(méi)有機會(huì ),但更需要低成本、低門(mén)檻、開(kāi)箱即用的系列產(chǎn)品。湖北襄陽(yáng)一位鐵路工人,靠自學(xué)使用百度飛槳的開(kāi)發(fā)套件,獨立實(shí)現了從建設數據集、到模型訓練、再到模型部署的整套流程,做了一個(gè)自動(dòng)識別火車(chē)車(chē)號的應用程序。以前檢查貨運火車(chē)的車(chē)號,往往要人工核對數小時(shí),襄陽(yáng)車(chē)輛段用了這個(gè)程序后,只用3分鐘就能做完,給當地車(chē)輛段節省了20多萬(wàn)的成本。研究機構Epoch估算,AI和大模型訓練,要不了3年時(shí)間,在2026年就會(huì )耗盡所有高質(zhì)量數據。
左起:低質(zhì)量文本、高質(zhì)量文本、圖像數據耗盡時(shí)間數據是未來(lái)AI競爭的一個(gè)勝負點(diǎn)。把AI普及的門(mén)檻不斷降低,到產(chǎn)業(yè)落地中去,產(chǎn)生和積累更多高質(zhì)量數據。這個(gè)過(guò)程中,AI能力也會(huì )不斷迭代,更符合行業(yè)需求,從而開(kāi)啟增長(cháng)的飛輪。
百度集團執行副總裁、百度智能云事業(yè)群總裁沈抖說(shuō),未來(lái)所有企業(yè)都將強依賴(lài)大模型,所有產(chǎn)品都會(huì )基于大模型開(kāi)發(fā)。
百度文心,AI十年技術(shù)+產(chǎn)業(yè)落地的先跑,是百度過(guò)去十年All in AI,戰略轉向最好的嘉獎?,F如今,百度是全球少數在芯片、架構、大模型、產(chǎn)業(yè)應用上,都擁有先進(jìn)自研技術(shù)的企業(yè)。與微軟、谷歌、Meta一起,被評為全球四大AI公司。算力和芯片是當下焦點(diǎn)。大模型的基礎層需要數以萬(wàn)計的芯片,而英偉達GPU面臨斷供。百度自研有昆侖芯,目前已部署幾萬(wàn)片,并對外向行業(yè)輸出。第三代的昆侖芯片預計在2024年初就會(huì )量產(chǎn)。同時(shí),百度智能云在山西陽(yáng)泉修建了亞洲最大單體智算中心,每秒可以完成4EFLOPS(400億億次浮點(diǎn)運算),滿(mǎn)足文心的訓練和推理。在框架層,百度的飛槳PaddlePaddle是中國首個(gè)開(kāi)源的產(chǎn)業(yè)級深度學(xué)習框架,替代谷歌TensorFlow和Meta的Pytorch,在中國的市場(chǎng)綜合份額排第一。
模型層的文心大模型,包含30多個(gè)大模型,分為基礎大模型、任務(wù)大模型、行業(yè)大模型三級體系,全面滿(mǎn)足產(chǎn)業(yè)需求。
百度內部的產(chǎn)品,如搜索、信息流、地圖等,都已在進(jìn)行AI原生重構。同時(shí),飛槳長(cháng)期深耕產(chǎn)業(yè)落地,連接著(zhù)750萬(wàn)的開(kāi)發(fā)者,20萬(wàn)家企事業(yè)單位。文心共享飛槳生態(tài),解決了大模型研發(fā)和部署難題,加快文心的產(chǎn)業(yè)落地。作為AI的領(lǐng)軍者,百度不但培育出本土化的中國AI平臺和工具,還在搭建一個(gè)教育、產(chǎn)業(yè)、開(kāi)發(fā)社區的AI生態(tài),要在5年為社會(huì )培養500萬(wàn)AI人才,補充國內AI人才缺口。今年5月,百度也宣布設立10億元的百度文心投資基金,鼓勵投資中國的AI創(chuàng )業(yè)者,鼓勵他們文心大模型的能力、百度智能云的算力,去開(kāi)發(fā)和創(chuàng )新。
百度創(chuàng )始人李彥宏說(shuō):
新的國際競爭戰略關(guān)鍵點(diǎn),不是一個(gè)國家有多少個(gè)大模型,而是你的大模型上有多少原生的AI應用,這些應用在多大程度上提升了生產(chǎn)效率。
如果我們能擠上牌桌,獲得競賽入場(chǎng)券,中國將擁有更壯大的數字化產(chǎn)業(yè),數字經(jīng)濟規模將獲得巨大增長(cháng)?!蔽覀兛偸歉吖牢磥?lái)2年的變化,而又低估未來(lái)10年的變革。不管你叫它智能時(shí)代、第四次工業(yè)革命,人工智能是用技術(shù)變革,打破一切格局的難得機遇。大模型推動(dòng)的歷史車(chē)輪,才剛剛開(kāi)始。接下來(lái)的十年,注定也屬于A(yíng)I。先期的泡沫會(huì )不斷釋放,大模型公司不斷洗牌,這是必然的過(guò)程。在產(chǎn)業(yè)落地的進(jìn)程中,留下那些能真正走進(jìn)行業(yè),去解決問(wèn)題、創(chuàng )造生態(tài)的公司。
相關(guān)稿件