◎作者|李心瑩
◎來(lái)源|已獲授權
在大模型掀起國內科技熱潮后,所有人都想知道產(chǎn)業(yè)的下一步將如何發(fā)展。對此,恐怕沒(méi)人比百度李彥宏更有資格做出判斷。
百度是在3月發(fā)布的文心一言,成為全球科技大廠(chǎng)中第一個(gè)大模型牌桌的玩家。更重要的是,百度也是國內科技大廠(chǎng)中第一個(gè)投入、以及堅持最久的AI玩家。
從李彥宏2013年宣布成立深度學(xué)習實(shí)驗室至今,百度投入AI的時(shí)間已經(jīng)超過(guò)10年,既見(jiàn)證了AI技術(shù)的發(fā)展迭代,也見(jiàn)證了這項技術(shù)從實(shí)驗室一步步走向現實(shí)生活的過(guò)程。
如今,大模型時(shí)代已來(lái),未來(lái)最大的產(chǎn)業(yè)機會(huì )在哪?AI原生應用究竟長(cháng)什么樣?基礎模型與Killer Apps如何共融共生?垂類(lèi)模型與基礎模型是互為競爭關(guān)系嗎?
當然,這些問(wèn)題都能在文心一言上找到答案。但我更想知道李彥宏怎么看——作為一位堅信AI的技術(shù)人、一位帶領(lǐng)公司All in AI的企業(yè)家、一位用幾十萬(wàn)字宣揚AI的布道師。
百度官方消息稱(chēng),李彥宏將會(huì )在10月17日的百度世界大會(huì )上帶來(lái)長(cháng)達一小時(shí)的主題演講,“手把手教你做AI原生應用”。
現在,距離這次演講還有兩周時(shí)間,我梳理了李彥宏今年以來(lái)關(guān)于大模型和生成式AI的全部講話(huà)內容,從上萬(wàn)字的演講實(shí)錄中選摘出33條干貨,算是先做做功課。通過(guò)他的思考,我希望能進(jìn)一步揭示AI原生應用的本質(zhì),為正在大模型創(chuàng )業(yè)、創(chuàng )新路上的同行人提供一份啟示。
以下為實(shí)錄摘編,enjoy:
大模型如何重新定義人工智能
1、人工智能的發(fā)展正在從辨別式走向生成式。什么叫辨別式?搜索引擎就是典型的辨別式。什么叫生成式?用AI進(jìn)行文學(xué)創(chuàng )作,寫(xiě)報告、繪制海報等等,這些都是生成式。
2、過(guò)去的人工智能是,我們想讓機器學(xué)會(huì )什么技能,就教它什么技能。教過(guò)的可能會(huì ),沒(méi)教過(guò)的就不會(huì )。大模型出現“智能涌現”后,以前沒(méi)教過(guò)的技能,它也會(huì )了。這就是為什么有人講,我們現在朝著(zhù)通用人工智能(AGI)方向發(fā)展。
3、大模型如何重新定義人工智能?主要體現在人機交互方式的變化。過(guò)去幾十年,人機交互方式共經(jīng)歷了三次變革,從命令行到圖形用戶(hù)界面(GUI),再到人工智能時(shí)代,我們可以用自然語(yǔ)言跟電腦進(jìn)行交互。也就是說(shuō),未來(lái)的應用是通過(guò)自然語(yǔ)言提示詞來(lái)調動(dòng)AI原生應用實(shí)現的。
4、人工智能時(shí)代的到來(lái),讓IT技術(shù)棧從三層變成了四層:底層仍然是芯片層,但主要的芯片已經(jīng)不是CPU ,而是以GPU為代表的新一代適合并行大規模浮點(diǎn)運算的芯片;上面我們叫做框架層,就是深度學(xué)習的框架,像百度的PaddlePaddle飛槳、Meta的PyTorch、谷歌的TensorFlow都是在這一層;再上面一層是模型層,Chat GPT、文心一言等都屬于模型層;最上面是應用層,以后AI時(shí)代的原生應用,都會(huì )基于大模型來(lái)進(jìn)行開(kāi)發(fā)。
5、模型本身并不直接產(chǎn)生價(jià)值,基于基礎大模型開(kāi)發(fā)出來(lái)的AI原生應用才是模型存在的意義。
6、我們不在乎榜單,就是要一步一個(gè)腳印往前走,打造好基礎模型能力,支持好在這個(gè)基礎模型之上開(kāi)發(fā)出來(lái)的AI原生應用。在模型之上開(kāi)發(fā)出來(lái)的應用越厲害、用的人越多、生產(chǎn)效率和工作效率提升的越多,這才是基礎大模型真正強大的表現。
7、垂類(lèi)模型不是基礎模型的競爭對手,反而應該建立在強大的基礎模型之上。沒(méi)有足夠強大的基礎模型做支撐,垂類(lèi)模型就很難持續提升和發(fā)展。然而,只有少數公司會(huì )在基礎模型上達到較高水平。
8、開(kāi)源模型在發(fā)展過(guò)程不一定都會(huì )變得更好,如果反饋回路不理想,是不利于基礎模型改善升級的。走彎路的成本變高,就難以建立持久的商業(yè)模式。
卷大模型沒(méi)意義,卷應用機會(huì )更大
9、生成式大模型的問(wèn)世,會(huì )帶來(lái)哪些創(chuàng )業(yè)和投資機會(huì )?我覺(jué)得至少有三方面機會(huì ):首先是新型云計算,第二類(lèi)是行業(yè)模型的精調,第三類(lèi)是應用開(kāi)發(fā)。
10、大模型是Game Changer,它會(huì )徹底改變云計算的游戲規則。未來(lái)云計算公司的主要商業(yè)模式會(huì )變成MaaS,就是模型即服務(wù)(Model as a Service)。以后的應用會(huì )建立在大模型上,而不是建立在云計算的這些算力或者存儲上。
11、過(guò)去,云計算主要賣(mài)算力,看速度、看存儲;今天,客戶(hù)購買(mǎi)云服務(wù),要看框架好不好、模型好不好,而不僅僅是看算力怎么樣。
12、大模型時(shí)代,最大的機會(huì )既不在基礎服務(wù),也不在行業(yè)服務(wù),恰恰是在應用。就好像在移動(dòng)互聯(lián)網(wǎng)時(shí)代,最大的商業(yè)機會(huì )不是iOS或者安卓這樣的操作系統,而是微信、抖音、淘寶這些應用一樣。
13、美國有幾十個(gè)基礎大模型,跟中國量級一樣,但在基礎大模型之上,美國已經(jīng)有上千個(gè)“AI原生應用”,但中國市場(chǎng)是沒(méi)有的,這是最大的區別。
14、只有在大模型的基礎之上產(chǎn)生了足夠多的AI原生應用,才是一個(gè)健康的生態(tài)環(huán)境,這代表了大的技術(shù)發(fā)展趨勢。
15、對創(chuàng )業(yè)者來(lái)說(shuō),卷大模型沒(méi)意義,卷應用機會(huì )更大。
16、大模型時(shí)代來(lái)了,每一個(gè)產(chǎn)品都值得重做一遍。但誰(shuí)真正重新做了一遍呢?百度要做第一個(gè)把全部產(chǎn)品重做一遍的公司,不是整合,不是接入,是重做和重構。
AI原生應用的交互不能超過(guò)兩級菜單
17、AI原生應用,不是簡(jiǎn)單地重復PC時(shí)代軟件或移動(dòng)時(shí)代的APP,而得是“AI”原生,沒(méi)有AI就不存在的應用。
18、什么是AI原生應用?我認為至少滿(mǎn)足三個(gè)條件:第一,能用自然語(yǔ)言交互,這是最根本的變化;第二,能充分利用理解、生成、推理、記憶等,這些過(guò)去不具備的技術(shù)能力;第三,每個(gè)應用的交互都不超過(guò)兩級菜單。
19、每個(gè)AI原生應用的交互都不能超過(guò)兩級菜單。如果超過(guò)兩級菜單,大家就記不住這個(gè)功能到底在哪。好多工程師辛苦開(kāi)發(fā)出來(lái)的功能隱藏在第三級甚至第四級菜單里,沒(méi)有人用。PPT、Excel都是這樣,可能80%的功能,絕大多數人從來(lái)沒(méi)用過(guò),就是因為使用門(mén)檻太高了,不知道在哪。
20、你只要思路活躍、表達清晰,機器就能給你干活兒,這就是AI原生的應用。
21、明顯的AI原生應用,并不表明就是最好的AI原生應用。我認為直到今天,最好的AI原生應用還沒(méi)有出現,就是類(lèi)似于抖音、微信、Uber這種移動(dòng)互聯(lián)網(wǎng)時(shí)代的Mobile Native的APP。沒(méi)有手機的時(shí)候大家是不能想象它們的存在的,但它們確實(shí)產(chǎn)生了很大的社會(huì )影響力。
22、我們四萬(wàn)百度人,沒(méi)有一個(gè)是AI時(shí)代的原住民。雖然大多數人都經(jīng)歷了PC時(shí)代、移動(dòng)時(shí)代,但某種意義上思維方式仍然被固化了。未來(lái),我們要有意識地培養AI原生應用的思維方式和理念,用新的理念去重構現在的每一個(gè)產(chǎn)品和業(yè)務(wù)。
23、生成式AI的來(lái)臨,讓我們發(fā)現很多時(shí)候只需要敲一兩個(gè)關(guān)鍵詞、點(diǎn)擊下鼠標就能解決問(wèn)題,不再像過(guò)去要用一大段話(huà)來(lái)描述需求才能獲得想要的內容。這也讓我們意識到,有多少工程師辛辛苦苦開(kāi)發(fā)出來(lái)的功能被藏在一層層菜單下永遠無(wú)人問(wèn)津,有多少苦思冥想的靈感都無(wú)法獲得反饋,但現在,它們可能會(huì )通過(guò)一些簡(jiǎn)單的提示詞被激發(fā)出來(lái),所以我們應該有勇氣去改變自己的思維方式。
24、改變思維方式是痛苦的,會(huì )經(jīng)歷各種挫折和煎熬,這需要我們用毅力去克服慣性,用發(fā)現和探索的眼光來(lái)看待這個(gè)新的世界。
25、我要求公司所有產(chǎn)品重構、重做,就是放棄過(guò)去對于桌面、PC這種瀏覽器的依賴(lài),對于移動(dòng)APP的依賴(lài)。要重新想象一下,有了理解、生成、邏輯、推理、記憶能力之后,能夠做成什么應用。
自然語(yǔ)言人機交互會(huì )帶來(lái)“提示詞革命”
26、所謂“AI Native”,最明顯的特征就是“提示詞工程(Prompt Engineering)”。過(guò)去沒(méi)有這個(gè)行當,我們也不覺(jué)得跟計算機交互需要那么多講究。但在未來(lái),通過(guò)寫(xiě)好提示詞來(lái)激發(fā)大模型的潛力,是非常有意思的行當,我也認為這是新工作機會(huì )最容易出現的地方。
27、我做過(guò)一個(gè)大膽預測,10年后,全世界有50%的工作會(huì )和“提示詞工程”有關(guān)。這就好像教育方式一樣,提出問(wèn)題往往比解決問(wèn)題更重要。未來(lái)我們會(huì )需要越來(lái)越多的提示詞工程師。
28、今天百度有上萬(wàn)個(gè)工程師,會(huì )C++、Python,但到了AI原生應用全面落地的時(shí)候,可能會(huì )要求大家都來(lái)寫(xiě)Prompt,而且要看寫(xiě)了之后run出來(lái)的結果如何。
29、人類(lèi)要學(xué)習跟機器打交道的能力,提示詞說(shuō)成什么樣,機器就會(huì )匹配什么樣的結果,這些結果就是生產(chǎn)力。
30、大模型本身的能力放在那,用得好不好完全靠提示詞決定。提示詞寫(xiě)得好,智能涌現可能就多一些,反饋結果就更有價(jià)值一些;提示詞不好,出來(lái)的東西就是一本正經(jīng)胡說(shuō)八道,或者是錯誤結論。
31、提示詞的書(shū)寫(xiě)是有技術(shù)含量的,是需要學(xué)習的。怎么把提示詞寫(xiě)好,這既是技術(shù)也是藝術(shù),甚至藝術(shù)的成分還更多些。
32、未來(lái)的應用是通過(guò)自然語(yǔ)言提示詞來(lái)調動(dòng)原生AI應用實(shí)現的。這意味著(zhù),未來(lái)薪酬水平將取決于提示詞寫(xiě)得好不好。
33、不同的大模型,比如文心大模型和Chat GPT,它們的提示詞也存在明顯差異。畢竟這些模型是通過(guò)獨立底層訓練得出來(lái)的。如果把它們比喻成一個(gè)人的話(huà),它們的“脾氣秉性”肯定是不同的,在與它們交互的過(guò)程中,我們也需要不斷摸索,逐漸了解如何寫(xiě)提示詞才能達到更好的效果。
想了解大模型、生成式AI的更多精彩內容嗎?即刻報名參加10月17日在北京首鋼園召開(kāi)的「百度世界2023」,目前大會(huì )已經(jīng)開(kāi)放公眾參會(huì )報名,在大會(huì )官方網(wǎng)站提交申請,就有機會(huì )親臨現場(chǎng),體驗這場(chǎng)前沿科技盛會(huì )。
相關(guān)稿件