近日,圍繞火爆全網(wǎng)的ChatGPT話(huà)題,聯(lián)想集團CTO、高級副總裁芮勇博士接受了《中國計算機學(xué)會(huì )通訊》(CCCF)的專(zhuān)訪(fǎng),并分享了對ChatGPT等大模型的看法。芮勇表示,聯(lián)想新IT架構將在A(yíng)I新范式加速智能化變革的過(guò)程中繼續發(fā)揮重要作用。除了基礎架構之外,聯(lián)想還在考慮AIGC技術(shù)在產(chǎn)品和業(yè)務(wù)里的應用。
從大模型到AGI還有多遠?
ChatGPT是OpenAI GPT系列中為對話(huà)場(chǎng)景優(yōu)化的語(yǔ)言模型,屬于Foundation Models,即基礎模型,簡(jiǎn)稱(chēng)為“大模型”。芮勇將它的特點(diǎn)概括為“一大三多”:一大是指參數規模大,是千億參數級別的超大型人工智能模型;三多是指利用多來(lái)源、多模態(tài)、多任務(wù)的互聯(lián)網(wǎng)規模海量數據進(jìn)行訓練。
芮勇認為,大模型首先在內容理解領(lǐng)域大獲成功,例如BERT問(wèn)世時(shí)刷新了11項自然語(yǔ)言理解任務(wù)的記錄,最近又在內容生成領(lǐng)域取得了矚目成就,也就是AIGC。
對于外界普遍關(guān)心的大模型是否催生了AI新范式,芮勇給出的答案是,簡(jiǎn)單來(lái)講,AI范式的轉變,是從“針對特定任務(wù),更新預訓練模型”(small models + fine-tuning)轉換到“根據上下文提示自動(dòng)理解并執行各類(lèi)任務(wù),無(wú)需更新模型參數或架構”(large models + in-context learning)。
ChatGPT的成功,讓業(yè)界看到了由大模型通往AGI (通用人工智能) 的曙光,不過(guò),芮勇認為,大模型能走多遠,前景到底如何,是否能實(shí)現“多任務(wù),多模態(tài),多化身的大一統”,目前還頗有爭議。
他進(jìn)一步解釋,近幾年大模型有了突破式進(jìn)展,很多人持樂(lè )觀(guān)態(tài)度。從Gartner技術(shù)成熟度曲線(xiàn)可以看到,大模型目前處于“期望膨脹階段”(Peak of Inflated Expectations) 。人們對它的期望很高,但也應該看到,大模型尚未解決的問(wèn)題還很多。比如谷歌版的ChatGPT,取名Bard,首次公開(kāi)展示就出現回答結果不準確的問(wèn)題,導致公司市值一天之內蒸發(fā)超1000億美元。此外,對話(huà)機器人生成句子里包含的信息無(wú)法溯源,甚至包含偏向性和冒犯性言論等等??梢?jiàn),通往AGI的道路還很漫長(cháng)。
聯(lián)想在大模型普及中發(fā)揮怎樣的作用?
大模型的興起,為進(jìn)行智能化變革的企業(yè)帶來(lái)了很多新的機遇。芮勇以聯(lián)想為例進(jìn)行了介紹。聯(lián)想借鑒大模型背后的基礎性算法,將小樣本學(xué)習應用到基于計算機視覺(jué)的產(chǎn)品缺陷檢測當中,提升了質(zhì)檢系統對新產(chǎn)品和新產(chǎn)線(xiàn)的快速遷移能力;此外,聯(lián)想還將強化學(xué)習技術(shù)和人機協(xié)作的理念應用到供應鏈優(yōu)化當中,使得供應鏈在劇烈變化的環(huán)境中,不斷提升韌性。
對于聯(lián)想將在A(yíng)I新范式和大模型普及中發(fā)揮怎樣的作用,芮勇表示,長(cháng)遠來(lái)看,很有可能AI新范式(large models + in-context learning)與舊范式(small models + fine-tune)共存,或是相互結合,而不會(huì )單個(gè)范式一統天下。聯(lián)想將充分發(fā)揮“端-邊-云-網(wǎng)-智”新IT架構的優(yōu)勢,來(lái)支撐新舊范式的結合與轉換。聯(lián)想提出的新IT架構,既致力于推動(dòng)自身的智能化變革,也著(zhù)眼于賦能各行各業(yè)的智能化轉型。AI模型對運行環(huán)境需求越來(lái)越高,例如云-邊-端的高度協(xié)同,異構計算與負載均衡、設備之間的互聯(lián)互通、數據安全與隱私保護、模型本身的伸縮性與擴展性等等。聯(lián)想在這些方面都有著(zhù)深厚的技術(shù)積累,新IT架構在A(yíng)I新范式加速智能化變革的過(guò)程中也會(huì )繼續發(fā)揮重要作用。
除了基礎架構之外,聯(lián)想還在考慮AIGC技術(shù)在產(chǎn)品和業(yè)務(wù)里的應用。比如,在智能設備中對跨模態(tài)的生成模型進(jìn)行優(yōu)化和裁剪,使之能加載到手機或平板上實(shí)現個(gè)性化內容生成。在智能解決方案方面,我們考慮把AIGC用于新產(chǎn)品營(yíng)銷(xiāo)與新客戶(hù)觸達。目前,大模型還沒(méi)有與知識有效結合,我們正在研究數據驅動(dòng)與知識驅動(dòng)相結合的方法,即Hybrid Learning來(lái)改進(jìn)大模型的不足。另外,在大模型落地過(guò)程中,也需要徹底解決對環(huán)境變化或是新領(lǐng)域、新任務(wù)的自適應問(wèn)題,即Adaptive Learning,這些都是聯(lián)想人工智能的探索方向。
相關(guān)稿件