百度股價(jià)三天連漲了12.8%??淳W(wǎng)上評論和分析,應該是與上周(3月16日)發(fā)布了被稱(chēng)為“中國版ChatGPT”生成式對話(huà)產(chǎn)品“文心一言”有關(guān)。
隨著(zhù)美國OpenAI研發(fā)的聊天機器人程序ChatGPT的推出,最近一個(gè)時(shí)期,有關(guān)ChatGPT和AI是網(wǎng)上、微信群討論的熱門(mén)話(huà)題。我歸納了一下,討論的主題主要集中在兩個(gè)方面,一是AI未來(lái)會(huì )如何發(fā)展,將會(huì )給人類(lèi)的未來(lái)帶來(lái)什么?二是中國與美國在這方面有多大差距,差距是如何造成的,何時(shí)能夠趕上?很多人為此感到焦急和憂(yōu)慮,有些“恨鐵不成鋼”的情緒。百度比較及時(shí)地推出“文心一言”,客觀(guān)上是對這種焦慮情緒的回應,應該能夠在一定程度上緩解這種焦慮情緒。
從現場(chǎng)演示來(lái)看,“文心一言”在文學(xué)創(chuàng )作、商業(yè)文案創(chuàng )作、數理推算、中文理解、多模態(tài)生成等方面的能力比較突出?!拔男囊谎浴币劳杏诎俣人阉鳂I(yè)務(wù)所積累的海量的知識圖譜,在上述幾個(gè)方面做得比較好應該是順理成章的。據介紹,“文心一言”大模型的訓練數據包括萬(wàn)億級網(wǎng)頁(yè)數據、數十億搜索數據和圖片數據、百億級語(yǔ)音日均調用數據及5500億事實(shí)的知識圖譜,因此其在中文語(yǔ)言的處理上,具有獨特的優(yōu)勢。而且,據說(shuō)數據規模大,參數達到千億級,大模型就可能發(fā)生“智能涌現”,涌現出知識和邏輯推理能力。此外,百度的數據形態(tài)也最貼合回答和生成需求。在百度搜索中,問(wèn)答和生成類(lèi)的搜索請求占比很高。這些,都為“文心一言”在自然語(yǔ)言問(wèn)答和創(chuàng )意內容生成上提供了很好的條件。
也有網(wǎng)友指出“文心一言”對有些問(wèn)題回答得不夠好。我的理解是目前“文心一言”還有些“偏科”。要它在各個(gè)方面都做得好,還需要進(jìn)行不斷訓練。我們相信它會(huì )不斷一進(jìn)步,很可能會(huì )進(jìn)步很快。
值得肯定的是,在全球各大廠(chǎng)中,類(lèi)似的AI產(chǎn)品,百度是第一個(gè)做出來(lái)的。這類(lèi)大型的語(yǔ)言模型,需要多年的研發(fā),不斷地改進(jìn),不是短期內靠突擊能做出來(lái)的。特別是深度學(xué)習、自然語(yǔ)言處理,需要多年的堅持和積累,沒(méi)法速成。
在類(lèi)似OpenAIChatGPT和百度“文心一言”這樣的領(lǐng)域,硬件的限制少,主要是軟件的能力,應該說(shuō)基本上沒(méi)有“卡脖子”的問(wèn)題。我們國家在這方面應該是有優(yōu)勢的。百度有很好的基礎,又有很好的政策、市場(chǎng)、人才方面的優(yōu)勢,達到世界先進(jìn)水平應該是很有希望的。我們拭目以待。
(作者系作者上海交大上海高級金融學(xué)院教授陳欣)
相關(guān)稿件