AI大模型會(huì )變傻嗎?
這事或正在發(fā)生!
頂級科學(xué)期刊《自然》發(fā)表的最新研究給似乎將變得無(wú)所不能的大模型判了“死緩”,將這種糟糕情況描述為“大模型崩潰”。
《自然》雜志最新一期封面,圖源:Nature
除了變傻,大模型還面臨發(fā)展路線(xiàn)分歧。一條傾向于把通用大模型做到盡可能完善,然后自上而下實(shí)現產(chǎn)業(yè)、商業(yè)場(chǎng)景全覆蓋;一條則是扎根產(chǎn)業(yè),從實(shí)際應用中自下而上催生成熟的產(chǎn)業(yè)大模型,為通用大模型的完善積累“智慧”。
有意思的是,根據《全球數字經(jīng)濟白皮書(shū)(2024)》統計,目前全球的基礎大模型有1328個(gè),美國最多,中國第二。而產(chǎn)業(yè)大模型,中國表現了極大的熱忱。更有意思的是,美國企業(yè)多傾向第一條路線(xiàn),而中國開(kāi)發(fā)者則越來(lái)越扎堆第二條路線(xiàn)。很難說(shuō)兩條路線(xiàn)誰(shuí)更具優(yōu)勢。不過(guò)對《自然》的最新警告,很可能不會(huì )出現在走第二條路線(xiàn)的中國開(kāi)發(fā)者身上。
人們期待AI大模型引領(lǐng)人類(lèi)開(kāi)啟新紀元的愿望有多熱切,“大模型崩潰”帶來(lái)的打擊就有多強烈。
下一次大模型泡沫說(shuō)不定就是被它引爆的。這種事在互聯(lián)網(wǎng)與資本的蜜月期也屢見(jiàn)不鮮。
如果訓練大模型時(shí),只用AI生成的內容,會(huì )導致大模型出現不可逆的缺陷。一些在第一代數據中出現的低頻詞,在以后的迭代中出現的頻率會(huì )更低,而一些常見(jiàn)詞匯出現的頻率則逐漸增加。久而久之,模型逐漸無(wú)法正確模擬真實(shí)世界的復雜性。錯誤被層層累積、逐漸放大,最終導致“模型崩潰”。
很像生物學(xué)中“近親繁殖”導致后代缺陷的過(guò)程。
如何規避“模型崩潰”陷阱,讓大模型更好的成長(cháng)呢?
接地氣是選擇之一。事實(shí)上,許多中國大模型開(kāi)發(fā)者就是這么做的。
比如京東推出的言犀大模型,以及基于大模型產(chǎn)生的京醫千詢(xún)、京點(diǎn)點(diǎn)、小哥智能終端助手等一系列智能體應用。
截至目前,京東大模型落地超過(guò)100個(gè)場(chǎng)景,支持了23萬(wàn)+商家,2萬(wàn)+京東采銷(xiāo),1萬(wàn)+研發(fā)人員;不但涵蓋零售、供應鏈等核心領(lǐng)域,還能兼顧辦公自動(dòng)化、法務(wù)、風(fēng)控、合同審核、數據分析的解決方案,并拓展到了健康領(lǐng)域。
京東大模型開(kāi)發(fā)最大特色就是從實(shí)踐中來(lái)到實(shí)踐中去,大模型在京東基本實(shí)現了祛魅,即使是普通的業(yè)務(wù)人員都能自己定制、拿來(lái)就用。
能用、好用的大模型,緣于京東對供應鏈的深耕。
回溯歷史,供應鏈可謂歷次產(chǎn)業(yè)革命的集大成者。諸多巨型企業(yè)、經(jīng)濟學(xué)家、管理學(xué)家、還有產(chǎn)業(yè)研究者早早就把供應鏈整體協(xié)同優(yōu)化,視為企業(yè)更上層樓的關(guān)鍵。
舉個(gè)簡(jiǎn)單的例子,一輛汽車(chē)的零部件通常超過(guò)3萬(wàn)件,核心工廠(chǎng)很難生產(chǎn)全部零部件,會(huì )把大部分零部件交給上下游企業(yè)生產(chǎn)。但汽車(chē)裝配對零部件供貨時(shí)間要求極高,協(xié)同不好就會(huì )影響交貨。
所以,最早的產(chǎn)業(yè)互聯(lián)網(wǎng)就是由美國汽車(chē)四巨頭聯(lián)手締造。
而京東產(chǎn)業(yè)大模型的橫空出世,似乎有一點(diǎn)歷史宿命的意味。
供應鏈是產(chǎn)業(yè)中數據最集中、協(xié)同最復雜的場(chǎng)景,通過(guò)數據實(shí)現管理優(yōu)化即可提升供應鏈效率,通過(guò)落地大模型能夠快速釋放供應鏈效能,相比其它場(chǎng)景能最快發(fā)揮智能的優(yōu)勢。
京東有一個(gè)公式,大模型的價(jià)值=算法×算力×數據×產(chǎn)業(yè)厚度的平方。第四個(gè)乘數,正好呼應了我們前文中提到的第二條路線(xiàn)的特質(zhì),能極大彌補AI生成數據的先天不足,從而為大模型的成長(cháng)提供了一個(gè)更平衡、更全面的路徑。
圖源:數字基礎設施技術(shù)趨勢白皮書(shū)(2023)
大模型誕生到現在,人們早已不再滿(mǎn)足于其強大的自然語(yǔ)言(含圖形)理解、語(yǔ)言生成和語(yǔ)音識別等能力,在聊天、娛樂(lè )等通識屬性較強的場(chǎng)景上的表現,更寄希望于實(shí)際用起來(lái)產(chǎn)業(yè)落地,商業(yè)落地。
正如中國工程院院士鄔賀銓所說(shuō)的:對話(huà)、寫(xiě)詩(shī)、作畫(huà)絕不是大模型的全部。我們需要將大模型切實(shí)投入到城市發(fā)展、金融科技、生物醫藥、工業(yè)制造、科學(xué)研究等領(lǐng)域,也需要專(zhuān)業(yè)的企業(yè)和組織加速其在實(shí)體產(chǎn)業(yè)落地,為產(chǎn)業(yè)剛需帶來(lái)實(shí)實(shí)在在的價(jià)值,真正意義大規模服務(wù)社會(huì )。
京東就走在這條路上。京東集團技術(shù)委員會(huì )主席、京東云事業(yè)部總裁曹鵬認為“通用大模型靠算力堆出來(lái),企業(yè)大模型靠業(yè)務(wù)跑出來(lái)”, 并表示“京東供應鏈是大模型應用的超級孵化器?!?/p>
2024京東云峰會(huì )上,京東云展示了京東言犀大模型落地行業(yè)的領(lǐng)先技術(shù)與最新實(shí)踐,并重磅發(fā)布京東云企業(yè)大模型服務(wù)、言犀智能體平臺、智能編程助手JoyCoder、言犀數字人3.0等八大產(chǎn)品。
當大模型遇上供應鏈,產(chǎn)業(yè)互聯(lián)網(wǎng)的歷史一幕也許會(huì )在京東身上重現?
京東言犀大模型的成長(cháng),還能讓我們可以對世界工廠(chǎng)的全面刷新暢想一番。
中國擁有聯(lián)合國工業(yè)名錄門(mén)類(lèi)劃分中的39個(gè)大類(lèi)、191個(gè)中類(lèi)、525個(gè)小類(lèi)的全部門(mén)類(lèi)。構成這個(gè)龐大工業(yè)體系的是40萬(wàn)家企業(yè),其中超過(guò)90%的企業(yè)是中小微企業(yè)。
圖源:鈦媒體
都知道數智化是方向,但常規的研發(fā)者不會(huì )去鉆研不同產(chǎn)業(yè)的技術(shù)訣竅,以至于基礎大模型讓很多中小企業(yè)覺(jué)得高不可攀,彼此之間誰(shuí)仿佛都覺(jué)得對方離自己還遠著(zhù)呢。
京東云為產(chǎn)業(yè)締造了一個(gè)全新的關(guān)鍵容易上手的系統,還是相對繁雜偏偏還離不開(kāi)的供應鏈方面。
從生產(chǎn)到流通,從原料供應、倉儲,到運輸、分銷(xiāo),以及最終的消費者,傳統供應鏈的節點(diǎn)繁復,交織成的網(wǎng)絡(luò )結構復雜,流通環(huán)節也總是層層障礙。
京東云本身就扎根于供應鏈,加上之前的積淀,在零售、物流、倉儲、金融、健康、工業(yè)等產(chǎn)業(yè)擁有深入實(shí)踐,還參與了城市、政務(wù)、金融、制造、工業(yè)、航空、交通、園區、能源等產(chǎn)業(yè)。
京東云很多年前就確定了數智供應鏈的目標。其核心理念是產(chǎn)業(yè)聯(lián)結、數智創(chuàng )新和生態(tài)融合,通過(guò)數智供應鏈建設,企業(yè)能夠從產(chǎn)業(yè)鏈全局優(yōu)化效率,以數智技術(shù)驅動(dòng)數實(shí)融合,同時(shí)聯(lián)結更多生態(tài)伙伴,實(shí)現更高效的數字化轉型。
大模型的落地,讓數智供應鏈再次蛻變,線(xiàn)性鏈條連接“孤島”,交織成一個(gè)復雜網(wǎng)絡(luò ),進(jìn)而實(shí)現有限的自主呼應,有點(diǎn)類(lèi)似藤曼纏繞的雨林結構,如今這個(gè)系統又有了高級統御的智慧。
AI智能體(AI Agent)被視為過(guò)往技術(shù)發(fā)展的集大成者,在工業(yè)界已得到共識,能夠廣泛適配各類(lèi)應用場(chǎng)景。AI智能體以大型語(yǔ)言模型(LLM)作為核心控制器構建,可以構建出強大的問(wèn)題解決器。
言犀智能體平臺
京東云言犀智能體平臺是新一代一站式 AI Agent 開(kāi)發(fā)平臺,目前已接入數十個(gè)大模型,它幾乎就是一個(gè)為使用而生的平臺。無(wú)論用戶(hù)是否有編程基礎,從解決簡(jiǎn)單的問(wèn)答到處理復雜邏輯的業(yè)務(wù)問(wèn)題,都可以在平臺上低成本快速搭建基于 AI 模型的各類(lèi)快捷應用。
比如外貿供應鏈的報關(guān)場(chǎng)景,會(huì )產(chǎn)生大量報關(guān)碼(HS code),需要人工尋找到每個(gè)code,還要手動(dòng)輸入商品描述。京東云言犀智能體平臺通過(guò)workflow反向RAG,描繪商品,找到對應code。另外還有智能體低代碼開(kāi)發(fā)的應用構件,輸入一段描述的自然語(yǔ)言,就可以基于A(yíng)gent生成應用。
還有外貿中的訂單履約場(chǎng)景,過(guò)去需要通過(guò)客服問(wèn)詢(xún),京東云通過(guò)言犀智能體平臺調用API,就能查到訂單履約到哪了;通過(guò)Agent調用對應的foundation,就能查到物流訂單到哪了。而且拆單狀態(tài)、履約情況、合同審核等場(chǎng)景在國際貿易時(shí)不能只用中文,還需要多種語(yǔ)言,基于A(yíng)gentAIG就能輕松實(shí)現多語(yǔ)言問(wèn)答。
通用大模型要做到這一步,往往會(huì )出現開(kāi)發(fā)冗余、貨不對板或者成本高企,而針對性強的產(chǎn)業(yè)大模型卻能夠同時(shí)對齊了成本、效率、體驗三方面要求。
對業(yè)務(wù)場(chǎng)景的理解與觸達,對產(chǎn)業(yè)數據的積淀與運用,是京東言犀大模型保持精度的重要前提。實(shí)際上,言犀大模型數據就是由70%的通用數據與30%供應鏈場(chǎng)景生長(cháng)的原生數據構成。
你能想象京東的小哥都在自如實(shí)現與大模型的對接嗎?
多場(chǎng)景智能助手 特定角色提供專(zhuān)業(yè)服務(wù)
小哥的崗前培訓,比如具體到服務(wù)過(guò)程中如何處理異常?哪些違禁品不能郵寄?以及耗材等問(wèn)題……
過(guò)去他們需要記住大量專(zhuān)業(yè)知識,過(guò)程長(cháng),還容易出錯,現在京東云基于言犀大模型為小哥量身訂制了終端智能助手,這位“助手”能牢記從攬收、派送、站內、輔助、客戶(hù)服務(wù)等143項標準作業(yè)動(dòng)作,到貨物處理規程、安全操作標準、KA客戶(hù)等915個(gè)服務(wù)要求都能回答。
對于物流、派送地址等常規操作,小哥甚至只需要動(dòng)動(dòng)嘴,小哥助手就能優(yōu)化流程,給出優(yōu)化方案。
如今物流的小哥終端智能助手已服務(wù)近35萬(wàn)京東自有配送員。
京東集團副總裁何曉冬將這比作培養一個(gè)人,“如果一個(gè)人高中畢業(yè)后直接出去打工,似乎也行,但專(zhuān)業(yè)性會(huì )差一點(diǎn)。要是能讀完四年本科再出去工作,就既有通識能力又有足夠的專(zhuān)業(yè)知識,這是產(chǎn)業(yè)大模型應該具備的能力”。
至此,京東供應鏈與大模型,形成了一對奇特耦合且螺旋上升關(guān)系:一方面,大模型的出現為供應鏈的深化、優(yōu)化、數智化提供了新的增長(cháng)點(diǎn);另一方面,京東供應鏈的復雜場(chǎng)景產(chǎn)生的真實(shí)數據可以訓練大模型,讓大模型在供應鏈上先跑起來(lái);進(jìn)而,不斷成長(cháng)的大模型又將賦能供應鏈,激發(fā)更大的改變。
這種結構像極了DNA,不斷延伸延展,孕育無(wú)限可能。也在述說(shuō)著(zhù),更適合企業(yè)的大模型真的可以一邊跑一邊訓出來(lái)。
DNA結構,圖源:University of Minnesota Libraries
種一棵樹(shù)最好的時(shí)間是十年前,其次是現在。
京東云對大模型深耕落地產(chǎn)業(yè)的理解,不是種樹(shù),而是種森林。
這種“森林思維”很契合大模型的養成。
以往我們發(fā)展大模型,尤其是通用大模型,缺芯片導致算力不足,算法也有差距也就罷了,連原本應該最豐富的數據,也因為數據標準化等諸多問(wèn)題,而變得無(wú)法用于大模型的訓練。
甚為可惜。
不過(guò),京東云做產(chǎn)業(yè)大模型的歷程展示了一條因地制宜的發(fā)展國產(chǎn)大模型的新的路徑。
和生產(chǎn)場(chǎng)景無(wú)限接近,加上互聯(lián)網(wǎng)企業(yè)的基因,讓京東云在特定的領(lǐng)域積累了大量?jì)?yōu)質(zhì)的數據,這些數據對于產(chǎn)業(yè)、垂類(lèi)大模型是再優(yōu)質(zhì)不過(guò)的養料。
多年以前,面對復雜的消費和零售價(jià)值鏈,劉強東將每個(gè)環(huán)節總結成“十節甘蔗”,隨后京東選擇滲透進(jìn)入更多的甘蔗節數——將業(yè)務(wù)延伸至倉儲、配送、售后、營(yíng)銷(xiāo)之外的生產(chǎn)、研發(fā)等供應鏈其他環(huán)節。
如今吃透每個(gè)環(huán)節,讓京東的產(chǎn)業(yè)大模型在應對具體的場(chǎng)景時(shí)就仿佛含著(zhù)金鑰匙出生。
中國企業(yè)有望證實(shí)大模型第二條商業(yè)路徑的合理性。
如今,全球通用大模型競爭白熱化,對高端GPU的追求,堆爆了英偉達的股價(jià),讓其一度超越蘋(píng)果、微軟,登頂全球最大市值企業(yè),也同時(shí)讓大多數渴望大模型引發(fā)傳統產(chǎn)業(yè)嬗變的企業(yè)開(kāi)始望洋興嘆。
因為它們既不好用,更加用不起。
國際通行的評判大模型的標準是算力、算法、數據。以京東云為代表的一部分中國企業(yè)則以自己與產(chǎn)業(yè)的高度融合,提出了大模型產(chǎn)業(yè)落地“新三要素”:場(chǎng)景、產(chǎn)品、算力。
復雜的交互智能場(chǎng)景及其產(chǎn)生的動(dòng)態(tài)數據、從單一算法競爭到形成可以牽引成體系算法創(chuàng )新與突破的產(chǎn)品和能支撐這樣的場(chǎng)景與系統的新型算力。
基本理念是基座大模型靠堆卡訓練,企業(yè)大模型靠人用出來(lái)。
本次2024京東云峰會(huì ),京東云發(fā)布三大智能平臺、五大領(lǐng)先技術(shù)產(chǎn)品,從基礎設施到Agent應用,構建全場(chǎng)景的大模型服務(wù)能力,持續推動(dòng)大模型落地產(chǎn)業(yè):
· 京東云企業(yè)大模型服務(wù),支持一站式打造企業(yè)專(zhuān)屬大模型,將垂直領(lǐng)域知識注入到模型的同時(shí),不損失模型的通用能力,且更加經(jīng)濟適用;
· 言犀AI開(kāi)發(fā)計算平臺2.0,內置20余種開(kāi)源模型和豐富的數據集,提供100余種算法和工具鏈,提供低門(mén)檻、高性?xún)r(jià)比的大模型開(kāi)發(fā)服務(wù);
· 京東云大模型安全可信平臺,涵蓋超過(guò)200種特有的紅藍對抗攻擊手法,覆蓋監管合規要求的全部31類(lèi)風(fēng)險類(lèi)型,風(fēng)險分析準確率高達95%以上;
· 京東云云艦AI算力云,支持多地域分布式算力的統一調度,提供高性?xún)r(jià)比的算力供給;
· 新一代分布式存儲云海3.0,支持千億級參數AI大模型,4K隨機寫(xiě)IOPS達到1000萬(wàn)級,平均延遲在100微秒級,極致性能更好地支持大模型落地應用。
真正適合企業(yè)的越來(lái)越多的大模型應用,正在京東供應鏈上生長(cháng)出來(lái)。在內部業(yè)務(wù)中根據實(shí)際需求找到大模型落地的場(chǎng)景后,京東云已能對外輸出能力。
今年京東618期間,京東云言犀數字人在5000+品牌穩定開(kāi)播,在汽車(chē)、跨境美妝、珠寶首飾、3C數碼、家電家居、醫療健康等多品類(lèi)播間帶動(dòng)閑時(shí)轉化率提升超30%,直播累計時(shí)長(cháng)超40萬(wàn)小時(shí),累計觀(guān)看人次超1億,互動(dòng)頻次500萬(wàn)+次。
京東云言犀數字人依托全新升級的3.0版本,以超100個(gè)性化角色、超50行業(yè)特定屬性場(chǎng)景,表現超過(guò)行業(yè)80%的主播。除電商直播場(chǎng)景外,言犀數字人還在文旅、金融、智能服務(wù)、政務(wù)咨詢(xún)等更廣泛的場(chǎng)景應用落地,與億級用戶(hù)智能交互,帶來(lái)下一代交互體驗。
健康大模型京醫千詢(xún)成為基于行業(yè)內首個(gè)實(shí)物與服務(wù)相聯(lián)通、知識與數據相融合的醫療大模型。免費智能醫生“康康”結合京東健康億級醫患會(huì )話(huà)和豐富的實(shí)物、服務(wù)、內容等供應鏈資源,提供專(zhuān)業(yè)咨詢(xún)服務(wù);專(zhuān)屬個(gè)人醫助支持病情收集、診斷推薦、治療方案推薦、病情解釋、智能病歷等功能,全流程輔助醫生提升問(wèn)診效率。如今京東健康皮膚醫院基于大模型的AI輔診準確率超過(guò)95%。
“道生一,一生二,二生三,三生萬(wàn)物?!薄兜赖陆?jīng)》認為天地萬(wàn)物的始基與母源在于“道”。在供應鏈和大模型的“宇宙”中,京東云尋到了“道”。
2017年京東戰略會(huì )上,劉強東高喊“技術(shù)、技術(shù)、技術(shù)”的戰略。7年過(guò)去了,京東云在大模型產(chǎn)業(yè)應用實(shí)踐中,成為這家企業(yè)戰略遠見(jiàn)與定力的力證。
什么是新質(zhì)生產(chǎn)力?
什么是最優(yōu)的產(chǎn)業(yè)轉型升級路徑?
在新技術(shù)激蕩的時(shí)代,其實(shí)就是用新技術(shù)把你熟悉的一切從頭到腳重新做一遍。
當大模型落地離我們越來(lái)越近,京東云再次選擇把大模型做實(shí),把供應鏈做透。
其實(shí)腳踏實(shí)地,與仰望星空并不沖突。京東云能讓大模型與有史以來(lái)最龐大的世界工廠(chǎng)的融合得多一點(diǎn),更順滑一點(diǎn),那樣的情景都足以令人心潮澎湃。
相關(guān)稿件