7月6日,2023世界人工智能大會(huì )(WAIC)在上海世博中心開(kāi)幕,眾多專(zhuān)家學(xué)者、科技領(lǐng)軍人才、企業(yè)代表共同探討人工智能賦能產(chǎn)業(yè)發(fā)展的全新變化,展望技術(shù)新趨勢。百度首席技術(shù)官、深度學(xué)習技術(shù)及應用國家工程研究中心主任王海峰解讀文心大模型3.5版核心技術(shù),發(fā)布飛槳生態(tài)最新進(jìn)展,闡述人工智能產(chǎn)業(yè)模式,為人工智能技術(shù)及產(chǎn)業(yè)最新發(fā)聲。
飛槳已凝聚750萬(wàn)名開(kāi)發(fā)者,文心3.5效果提升50%,推理速度提升30倍 當前,以大語(yǔ)言模型為代表的人工智能技術(shù)在全球掀起科技和產(chǎn)業(yè)創(chuàng )新浪潮,加速產(chǎn)業(yè)升級和經(jīng)濟增長(cháng),各行各業(yè)都將發(fā)生巨大變化。IT技術(shù)棧發(fā)生根本性改變,從芯片、操作系統和應用三層架構,轉變?yōu)樾酒?、框架、模型、應用四層架構。深度學(xué)習框架和大模型構成了產(chǎn)業(yè)智能化基座,將支撐各行各業(yè)的應用智能化重構,促進(jìn)經(jīng)濟高質(zhì)量發(fā)展。
據了解,百度在人工智能四層技術(shù)棧均有布局和領(lǐng)先的自研技術(shù),尤其在位于四層架構核心的框架層和模型層。文心大模型的最新成果,也得益于飛槳深度學(xué)習平臺和文心的聯(lián)合優(yōu)化。飛槳是我國第一個(gè)自主研發(fā)的產(chǎn)業(yè)級深度學(xué)習開(kāi)源開(kāi)放平臺,在中國深度學(xué)習平臺綜合市場(chǎng)份額上連續兩年位居第一。王海峰現場(chǎng)透露,截至目前飛槳已凝聚750萬(wàn)名開(kāi)發(fā)者,這也是百度2023年以來(lái)首次對外披露飛槳生態(tài)最新數據。
百度自2019年3月文心大模型發(fā)布1.0版后,歷經(jīng)四年技術(shù)深耕和研發(fā)迭代,現已升級到文心大模型3.5。王海峰表示,文心大模型3.5效果、功能、性能全面提升,實(shí)現了基礎模型升級、精調技術(shù)創(chuàng )新、知識點(diǎn)增強、邏輯推理增強等,模型效果提升50%,訓練速度提升2倍,推理速度提升30倍。
核心技術(shù)持續突破,效果和效率齊躍升 今年3月,百度在全球大型科技公司中第一個(gè)發(fā)布了大語(yǔ)言模型文心一言。文心一言是知識增強的大語(yǔ)言模型,首先從數萬(wàn)億數據和數千億知識中融合學(xué)習得到預訓練大模型,在此基礎上采用有監督精調、人類(lèi)反饋的強化學(xué)習和提示等技術(shù),并具備知識增強、檢索增強和對話(huà)增強等技術(shù)優(yōu)勢。
王海峰解讀了文心大模型3.5的核心技術(shù)創(chuàng )新,在基礎模型訓練上,采用了飛槳最先進(jìn)的自適應混合并行訓練技術(shù)及混合精度計算策略,并采用多種策略?xún)?yōu)化數據源及數據分布,加快了模型迭代速度,顯著(zhù)提升了模型效果和安全性。同時(shí),創(chuàng )新了多類(lèi)型多階段有監督精調、多層次多粒度獎勵模型、多損失函數混合優(yōu)化策略、雙飛輪結合的模型優(yōu)化等技術(shù),進(jìn)一步提升模型效果及場(chǎng)景適配能力。
在知識增強和檢索增強基礎上,文心大模型3.5提出了“知識點(diǎn)增強技術(shù)”,對用戶(hù)輸入的查詢(xún)、問(wèn)題等進(jìn)行分析理解,解析出生成答案所需要的相關(guān)知識點(diǎn),之后運用知識圖譜和搜索引擎為這些知識點(diǎn)找到相應答案,最后再用這些知識點(diǎn)構造輸入給大模型的提示,為大模型注入更具體、更詳細、更專(zhuān)業(yè)的知識點(diǎn),顯著(zhù)提升大模型對世界知識的掌握和運用。
在推理方面,通過(guò)大規模邏輯數據構建、邏輯知識建模、多粒度語(yǔ)義知識組合以及符號神經(jīng)網(wǎng)絡(luò )技術(shù),提升文心大模型3.5在邏輯推理、數學(xué)計算及代碼生成等任務(wù)上的表現。
新增插件機制,拓展大模型能力邊界 文心大模型3.5新增了插件機制,文心一言已經(jīng)于6月17日對外發(fā)布官方插件百度搜索和ChatFile。百度搜索是默認的內置插件,使得文心一言具備生成實(shí)時(shí)準確信息的能力。ChatFile是長(cháng)文本摘要和問(wèn)答插件,支持超長(cháng)文本輸入。
王海峰表示,文心一言將發(fā)布更多優(yōu)質(zhì)的百度官方和第三方插件,讓用戶(hù)能夠更好地應用文心大模型,同時(shí)也將逐步開(kāi)放插件生態(tài),幫助開(kāi)發(fā)者基于文心大模型打造自己的應用。
廣泛應用于各類(lèi)場(chǎng)景,加速產(chǎn)業(yè)智能化升級
現場(chǎng)王海峰展現了文心一言在辦公、會(huì )議、編碼等場(chǎng)景的應用,文心一言成為工作中的“超級助理”,幫助總結工作溝通要點(diǎn),實(shí)時(shí)記錄會(huì )議內容,形成會(huì )議議題、摘要及總結等關(guān)鍵信息,可以通過(guò)各類(lèi)插件完成指令任務(wù),包括查詢(xún)日程、創(chuàng )建會(huì )議、設置待辦、申請休假等,也可以在工程師編碼過(guò)程中自動(dòng)推薦和生成代碼。據悉,目前這些功能已通過(guò)智能工作平臺“如流”應用于百度的工作流程中,幫助提升工作效率,提高決策質(zhì)量。
王海峰表示,凡是要跟語(yǔ)言文字或程序代碼打交道的應用場(chǎng)景,都可能有文心一言的用武之地。已經(jīng)有很多在積極應用文心一言的場(chǎng)景,例如能源、金融、教育、辦公、媒體,等等。在文心一言這類(lèi)大模型產(chǎn)業(yè)落地的進(jìn)程中,可以采用“集約化生產(chǎn),平臺化應用”的模式,即具有算法、算力和數據綜合優(yōu)勢的企業(yè)將模型生產(chǎn)的復雜過(guò)程封裝起來(lái),通過(guò)低門(mén)檻、高效率的生產(chǎn)平臺,為千行百業(yè)提供大模型服務(wù)。