5月10日消息,近期中國移動(dòng)研究院發(fā)布《我國人工智能大模型發(fā)展動(dòng)態(tài)》報告,對國內涉足人工智能大模型訓練的多家企業(yè)及科研院所進(jìn)行評估。中國移動(dòng)研究院認為,從大模型業(yè)界評估看,國內大模型與GPT-4有差距,但科技大廠(chǎng)具備追趕實(shí)力,百度、阿里巴巴、騰訊、華為等在大模型研發(fā)投入、技術(shù)能力和人才團隊等綜合實(shí)力較強;在商用推進(jìn)方面,依托現有業(yè)務(wù)領(lǐng)域形成大模型應用規模效應。
報告指出,國內大模型研發(fā)應用領(lǐng)域熱潮持續高漲。據不完全統計,目前國內至少有19家企業(yè)及科研院所涉足人工智能大模型訓練,主要分為大型科技公司、科研院校和初創(chuàng )科技團隊三類(lèi)。
從大模型的布局體系來(lái)看,百度、阿里、華為等大型科技公司從算力層、平臺層、模型層、應用層進(jìn)行了全面布局,科研院及初創(chuàng )科技公司主要以研發(fā)大模型算法及細分領(lǐng)域應用為主。以百度為例,百度“昆侖芯+飛槳平臺+文心大模型+行業(yè)應用”在芯片層、框架層、模型層和應用層布局最完整。四層架構之間能形成層到層的反饋、端到端的優(yōu)化,尤其是框架層的飛槳和模型層的文心大模型。最新數據顯示,飛槳與文心一言協(xié)同專(zhuān)項優(yōu)化在一個(gè)月內迭代4次,推理性能提升10倍,其中分布式推理引擎推理性能提升了123%。阿里的“含光800芯片+M6-OFA底座+通義大模型+行業(yè)應用”、華為的“昇騰芯片+MindSpore框架+盤(pán)古大模型+行業(yè)應用”也是多層布局。
報告認為,從大模型參數量看,大型科技公司的參數量遠大于科研院所,但基本都處于千億及以上規模,而科研院校大模型的參數量在千億級及以下。公開(kāi)資料顯示,2019年,百度發(fā)布文心大模型ERNIE,目前已迭代至千億級參數的ERNIE3.0Zeus。2023年3月起,百度相繼發(fā)布了知識增強大語(yǔ)言模型產(chǎn)品“文心一言”和一站式企業(yè)級大模型生產(chǎn)平臺“文心千帆大模型平臺”。
報告數據顯示,從綜合實(shí)力和商用推進(jìn)方面,百度文心大模型和文心一言均領(lǐng)先,處于第一梯隊頭部。在商用推進(jìn)方面,百度文心大模型拓展內外部應用,目前面向公眾和企業(yè)用戶(hù)同時(shí)進(jìn)行開(kāi)放測試。文心大模型在金融、能源、制造、城市、傳媒、互聯(lián)網(wǎng)等行業(yè)應用案例落地廣泛。截至目前,已經(jīng)有15萬(wàn)企業(yè)申請加入文心一言?xún)葴y,覆蓋政務(wù)、金融、媒體、電商零售等行業(yè)。
另?yè)?#xff0c;國際權威咨詢(xún)機構IDC在今年2月發(fā)布的《2022中國大模型發(fā)展白皮書(shū)》中,提出了行業(yè)首個(gè)大模型評估框架,根據評估結果,百度文心大模型在市場(chǎng)格局中同樣處于第一梯隊領(lǐng)先位置,產(chǎn)品能力、生態(tài)能力、應用能力均受到廣泛認可。
相關(guān)稿件