近日,騰訊公司的人工智能大模型“混元”在2023騰訊全球數字生態(tài)大會(huì )上正式亮相,該大模型在中文創(chuàng )作、復雜語(yǔ)境下的邏輯推理、可靠的任務(wù)執行等方面具有技術(shù)優(yōu)勢。
當前,國內科技龍頭企業(yè)密集推出人工智能大模型,呈現百花齊放、迅猛發(fā)展的態(tài)勢,騰訊、華為、阿里、百度等巨頭紛紛入局,投入資源、潛心研究。隨著(zhù)國產(chǎn)大模型進(jìn)入高速發(fā)展期,業(yè)內逐步認識到,大模型不僅僅是聊天機器人,更能加速千行百業(yè)的數字化與智能化轉型。面向未來(lái),大模型將與越來(lái)越多應用場(chǎng)景相結合,為實(shí)體經(jīng)濟帶來(lái)新機遇。
呈爆發(fā)式增長(cháng)態(tài)勢
來(lái)自騰訊公司的消息顯示,騰訊混元大模型掌握了從模型算法到機器學(xué)習框架,再到人工智能基礎設施的全鏈路技術(shù)。事實(shí)上,從2021年開(kāi)始,騰訊先后研發(fā)了多個(gè)千億和萬(wàn)億級參數的大模型,并在實(shí)際應用中優(yōu)化大模型底層算法,提升工程能力。
在2023騰訊全球數字生態(tài)大會(huì )現場(chǎng),騰訊公司相關(guān)負責人展示了在接入騰訊混元大模型后,騰訊會(huì )議、騰訊文檔、騰訊廣告等產(chǎn)品性能得到的顯著(zhù)提升。目前,混元大模型已作為核心引擎支持了50多個(gè)騰訊內部應用。
8月31日,百度生成式人工智能產(chǎn)品“文心一言”正式向公眾開(kāi)放服務(wù),互聯(lián)網(wǎng)普通用戶(hù)可以下載體驗。7月,華為公司也發(fā)布了人工智能大模型“盤(pán)古大模型3.0”,包含以“鯤鵬”“昇騰”為基礎的AI算力、計算引擎、全場(chǎng)景AI框架以及AI開(kāi)發(fā)平臺等。
今年以來(lái),我國人工智能大模型掀起了一輪發(fā)展熱潮。中國電子信息產(chǎn)業(yè)發(fā)展研究院下屬賽迪顧問(wèn)公司發(fā)布的研究報告顯示,我國2021年開(kāi)啟了對大模型的探索,逐步涌現出一批具有行業(yè)影響力的大模型。2023年,受ChatGPT影響,大模型發(fā)展邁向新階段,國產(chǎn)大模型一時(shí)間呈現爆發(fā)式增長(cháng)態(tài)勢。截至2023年7月,我國累計已經(jīng)發(fā)布130個(gè)大模型。
破解痛點(diǎn)打開(kāi)思路
當前,大模型正在成為推動(dòng)新一輪科技創(chuàng )新、產(chǎn)業(yè)升級、生產(chǎn)力躍遷的重要力量。隨著(zhù)前沿技術(shù)推動(dòng)產(chǎn)業(yè)全鏈條升級,未來(lái)從田間到產(chǎn)線(xiàn),從實(shí)驗室到便利店,大模型可能會(huì )無(wú)處不在。
在公布混元大模型的同時(shí),騰訊也表示將通過(guò)騰訊云開(kāi)放大模型的能力,為各行各業(yè)的數字化提供技術(shù)支持。企業(yè)用戶(hù)可以直接調用騰訊混元大模型,也可以將其作為基底模型,從技術(shù)底座、平臺能力、智能應用等維度構建專(zhuān)屬大模型及智能應用。
騰訊集團高級執行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生表示,以大模型生成技術(shù)為核心,人工智能正在成為下一輪數字化發(fā)展的關(guān)鍵動(dòng)力,為解決產(chǎn)業(yè)痛點(diǎn)帶來(lái)了全新的思路。
清華大學(xué)人工智能研究院視覺(jué)智能研究中心主任鄧志東認為,大模型的價(jià)值在于應用,要在多樣化的實(shí)際應用場(chǎng)景中賦能智能經(jīng)濟與智能社會(huì )的發(fā)展。中國工程院院士鄔賀銓也認為,除了對話(huà)、寫(xiě)詩(shī)、作畫(huà)等應用之外,要將大模型切實(shí)投入到城市發(fā)展、金融科技、生物醫藥、工業(yè)制造、科學(xué)研究等領(lǐng)域,在實(shí)體產(chǎn)業(yè)落地,為社會(huì )經(jīng)濟帶來(lái)實(shí)實(shí)在在的價(jià)值。
事實(shí)上,利用大模型加速千行百業(yè)的數字化、智能化轉型,深耕實(shí)體經(jīng)濟行業(yè),正在成為業(yè)界的共同選擇。
中國電子科技集團旗下企業(yè)6月初發(fā)布了生成式人工智能大模型產(chǎn)品“小可”,能夠構建工廠(chǎng)一體化流轉平臺,實(shí)現崗位工人、產(chǎn)線(xiàn)設備、信息系統之間基于自然語(yǔ)言的交互,優(yōu)化工廠(chǎng)自動(dòng)化、數字化、智能化運作流程;位于深圳的鵬城實(shí)驗室此前也發(fā)布消息稱(chēng),該實(shí)驗室將推出“鵬城·腦?!贝竽P陀媱?#xff0c;打造安全可控、開(kāi)源開(kāi)放的自然語(yǔ)言預訓練大模型底座,尤其是面向數字政務(wù)、智慧金融、智能制造等應用場(chǎng)景;華為盤(pán)古大模型實(shí)現了對煤礦的采、掘、運、洗、選等多個(gè)細分場(chǎng)景全覆蓋,幫助煤礦企業(yè)構建安全高效的智能化系統,目前已在全國近10個(gè)礦井實(shí)現規?;瘧?。
賽迪顧問(wèn)公司的研究報告還顯示,從大模型應用類(lèi)型來(lái)看,國外研發(fā)的大模型主要以通用大模型為主,而我國國產(chǎn)大模型更加貼近產(chǎn)業(yè)端,呈現出行業(yè)大模型占比較高的發(fā)展形態(tài)?!耙源竽P蜕杉夹g(shù)為核心,人工智能正在成為下一輪數字化發(fā)展的關(guān)鍵動(dòng)力,為解決產(chǎn)業(yè)痛點(diǎn)帶來(lái)了全新的思路?!彬v訊集團高級執行副總裁、云與智慧產(chǎn)業(yè)事業(yè)群CEO湯道生說(shuō)。
加快布局夯實(shí)根基
記者調研發(fā)現,大模型的性能主要受算力、數據、算法三方面因素影響。在算法方面,國產(chǎn)大模型與國際先進(jìn)水平相比沒(méi)有根本性差異,基本都是圍繞深度神經(jīng)網(wǎng)絡(luò )、注意力機制、人工調優(yōu)等基礎算法上進(jìn)行模型結構或局部算法優(yōu)化,而在算力、數據等方面則與國際先進(jìn)水平存在差距。
受訪(fǎng)專(zhuān)家表示,加快布局大模型及其相關(guān)產(chǎn)業(yè),盡快實(shí)現關(guān)鍵性突破,建議從算力、數據等方面進(jìn)一步夯實(shí)國產(chǎn)大模型根基。
第一,加快推進(jìn)算力基礎設施建設。推進(jìn)鵬城云腦三期等國家重大算力基礎設施建設,并以此為基礎進(jìn)一步形成覆蓋全國的算力網(wǎng)絡(luò ),使得算力的供給與使用像電網(wǎng)、水網(wǎng)一樣觸手可及。此外,建設技術(shù)創(chuàng )新中心、生態(tài)實(shí)驗室等平臺,加強中試與驗證,帶動(dòng)產(chǎn)業(yè)鏈上下游企業(yè)共同攻關(guān)突破新技術(shù)、研發(fā)新產(chǎn)品。
第二,建立可信數據聯(lián)盟,為國產(chǎn)大模型訓練提供安全的高質(zhì)量數據,組建面向人工智能大模型的可信數據聯(lián)盟,提供高質(zhì)量的豐富中文語(yǔ)料庫,打造數字時(shí)代“四庫全書(shū)”。
第三,打造關(guān)鍵領(lǐng)域大模型建設的標桿示范工程,發(fā)揮標桿示范工程的引領(lǐng)帶動(dòng)作用,帶動(dòng)各行業(yè)積極融入大模型發(fā)展進(jìn)程,加快形成一批符合國家需求的軟硬件產(chǎn)品和解決方案,形成需求牽引供給、供給創(chuàng )造需求的良性循環(huán)。
相關(guān)稿件