月之暗面近期宣布,支持200萬(wàn)漢字超長(cháng)無(wú)損上下文的Kimi智能助手正在內測。隨后,阿里、360集團、百度等公司緊急“出手”,紛紛入局長(cháng)文本大模型賽道,推動(dòng)人工智能領(lǐng)域投資熱情進(jìn)一步升溫。
機構人士表示,相比海外大模型,國產(chǎn)模型在中文長(cháng)文本理解方面具備比較優(yōu)勢,基礎模型能力提升有望推動(dòng)下游應用快速發(fā)展。AI模型、語(yǔ)料庫、算力租賃及運維等領(lǐng)域將持續受益。
取得技術(shù)突破
近期,AI大模型產(chǎn)品Kimi智能助手因能穩定分析處理200萬(wàn)漢字長(cháng)文“一炮走紅”。Kimi智能助手是初創(chuàng )公司月之暗面于2023年10月發(fā)布的產(chǎn)品。該公司創(chuàng )立于2023年3月,由清華大學(xué)交叉信息學(xué)院楊植麟教授領(lǐng)銜。今年3月18日,月之暗面宣布,Kimi智能助手再次取得技術(shù)突破,支持200萬(wàn)漢字上下文的Kimi智能助手已經(jīng)啟動(dòng)“內測”。
隨之而來(lái),360集團、阿里、百度等頭部廠(chǎng)商紛紛宣布升級AI大模型技術(shù)。3月22日,阿里通義千問(wèn)宣布,向所有人免費開(kāi)放1000萬(wàn)字的長(cháng)文檔處理功能。3月23日,360智腦宣布正式內測500萬(wàn)字長(cháng)文本處理功能。該功能即將入駐360AI瀏覽器。同時(shí),360AI瀏覽器APP即將上線(xiàn)。另外,百度文心一言4月份將進(jìn)行版本升級,屆時(shí)將開(kāi)放長(cháng)文本處理能力,文字范圍在200萬(wàn)-500萬(wàn)字。
“大模型升級文本長(cháng)度,是市場(chǎng)需求的直接反映?!比斯ぶ悄茴I(lǐng)域天使投資人郭濤向中國證券報記者表示,“長(cháng)文本處理需求持續增加,如學(xué)術(shù)論文、法律文件、新聞報道等。而長(cháng)文本處理能力的提升,能夠更好地模擬復雜的人類(lèi)語(yǔ)言交流,包括理解長(cháng)篇文獻、撰寫(xiě)長(cháng)篇文章等?!?/p>
賽智產(chǎn)業(yè)研究院院長(cháng)趙剛告訴記者,提升長(cháng)文本處理能力,可以解決當前大語(yǔ)言模型應用中的痛點(diǎn),使得大模型商業(yè)化應用更加成熟,更容易被用戶(hù)接受。在新的用戶(hù)需求牽引下,未來(lái)長(cháng)文本處理能力可能成為大模型的標配。率先布局長(cháng)文本訓練和推理的大模型企業(yè),在未來(lái)的競爭中將占據有利地位。
拓展應用領(lǐng)域
“從文本處理穩定性方面看,Ki-mi比ChatGPT更勝一籌。使用ChatGPT分析長(cháng)文本時(shí),很容易遇到報錯的情況,而Kimi比較少見(jiàn)?!币晃唤?jīng)常使用AI大模型工具處理文本的留學(xué)生告訴中國證券報記者。
200萬(wàn)到1000萬(wàn)漢字,國產(chǎn)大模型中文文本處理能力飛速提升。據了解,目前海外主流AI大模型GPT-4 Turbo-128k公布的文本范圍約為10萬(wàn)漢字,而Claude 3200k約為16萬(wàn)漢字。
趙剛認為,從實(shí)際應用出發(fā),國內大模型廠(chǎng)商闖出一條創(chuàng )新升級的新路線(xiàn),很大程度上縮小了與海外Open AI等大模型企業(yè)的差距。
郭濤表示,長(cháng)文本處理能力是衡量模型泛化能力的一項重要指標,其能夠更好地反映模型在處理未知或復雜數據時(shí)的表現,反映出國產(chǎn)大模型企業(yè)在自然語(yǔ)言處理(NLP)領(lǐng)域的技術(shù)創(chuàng )新能力。
文本長(cháng)度的突破會(huì )帶來(lái)哪些應用前景?趙剛認為,長(cháng)文本處理能力主要應用于知識密集的業(yè)務(wù)場(chǎng)景,比如生產(chǎn)活動(dòng)中的編制計劃、設計方案、廣告創(chuàng )意等;管理活動(dòng)中的文案撰寫(xiě)、合同編制等;文化教育中的論文撰寫(xiě)、小說(shuō)撰寫(xiě)、劇本編寫(xiě)等應用場(chǎng)景。
文本處理功能擴容帶來(lái)的應用創(chuàng )新已經(jīng)嶄露頭角。近日,華東師范大學(xué)王峰教授團隊發(fā)布國內第一部人機融合式長(cháng)篇小說(shuō)《天命使徒》,采用國內大語(yǔ)言模型+提示詞工程+人工后期潤色,整部小說(shuō)超過(guò)100萬(wàn)字。據介紹,該團隊將打造一個(gè)可供公眾使用的長(cháng)篇小說(shuō)創(chuàng )作平臺,將好的創(chuàng )意與平臺的自動(dòng)寫(xiě)作服務(wù)結合起來(lái),讓人人皆可寫(xiě)作長(cháng)篇小說(shuō)。團隊的下一個(gè)目標是將同等體量小說(shuō)創(chuàng )作由一個(gè)半月縮短為兩至三周。
值得注意的是,業(yè)內人士認為,文本長(cháng)度只是反映大模型能力的一個(gè)側面,并非評判模型訓練能力的唯一標準。郭濤表示,模型的訓練能力還包括對不同類(lèi)型數據的處理能力、模型的穩定性、可擴展性等多個(gè)維度。
“在多模態(tài)、參數規模、通用性等方面,我們與Open AI等海外企業(yè)還有一定距離?!壁w剛坦言。
相關(guān)產(chǎn)業(yè)鏈受益
長(cháng)文本處理能力對數據和算力提出了更高要求。郭濤告訴記者,首先,訓練能夠處理長(cháng)文本的模型,需要大量的高質(zhì)量長(cháng)文本數據。這些數據需要具備多樣性和代表性,確保大模型能夠學(xué)習到廣泛的語(yǔ)言模式和知識。其次,長(cháng)文本處理通常需要更復雜的模型結構,會(huì )直接增加模型訓練的計算成本。更大的模型意味著(zhù)更多的參數需要調整,需要更多算力以加速訓練過(guò)程。
大模型升級對AI算力、數據賽道的催化作用已經(jīng)體現在二級市場(chǎng)。Wind數據顯示,近20日內,AI算力指數上漲11.56%,數據要素概念指數上漲11.94%,IDC(算力租賃)概念指數上漲13.41%。
算力方面,科大訊飛3月23日在投資者互動(dòng)平臺上表示,科大訊飛算力能夠滿(mǎn)足未來(lái)一段時(shí)間AI算法模型訓練和推理的需求。景嘉微3月22日表示,公司景宏系列高性能智算模塊及整機產(chǎn)品可面向AI訓練、AI推理和科學(xué)計算等應用領(lǐng)域。
數據方面,海天瑞聲3月22日在投資者互動(dòng)平臺上表示,公司致力于為AI產(chǎn)業(yè)鏈各類(lèi)機構提供算法模型開(kāi)發(fā)訓練所需的專(zhuān)業(yè)數據集。例如,常規的結構化數據分割、信息提取整合、文本摘要等。同時(shí),公司可提供大模型強化學(xué)習相關(guān)數據處理服務(wù)。例如,對prompt的改寫(xiě)、分類(lèi)以及其回復內容續寫(xiě)改寫(xiě)等。不過(guò),公司過(guò)往并未向月之暗面提供過(guò)相關(guān)訓練數據。
華西證券認為,相比海外大模型,國產(chǎn)模型在中文長(cháng)文本理解方面具備比較優(yōu)勢,能夠有效提升使用者工作效率?;A模型能力的提升有望推進(jìn)下游應用快速發(fā)展。AI模型、語(yǔ)料庫、算力租賃及運維等板塊將繼續受益。
民生證券表示,國產(chǎn)大模型再度迎來(lái)競爭升級,以Kimi為代表的國內大模型用戶(hù)數量激增,AI算力需求或是今年最確定的投資主線(xiàn)之一。
相關(guān)稿件