繼ChatGPT這一現象級的應用推出一年之后,近日,美國開(kāi)放人工智能研究中心OpenAI正式發(fā)布了旗下首款視頻生成模型Sora,再次在全球掀起了人工智能關(guān)注浪潮。相較于此前的視頻生成模型,Sora在底層模型和算法上進(jìn)行了創(chuàng )新,被業(yè)界稱(chēng)為視頻生成領(lǐng)域的里程碑。因此,Sora的問(wèn)世令世人驚呼:現實(shí)不存在了!
從自動(dòng)生成文字到自動(dòng)生成圖片,再到現如今自動(dòng)生成視頻,人工智能大模型技術(shù)在加速迭代。中央財經(jīng)大學(xué)數字經(jīng)濟融合創(chuàng )新發(fā)展中心主任陳端在接受《證券日報》記者采訪(fǎng)時(shí)表示:“人工智能技術(shù)的國際競爭,本質(zhì)上是國家創(chuàng )新力、創(chuàng )新生態(tài)以及創(chuàng )新資源體系的全方位競爭。國內人工智能相關(guān)企業(yè)擁有龐大的市場(chǎng)需求和豐富的數據資源等優(yōu)勢,正緊抓時(shí)間窗口,加強國際交流與合作,加快技術(shù)創(chuàng )新和商業(yè)化步伐,創(chuàng )造更多應用與成果。全球人工智能產(chǎn)業(yè)正進(jìn)入加速發(fā)展階段?!?/p>
為什么Sora引發(fā)關(guān)注潮?
Sora作為文字轉視頻模型,能夠嚴格根據用戶(hù)輸入的提示詞、文本指令或靜態(tài)圖像,生成長(cháng)達1分鐘的視頻,保持較高的視覺(jué)質(zhì)量。據OpenAI官網(wǎng)介紹,該公司正在努力教人工智能“理解和模擬處在運動(dòng)當中的物理世界”。
國海證券2月18日發(fā)布研報認為,Sora體現出大模型進(jìn)化速度的超預期。截至2023年12月份,ChatGPT用戶(hù)數1.8億,網(wǎng)站月均訪(fǎng)問(wèn)量17億次,OpenAI估值超1000億美元,Sora的發(fā)布將打開(kāi)OpenAI用戶(hù)量?jì)r(jià)和估值空間。
據悉,Sora相較于過(guò)去幾款主流文生視頻工具有了極大幅度的提升。華金證券分析師方聞千表示,Sora生成的視頻具有超長(cháng)時(shí)長(cháng)、世界模型、多鏡頭切換三大特點(diǎn)。具體來(lái)看,之前幾款主流模型生成的視頻時(shí)長(cháng)僅在20秒以?xún)?#xff0c;Sora不僅能夠深入理解用戶(hù)提示,還學(xué)會(huì )了物理世界的部分規律,比如:一個(gè)人吃漢堡后會(huì )留下咬痕、火車(chē)車(chē)窗上會(huì )產(chǎn)生逼真的倒影,Sora還可在單個(gè)視頻中設計出多個(gè)鏡頭。
繼文字生成和圖像生成技術(shù)之后,Sora是視頻生成技術(shù)方面的突破性進(jìn)展。短期來(lái)看,Sora將直接改變很多內容產(chǎn)業(yè)的成本結構以及資源支撐體系。薩摩耶云科技集團首席經(jīng)濟學(xué)家鄭磊向《證券日報》記者表示:“Sora的誕生將對影視、廣告、教育、游戲等多個(gè)行業(yè)產(chǎn)生直接影響。例如,視頻創(chuàng )作者可以專(zhuān)注于更具創(chuàng )意性和戰略性的工作,而將繁瑣的重復性工作交給人工智能?!?/p>
陳端表示:“長(cháng)期來(lái)看,Sora將遠遠不止是內容生產(chǎn)工具,其構建的基于三維物理世界來(lái)創(chuàng )造數字原生世界的強大引擎,將給一些產(chǎn)業(yè)從底層工具層面帶來(lái)變化,形成深遠影響?!?60集團創(chuàng )始人、董事長(cháng)周鴻祎2月16日在其微博上表示,Sora意味著(zhù)AGI(人工通用智能)實(shí)現將從10年縮短到1年。
不過(guò),目前的Sora仍存在一定局限性。例如,它可能難以精確模擬復雜場(chǎng)景的物理狀況,也可能無(wú)法理解一些特定的因果和時(shí)間聯(lián)系等。此外,模型還可能混淆一些文本指令中的空間細節,例如左右方向等。據了解,相關(guān)領(lǐng)域專(zhuān)家將對模型展開(kāi)測試,目前,該模型只向有限數量的創(chuàng )作者提供訪(fǎng)問(wèn)權限。
中國信息協(xié)會(huì )常務(wù)理事、國研新經(jīng)濟研究院創(chuàng )始院長(cháng)朱克力向《證券日報》記者表示:“要用好Sora,企業(yè)首先需深入了解其技術(shù)特性和應用場(chǎng)景,其次要積極探索Sora與其他技術(shù)的結合,如與虛擬現實(shí)、增強現實(shí)等技術(shù)的融合應用。同時(shí),還應注意數據安全和隱私保護等問(wèn)題?!?/p>
多家上市公司涉足相關(guān)領(lǐng)域
2023年,科技大廠(chǎng)、創(chuàng )業(yè)企業(yè)、科研院所等紛紛入局AI大模型,目前,我國大數據、云計算、人工智能企業(yè)創(chuàng )新發(fā)展,數字產(chǎn)業(yè)化體系逐漸完備,并向全球產(chǎn)業(yè)鏈中高端躍進(jìn)。政策端,《生成式人工智能服務(wù)管理暫行辦法》《關(guān)于加快推進(jìn)視聽(tīng)電子產(chǎn)業(yè)高質(zhì)量發(fā)展的指導意見(jiàn)》等陸續出臺,既促進(jìn)了人工智能大模型技術(shù)的創(chuàng )新發(fā)展和生成式人工智能產(chǎn)業(yè)健康發(fā)展,也進(jìn)一步規范制度引領(lǐng)技術(shù)落地。
今年春節期間,支付寶等平臺陸續推出了人工智能全家福照片制作功能,上傳家人照片可以生成不同風(fēng)格背景的全家福照片,生成式人工智能工具在圖生圖領(lǐng)域的落地應用已經(jīng)被公眾廣泛接納。
在視頻生成領(lǐng)域,公開(kāi)信息顯示,已有??低?、佳都科技、昆侖萬(wàn)維、大華股份、螢石網(wǎng)絡(luò )、萬(wàn)興科技、因賽集團、拓爾思、當虹科技等多家A股上市公司積極布局。
例如,佳都科技公布了其自主研發(fā)的國產(chǎn)化的大模型技術(shù),聚焦在交通、城市治理、政務(wù)服務(wù)等垂直領(lǐng)域的應用,公司的TransCore-M多模態(tài)大模型能夠理解文本、圖像、視頻等多種模態(tài)的信息,并且按照用戶(hù)需求將其描述、提示或轉化為指令代碼,是個(gè)“聰明”的交通信息小助手。
當虹科技擁有自研的生成式人工智能工具集,于2023年上半年發(fā)布了以靜態(tài)照片生成三維體積視頻的方案,支持六自由度視角自由移動(dòng),并且通過(guò)點(diǎn)云模型轉換及壓縮算法實(shí)現高達800倍的視覺(jué)無(wú)損壓縮,實(shí)現不同模態(tài)之間相互切換。
我國在人工智能技術(shù)和大模型領(lǐng)域已經(jīng)取得了顯著(zhù)的進(jìn)展,但與國際領(lǐng)先水平相比,仍存在一些短板。中國電子商務(wù)專(zhuān)家服務(wù)中心副主任、資深人工智能專(zhuān)家郭濤在接受《證券日報》記者采訪(fǎng)時(shí)表示:“這些短板包括原創(chuàng )算法的研發(fā)、高質(zhì)量數據集的構建、芯片和硬件的自主研發(fā)能力、國際化人才的吸引和培養等方面?!?/p>
中國移動(dòng)通信聯(lián)合會(huì )區塊鏈與數據要素專(zhuān)業(yè)委員會(huì )主任委員、首席數字經(jīng)濟學(xué)家陳曉華表示,近年來(lái),我國相關(guān)政策對人工智能技術(shù)應用和大模型的技術(shù)研發(fā)和產(chǎn)業(yè)創(chuàng )新提供了良好環(huán)境,但由于前期投入不足,在基礎研究和核心算法的原始創(chuàng )新上還有差距。
陳曉華說(shuō):“人工智能革命將會(huì )推動(dòng)算力基礎設施的需求猛增,此外文生視頻大模型將帶動(dòng)視頻數據的調用規模持續放大,這對寬帶質(zhì)量也提出了更高的要求?!?/p>
商務(wù)部研究院電子商務(wù)研究所副研究員洪勇向《證券日報》記者表示:“國際上,部分大型科技公司憑借雄厚的技術(shù)積累和資源在人工智能賽道占據領(lǐng)先地位。中國企業(yè)在某些細分領(lǐng)域已具備國際競爭力,但仍有短板。當下需要清醒意識到差距,加強基礎科研、培養高層次人才、建立合規體系,并積極參與國際合作與競爭,進(jìn)一步提升在全球人工智能領(lǐng)域的地位?!?#xff08;記者 郭冀川 丁蓉)
相關(guān)稿件