新大模型可根據(jù)文本生成高清視頻: 2024-04-28 09:33 來源：科技日報次閱讀; 分享：

　　科技日報北京4月27日電（記者何亮）27日，在中關村論壇未來人工智能先鋒論壇上，清華大學聯(lián)合北京生數(shù)科技有限公司（以下簡稱“生數(shù)科技”）正式發(fā)布中國首個原創(chuàng)全自研視頻大模型——Vidu。論壇現(xiàn)場，清華大學教授、生數(shù)科技首席科學家朱軍向與會者展示了Vidu生成的視頻，包括行駛在崎嶇道路上的汽車、戴珍珠耳環(huán)的貓、彈吉他的熊貓等。與此前震撼業(yè)界的Sora一樣，Vidu能夠根據(jù)文本描述直接生成高質(zhì)量視頻。

　　“長時長、高一致性、高動態(tài)性”是Vidu的顯著特征。朱軍表示，研發(fā)團隊的核心技術在于采用U-ViT架構。它由Diffusion與Transformer兩個模型融合而來，可支持一鍵生成長達16秒的高清視頻內(nèi)容。

　　除了在時長方面優(yōu)勢突出，Vidu在視頻效果方面也實現(xiàn)顯著提升。朱軍介紹，Vidu能模擬真實物理世界，生成的視頻不但場景細節(jié)復雜，而且符合物理規(guī)律，例如合理的光影效果、細膩的人物表情等。Vidu還具有豐富的想象力，能生成真實世界不存在的虛構畫面，創(chuàng)造出具有深度和復雜性的超現(xiàn)實主義內(nèi)容。此外，Vidu可理解多鏡頭語言，生成的視頻不再局限于簡單的推、拉、移等固定鏡頭，而是圍繞同一主體實現(xiàn)遠景、中景、近景、特寫等不同鏡頭的切換，甚至能直接生成長鏡頭、追焦、轉(zhuǎn)場等效果，給視頻注入豐富的鏡頭表達。Vidu還獨具文化特色，能很好理解中國元素，生成熊貓、龍等中國元素的視頻。

　　值得一提的是，論壇上展示的視頻都是從頭到尾連續(xù)生成，沒有明顯的插幀現(xiàn)象。朱軍說，與Sora一樣，Vidu在文本到視頻的轉(zhuǎn)換過程中直接且連續(xù)，而且在底層算法上，是由單一模型完全端到端生成，不涉及插幀和其他多步驟處理。

點贊()

上一條：中關村論壇突出“科技辦會”2024-04-27

下一條：北京人形機器人研發(fā)迎來關鍵突破2024-04-28

相關稿件: 多家A股公司積極布局視頻生成模型賽道 2024-02-19; 國內(nèi)企業(yè)競速“垂直大模型”新賽道 2023-07-27; 生成式人工智能“飛入尋常百姓家” 大模型賦能千行百業(yè) 2023-07-08; 2月27日，NBO新商業(yè)機會暨無界生態(tài)AI大模型發(fā)布會成功舉辦！ 2024-03-02; 大模型，冷靜！ 2023-07-25

九九九中文无码A∨|亚洲国产成人最新精品|国产AV无码精品色午夜|国产精品久久久久三级无码|日韩欧美一区国产二区在线|欧美另类精品一区二区三区|精品一区二区三区毛片视频网|中文字幕日韩精品一区二区三区

新大模型可根據(jù)文本生成高清視頻