◎智谷趨勢| 王延鶴
只有視頻化才能生存
隨意打開(kāi)一個(gè)APP,最顯眼的位置,放的都是視頻。
花花世界迷人眼。前100位的APP里,69個(gè)都有視頻類(lèi)功能。
想想看,你每天花多少時(shí)間刷視頻?
根據《中國網(wǎng)絡(luò )視聽(tīng)發(fā)展研究報告(2023)》統計 ,短視頻人均單日使用時(shí)長(cháng),超過(guò)2.5小時(shí)。
信息嚴重過(guò)剩,讓我們的注意力也成為一種稀缺資源。
你把時(shí)間花在哪里,命運就在哪里。
懂得這個(gè)道理的企業(yè)和品牌,紛紛開(kāi)始做內容、做直播,給產(chǎn)品添加視頻功能。
最樸實(shí)的想法,就是存量競爭時(shí),通過(guò)視頻化吸引用戶(hù)。
短短5年,中國短視頻用戶(hù),從6.48億增長(cháng)到10.12億;
2022年,中國視頻直播帶貨規模約3.5萬(wàn)億,在網(wǎng)上零售額占比高達25.4%;
出門(mén)逛街,服裝店老板娘、燒烤攤大爺,都架著(zhù)手機在直播;
周杰倫辦線(xiàn)上演唱會(huì ),有1億人觀(guān)看,大家一起唱“故事的小黃花,從出生那年就飄著(zhù)”;
就連外賣(mài)軟件也在搞直播,看菜品、發(fā)紅包,來(lái)段脫口秀。
在注意力經(jīng)濟時(shí)代,只有視頻化才能生存。
8月22日,火山引擎視頻云&AIGC技術(shù)大會(huì )召開(kāi)。
大會(huì )主題是“視象新生”,火山引擎作為抖音的技術(shù)底座,要向全行業(yè)展現當前視頻創(chuàng )新、變革的源動(dòng)力。
火山引擎總裁譚待認為:
隨著(zhù)全行業(yè)視頻化的演進(jìn),營(yíng)銷(xiāo),知識、商業(yè)和空間的交互體驗也正在被重塑。
意思是說(shuō),視頻從一種內容形態(tài),變成必不可少的能力。
過(guò)去三年的現實(shí)困境,讓線(xiàn)上化、視頻化、數字化,成了必然的選擇。
肉眼可見(jiàn)的,視頻化對辦公、教育、醫療、汽車(chē)、金融等行業(yè),帶去顛覆性的商業(yè)創(chuàng )新。
視頻會(huì )議、辦公軟件收獲了億級增長(cháng),頭部辦公APP用戶(hù)數突破6億;
遠程醫療發(fā)力,醫生通過(guò)視頻通話(huà)對患者提供診療,管理患者情況;
智能工廠(chǎng)里,定位、測量、質(zhì)檢、監測、安全生產(chǎn)都要用到超高清視頻技術(shù)與5G、人工智能的結合;
24小時(shí)直播的數字人、大模型定制的AI員工,都開(kāi)始上線(xiàn);
視頻技術(shù)打破時(shí)空、創(chuàng )造體驗、提升效率、轉變商業(yè)思維的能力,在本質(zhì)上,也是數字化革命的一個(gè)切面。
萬(wàn)物皆可視頻化,轉變?yōu)閿祿?。這是機遇也是挑戰。
火山引擎提前捕捉趨勢,大會(huì )上發(fā)布了自研視頻編解碼芯片、BMF多媒體處理框架等全新技術(shù),以及平行駕駛、虛擬直播間、VR直播等行業(yè)解決方案。
聽(tīng)起來(lái),有些不明覺(jué)厲?別著(zhù)急。
簡(jiǎn)單來(lái)說(shuō):火山引擎要把抖音的音視頻能力,向全行業(yè)開(kāi)放了。
極限挑戰往往是最好的倒逼師
數據是最直觀(guān)的。
視頻在全網(wǎng)數據流量中的占比接近70%,增速還在攀升。
龐大的視頻直播需求,把視頻云變成了水電煤一般的基礎設施。預計到2024年,就會(huì )成為近千億級的大市場(chǎng)。
云計算作為一項商用服務(wù),起源于亞馬遜,電商生意。
至今,亞馬遜還是全球最大的云服務(wù)商,云業(yè)務(wù)是其最賺錢(qián)的部門(mén)。
像亞馬遜和阿里云,為了應對雙十一、黑色星期五期間的流量高峰,儲備了大量冗余算力。
這些服務(wù)器平常閑置時(shí),就可以作為基礎設施,租借給外部,幫企業(yè)低成本上云,不用自己搞IT。
之后,互聯(lián)網(wǎng)大廠(chǎng)又把自己先進(jìn)的企業(yè)軟件、平臺能力、人工智能,都通過(guò)云計算打包成產(chǎn)品和服務(wù),輸出給客戶(hù)。
眾多企業(yè)和云平臺綁定,就形成一個(gè)具備確定性的生態(tài),也奠定了今天的云服務(wù)格局。
在視頻云的細分賽道,火山引擎最初也是服務(wù)字節跳動(dòng)內部,尤其是抖音的視頻需求。
在2018年,抖音的日活用戶(hù)數超過(guò)1億。
每天要應對視頻播放、傳輸、畫(huà)質(zhì)、交互、性能的多重挑戰,內部必須要組建能力消化、應對。
真刀真槍的實(shí)戰中,火山引擎視頻云應運而生。
現在各路企業(yè)都想通過(guò)視頻化,為自己多掙一點(diǎn)確定性。
聽(tīng)起來(lái)容易,但如果企業(yè)自己搭建視頻平臺,首先是成本太高,其次缺乏成系統的成熟經(jīng)驗,技術(shù)門(mén)檻也比預想的高。
有需求,就有服務(wù)。這就是火山引擎視頻云的想象空間。
歷史經(jīng)驗告訴我們,極限挑戰往往是最好的倒逼師。
春晚、奧運會(huì )開(kāi)幕式、世界杯這類(lèi)大型賽事直播,也會(huì )創(chuàng )造短期流量洪峰。
火山引擎視頻云,就在2022年接受了抖音直播卡塔爾世界杯的挑戰。
賽場(chǎng)上,開(kāi)始射門(mén)了。
火山引擎視頻云色彩增強對比示意圖
這1秒鐘,現場(chǎng)的畫(huà)面通過(guò)衛星,從卡塔爾傳輸到中國,抖音要瞬間將畫(huà)面壓縮、美化,傳輸給數以?xún)|計的設備,變成你手機上的720p、1080p、4K;
這1秒鐘,如果是4K50幀畫(huà)質(zhì),視頻大小接近50M,同時(shí)傳給上億人,線(xiàn)路承受不住。抖音將視頻編碼壓縮到10M,傳給你的手機再解碼,才避免被流量高峰沖垮;
這1秒鐘,工程師要將HDR信號轉換為SDR,對畫(huà)面上800萬(wàn)個(gè)像素的色彩、亮度、對比度進(jìn)行“美顏”;
這1秒鐘,他們要用自研的RTM直播技術(shù),把直播的延時(shí)降到半秒,讓所有人能同步看到比賽結果;
整場(chǎng)世界杯,火山引擎累計支持了106億人次的直播觀(guān)看,決賽觀(guān)看人數高達2.3億。
射門(mén)進(jìn)球,全場(chǎng)歡呼。屏幕上是1秒鐘,火山引擎幕后十年功。
這些在流量高峰中突破的技術(shù),也會(huì )逐步開(kāi)放到視頻云的產(chǎn)品里,變成向外輸出的能力。
今天,抖音的日活已超過(guò)6億,2022年抖音電商同比增長(cháng)了80%??梢哉f(shuō),火山引擎每分每秒都在極限測試,不斷解決、試錯、交付、迭代。
火山引擎視頻云想向B端企業(yè)證明,自己的增長(cháng)飛輪、確定性能力,是可以對外輸出的。
想要開(kāi)動(dòng)引擎,讓命運的齒輪轉動(dòng)起來(lái)。
火山引擎到底想輸出什么樣的硬實(shí)力呢?這要看產(chǎn)業(yè)的需求,以用戶(hù)為中心嘛。
大會(huì )上提出,視頻技術(shù)面臨三個(gè)難以解決的矛盾:
首先,不管視頻要更高清,還是更低延時(shí),核心都需要升級視頻編碼技術(shù)。
視頻標準每升級一代,技術(shù)復雜度就會(huì )提高十倍;視頻編碼每升級一代,質(zhì)量碼率則減少50%,但視頻數據量擴展卻不止2倍;
編碼的迭代速度,追不上視頻數據量的增速,這是第一個(gè)矛盾。
其次,摩爾定律變慢了。視頻芯片處理和算力增長(cháng)的速度,支撐不了大規模8K/VR直播和視頻數據的需求。
算力有上限,需求無(wú)極限,這是第二個(gè)矛盾。
第三個(gè)矛盾,是XR/VR技術(shù)興起,虛擬現實(shí)與現實(shí)世界融合,將帶來(lái)新的沖擊。
面對這三大矛盾,結合眾多企業(yè)的訴求,火山引擎重新構建了“一站式音視頻產(chǎn)品矩陣”。
最底座的算力層,是視頻處理的基礎。
視頻需求的快速膨脹,倒逼火山引擎的算力底座,完成了從通用計算到異構計算的轉型。什么意思呢?
什么是異構計算?
好比一支足球隊,隊員有不同的特長(cháng),擅長(cháng)不同的攻防位置。
算力也一樣,不同的芯片和處理器,擅長(cháng)不同的任務(wù)。比如說(shuō),CPU擅長(cháng)通用計算,GPU適合圖形渲染、深度學(xué)習,FPGA擅長(cháng)網(wǎng)絡(luò )加速、數據處理。
異構計算就是讓不同的芯片組隊,在應對視頻任務(wù)時(shí),發(fā)揮更高效率。
火山引擎在大會(huì )上發(fā)布的自研芯片,就是一塊擅長(cháng)視頻編解碼的芯片。
在處理視頻時(shí),1臺搭載這塊自研芯片的服務(wù)器,轉碼能力與百臺CPU服務(wù)器相當;壓縮效率比目前主流的硬件編碼器,提升了30%以上。
并且,這塊芯片提前為未來(lái)設計,具備支持HDR和8K超高清視頻的能力。
對企業(yè)來(lái)說(shuō),成本大大降低。
而在框架模型層面,火山引擎聯(lián)合英偉達,共同打造了BMF多媒體處理框架。
這又是什么呢?
簡(jiǎn)單地說(shuō),BMF框架就像一個(gè)裝滿(mǎn)工具的工具箱。
裝滿(mǎn)了視頻化需要的所有技術(shù),比如視頻編解碼、智能處理、視頻分析、圖像生成。
它就是火山引擎過(guò)去3-4年,沉淀的全鏈路視頻能力,目前已投入使用,每天要處理數以?xún)|計的視頻。
和過(guò)去的視頻處理平臺相比,BMF的優(yōu)勢在于:
幫助企業(yè)將各種視頻處理能力和解決方案協(xié)同工作,快速實(shí)現視頻化落地;
支持從生產(chǎn)到消費的各種視頻應用場(chǎng)景,包括視頻轉碼、云編輯、移動(dòng)端后處理,特別是AI帶來(lái)的視頻增強、視頻質(zhì)量分析等功能;
提供多語(yǔ)言開(kāi)發(fā)支持,使開(kāi)發(fā)更加方便,提高效率。
這個(gè)框架已經(jīng)全面開(kāi)源了,包括它的框架層,9個(gè)開(kāi)箱即用的案例,以及超過(guò)20個(gè)API范例。
在應用層面,火山引擎的行業(yè)解決方案,就給了開(kāi)發(fā)者拿來(lái)即用、有方法論的視頻化能力。
比如說(shuō),已經(jīng)在抖音落地的互動(dòng)直播營(yíng)銷(xiāo)解決方案。
就把整個(gè)直播鏈路都數據化了,這是要教給你,在視頻領(lǐng)域使用數據驅動(dòng)的增長(cháng)方法。
讓你一目了然,針對性增加互動(dòng)、優(yōu)化方式,直接提升直播轉化率和營(yíng)收水平。
今年蘋(píng)果推出Vision Pro后,又為VR市場(chǎng)加了一把火;AI大模型的發(fā)展,也為數字人、虛擬直播的大規模應用,鋪好了路。
火山引擎在Pico VR的實(shí)踐基礎上,打造了8K級、360度的VR直播全鏈路解決方案。
這降低了VR內容的制作門(mén)檻,企業(yè)能在Vision Pro、Pico等設備里,上線(xiàn)自己的VR應用。
而火山引擎專(zhuān)門(mén)打造的虛擬直播間解決方案,也能打造數字人主播、虛擬直播場(chǎng)景和AR場(chǎng)景。
當然,直播技術(shù)是火山引擎的老本行了。除了直播,他們在過(guò)去幾年也與行業(yè)合作,打造更加產(chǎn)業(yè)級的視頻應用。
比方說(shuō),自動(dòng)駕駛的核心技術(shù),其實(shí)就是AI、視頻處理、實(shí)時(shí)傳輸。
火山引擎的視頻處理、高速傳輸技術(shù),就很適合與自動(dòng)駕駛公司合作。
將音視頻處理速度提升一個(gè)量級,這就是火山引擎的遠程車(chē)控方案。
毫末智行與火山引擎共同構建的遠程車(chē)控方案,把汽車(chē)視頻處理速度提升了一個(gè)量級。
在車(chē)載視頻監控、哨兵模式、遠程理賠、快遞到車(chē)等任務(wù)中,把視頻延時(shí)壓縮到90毫秒,幾乎是實(shí)時(shí)同步了。
這讓自動(dòng)駕駛、遠程操控,又突破了一個(gè)技術(shù)難點(diǎn)。同樣的技術(shù),也可以用到機器人、智能制造里,依賴(lài)視頻視覺(jué)技術(shù)處理的地方。
再比如說(shuō),今年火遍全球的AI大模型。
近期,火山引擎首次把AIGC視覺(jué)大模型,用來(lái)修復老電影的。
老電影用膠片保存,時(shí)間久了都會(huì )是“全損”畫(huà)質(zhì)。
所謂修復工作,其實(shí)就是把膠片數字化,再一幀幀畫(huà)面“P圖”:清污、補接、處理劃痕、顏色調整。
一部90分鐘的電影,畫(huà)面有十幾萬(wàn)幀,如果都靠人力P圖,顯然耗時(shí)費力、成本高昂。
而通過(guò)視覺(jué)大模型,對修復效果實(shí)現了大幅度的提升,并且能規?;?、高效率進(jìn)行修復工作。
火山引擎也宣布,要修復100部香港老片,將《A計劃》《笑傲江湖》《蜀山·新蜀山劍俠》等經(jīng)典都提升到4K畫(huà)質(zhì)。
可以說(shuō),圍繞視頻化中臺,火山引擎深入了新一代數字基礎設施的底座,并與千行百業(yè)建立了關(guān)系,成為一個(gè)扎根視頻技術(shù)的新生態(tài)。
字節跳動(dòng)視頻架構負責人王悅表示:
當技術(shù)面臨瓶頸,也許我們可以換一種姿勢奔跑,從算力,體驗和交互不同維度突破;
基于抖音等業(yè)務(wù)大規模實(shí)踐打磨,燃燒沉淀自己,把火種傳遞給更多人。
結語(yǔ)
現在你知道,火山引擎想輸出什么樣的能力了吧?
在視頻時(shí)代的上半場(chǎng),人們看到了技術(shù)對娛樂(lè )、電商、社交、教育帶來(lái)的改變。
在如今的下半場(chǎng),變化的是什么?大家需要什么?? ? ??
是線(xiàn)上化嗎?實(shí)時(shí)化?體驗感?? ?
本質(zhì),還是效率的提升。
追求效率提升,追求增長(cháng),追求穩定,這才是大家的共同訴求。
你只要嘗過(guò)甜頭,轉變了眼界,才發(fā)現原來(lái)可能性還有很多。
走出一條數字化路徑后,火山引擎,也想成為確定性的創(chuàng )造者。
相關(guān)稿件