來源:環(huán)球網(wǎng)
6月18日,上海人工智能獨角獸企業(yè)MiniMax正式發(fā)布其新一代視頻生成模型Hailuo 02,以“世界一流的效果”和“顛覆性的成本效益”,在全球AI視頻生成這一前沿賽道上,掀起新一輪的技術和市場波瀾。
此次一同公開的還有Hailuo 02的模型架構Noise-aware Compute Redistribution(NCR),受益于這一架構創(chuàng)新,新版模型擴大了3倍的參數(shù)量和4倍的數(shù)據(jù)量,使模型性能顯著提升的同時打破全球視頻模型效果成本紀錄。
全球第一梯隊 極致物理表現(xiàn)
在生成效果上,Hailuo 02展現(xiàn)了足以與國際頂尖模型正面競爭的“硬實力”。最直觀的突破之一,是其支持原生1080P高清視頻的直接輸出。在官方發(fā)布的演示視頻中,無論是體操運動員在空中連續(xù)翻轉(zhuǎn)的流暢動作,還是馬戲演員噴火時逼真的火花與光影效果,亦或是場景快訊變換中的動作流暢且細微表情,Hailuo 02都表現(xiàn)出了強大的時空一致性和物理邏輯性,并實現(xiàn)SOTA指令遵循。
據(jù)MiniMax官方,Hailuo 02的演示視頻僅由3位藝術家耗時1.5天完成。Hailuo 02是目前全球唯一一個可以實現(xiàn)類似體操這種高度復雜場景的視頻大模型。
模型一經(jīng)發(fā)布,就在國際權威測評榜單Artificial Analysis視頻競技場中迅速拿下第二名成績,領先Google的Veo 3和快手的可靈(Kling)等一眾強勁對手。
NCR架構創(chuàng)新 幫助全球創(chuàng)作者釋放想象力
長期以來,AI視頻生成領域似乎陷入了一個“效果、效率、成本”的“不可能三角”——追求極致的生成效果,往往意味著需要海量的計算資源和高昂的訓練、推理成本。這使得Sora等頂尖技術雖然效果驚艷,但離普通用戶和大規(guī)模商業(yè)化應用仍有距離。
MiniMax此次給出的答案,是一種名為“Noise-aware Compute Redistribution (NCR)”的創(chuàng)新模型架構。讓Hailuo 02在訓練和推理效率上實現(xiàn)了2.5倍的驚人提升,而這一效率的提升直接轉(zhuǎn)化為成本的降低和模型能力的躍升。MiniMax透露,即便Hailuo 02的模型參數(shù)量和訓練數(shù)據(jù)量分別達到了上一代產(chǎn)品的3倍和4倍,成本依然可控。這也使得公司可以在不增加創(chuàng)作者使用成本的情況下,幫助全球創(chuàng)作者充分地釋放想象力,提升視頻創(chuàng)作質(zhì)量。
目前海螺視頻的Web、APP以及MiniMax開放平臺均已上線Hailuo 02新版模型,分別有三個版本:768p-6s,768p-10s,和1080p-6s。Hailuo 02模型官方價格顯著低于Runway、可靈等國內(nèi)外同行。
從2024年8月時偶然提供了一個展示視頻生成模型的Demo網(wǎng)頁,到后續(xù)快速推出海螺視頻(Hailuo Video)產(chǎn)品,MiniMax至今為止已經(jīng)幫助來自全球200個國家的創(chuàng)作者生成了超過3.7億個視頻。
MiniMax表示,接下來還會在以下幾個方面更快速更新:生成速度提升、更好的偏好對齊,抽卡率/穩(wěn)定性提高、T2V/I2V之外的高階功能的實現(xiàn);通過持續(xù)的技術研發(fā),以及與大量藝術家的合作,真正做到“Intelligence with Everyone”。
標題:MiniMax視頻模型Hailuo 02發(fā)布,系全球首個實現(xiàn)極限復雜運動場景的視頻模型
地址:http://www.sme-os.com/paobuji/292221.html