12月10日,OpenAI發佈會直播,公司CEO山姆·奧特曼,終於正式發佈了Sora的正式版模型——Sora Turbo,生成視頻的速度顯著提升,質量更高,同時新增了風格混用、時間延展等功能,之前Plus訂閱會員老用戶可以直接使用,同時OpenAI還推出了全新的200美元/月的Pro高級用戶,可以使用滿血版的o1和Sora Turbo!
本次的文本轉視頻模型Sora,最早可以追溯到今年2月份的發佈會PPT,山姆·奧特曼公開了使用擴散模型(diffusion model)的視頻生成模型Sora,能夠生成包含多個角色、特定運動和複雜場景的視頻,並模擬物理世界中的行為方式。
不過在接下來的半年中,可靈等國產大模型接連上線,率先開放使用,混元大模型也在上週正式開源,而Sora僅限部分藝術家、電影製作人和安全測試人員可以使用,而且Sora還引發了一些參與測試藝術家的吐槽,認為OpenAI剝削了他們的勞動和創作版權。以下為山姆·奧特曼展示的幾款示例視頻:
Prompt: a bird of paradise on a buddha statue.
PromptSubtle Remix: make the video more vibrant and the butterflies more colorful.
訂閱標準:
Plus會員(20刀):每個月最多生成50個視頻(合計 1000 積分),僅限720p分辨率(最多5秒)、480p分辨率(最多10秒)
Pro會員(200刀):每個月最多生成500個視頻,支持1080p分辨率(最多20秒),可以無水印下載,同時運行最多 5 個生成任務
上次的Sora發佈會,山姆·奧特曼著重強調了以下等功能:
多分鏡與一致性:Sora支持在單個視頻中生成多個分鏡,能夠保留角色和視覺風格的一致性,在電影製作和創意內容生成領域非常強大。
一次性生成完整視頻:與逐幀生成的方法不同,Sora 能夠整體生成視頻,提高效率和效果的連貫性。
這次,Sora Turbo新增了Remix、Re-cut和Storyboard等功能,具體細節如下:
Remix重混功能:對已經生成的視頻進行重新混用,在原本使用Prompt生成的視頻基礎上,再修改其中的內容,即可Remix生成一段修改後的視頻,Sora官方給出示例:
Open large doors into a library
Replace doors with French doors
Turn the libraryinto a spaceship
Remove the spaceship, add a jungle
Replace the jungle with a lunar view
過程示例:一扇古老的大門打開,展示出寬敞的圖書館場景。
大門被替換成帶有玻璃窗格的法式門,但圖書館背景不變。
圖書館背景變成未來感十足的宇宙飛船內部場景,法式門保持不變。
飛船內部被替換為鬱鬱蔥蔥的叢林背景。
叢林場景變為月球表面的荒涼景象,門的設計仍保持一致。
Re-Cut重剪功能:針對視頻中的滿意片段,截取後可以進一步擴展或優化,用戶選擇一段視頻,比如 2 秒內的關鍵畫面,使用 Re-Cut 向前或向後延展該片段的情節,生成前因或後續內容,可以調整節奏或為延展部分添加新提示,比如加入角色、背景變換或鏡頭特效。
Loop循環功能:創建首尾無縫銜接的循環視頻,適用於背景動畫、短視頻內容或社交媒體動態效果,視頻在循環時視覺上自然連貫,沒有突兀的切換點,比如生成一個場景中下雪、流水、光線波動等循環動畫,用於網頁背景或廣告內容。
Blend混合功能:通過融合兩段視頻的視覺元素,實現動態過渡或情境銜接,包括AI自動生成場景間的變化效果,比如色調、內容和氛圍的轉換。
Storyboard故事板:可以自定義對視頻序列進行編輯,提供了更高層次的創意控制,特別適合需要多鏡頭敘事或複雜情節的創作需求
Prompt Handheld grainy, black-and-white footage shows the ominous silhouette of a giant futuristic brutalist spaceship emerging from the misty sea, towering over a small, quaint seaside town.
往期:
聊天機器人——ChatGPT全網爆紅,馬斯克驚歎誇讚!
聊天機器人——ChatGPT小白註冊教程,勿被電商割韭菜!
ChatGPT移動端——使用教程,5分鐘註冊iOS賬號!
微軟——解散元宇宙,900億投資壓注ChatGPT!
OpenAI王炸官宣——文生視頻模型Sora上線!
OpenAI新模型:Sora會衝擊影視行業嗎?技術解讀
OpenAI新模型:Sora會顛覆遊戲行業嗎?技術解讀
OpenAI估值:5700億,僅次於字節和SpaceX!
OpenAI王炸:僅需15秒音頻,即可克隆任何聲音!
#gd的ai&遊戲雜談#
#ai人工智能#