12月10日,OpenAI发布会直播,公司CEO山姆·奥特曼,终于正式发布了Sora的正式版模型——Sora Turbo,生成视频的速度显著提升,质量更高,同时新增了风格混用、时间延展等功能,之前Plus订阅会员老用户可以直接使用,同时OpenAI还推出了全新的200美元/月的Pro高级用户,可以使用满血版的o1和Sora Turbo!
本次的文本转视频模型Sora,最早可以追溯到今年2月份的发布会PPT,山姆·奥特曼公开了使用扩散模型(diffusion model)的视频生成模型Sora,能够生成包含多个角色、特定运动和复杂场景的视频,并模拟物理世界中的行为方式。
不过在接下来的半年中,可灵等国产大模型接连上线,率先开放使用,混元大模型也在上周正式开源,而Sora仅限部分艺术家、电影制作人和安全测试人员可以使用,而且Sora还引发了一些参与测试艺术家的吐槽,认为OpenAI剥削了他们的劳动和创作版权。以下为山姆·奥特曼展示的几款示例视频:
Prompt: a bird of paradise on a buddha statue.
PromptSubtle Remix: make the video more vibrant and the butterflies more colorful.
订阅标准:
Plus会员(20刀):每个月最多生成50个视频(合计 1000 积分),仅限720p分辨率(最多5秒)、480p分辨率(最多10秒)
Pro会员(200刀):每个月最多生成500个视频,支持1080p分辨率(最多20秒),可以无水印下载,同时运行最多 5 个生成任务
上次的Sora发布会,山姆·奥特曼着重强调了以下等功能:
多分镜与一致性:Sora支持在单个视频中生成多个分镜,能够保留角色和视觉风格的一致性,在电影制作和创意内容生成领域非常强大。
一次性生成完整视频:与逐帧生成的方法不同,Sora 能够整体生成视频,提高效率和效果的连贯性。
这次,Sora Turbo新增了Remix、Re-cut和Storyboard等功能,具体细节如下:
Remix重混功能:对已经生成的视频进行重新混用,在原本使用Prompt生成的视频基础上,再修改其中的内容,即可Remix生成一段修改后的视频,Sora官方给出示例:
Open large doors into a library
Replace doors with French doors
Turn the libraryinto a spaceship
Remove the spaceship, add a jungle
Replace the jungle with a lunar view
过程示例:一扇古老的大门打开,展示出宽敞的图书馆场景。
大门被替换成带有玻璃窗格的法式门,但图书馆背景不变。
图书馆背景变成未来感十足的宇宙飞船内部场景,法式门保持不变。
飞船内部被替换为郁郁葱葱的丛林背景。
丛林场景变为月球表面的荒凉景象,门的设计仍保持一致。
Re-Cut重剪功能:针对视频中的满意片段,截取后可以进一步扩展或优化,用户选择一段视频,比如 2 秒内的关键画面,使用 Re-Cut 向前或向后延展该片段的情节,生成前因或后续内容,可以调整节奏或为延展部分添加新提示,比如加入角色、背景变换或镜头特效。
Loop循环功能:创建首尾无缝衔接的循环视频,适用于背景动画、短视频内容或社交媒体动态效果,视频在循环时视觉上自然连贯,没有突兀的切换点,比如生成一个场景中下雪、流水、光线波动等循环动画,用于网页背景或广告内容。
Blend混合功能:通过融合两段视频的视觉元素,实现动态过渡或情境衔接,包括AI自动生成场景间的变化效果,比如色调、内容和氛围的转换。
Storyboard故事板:可以自定义对视频序列进行编辑,提供了更高层次的创意控制,特别适合需要多镜头叙事或复杂情节的创作需求
Prompt Handheld grainy, black-and-white footage shows the ominous silhouette of a giant futuristic brutalist spaceship emerging from the misty sea, towering over a small, quaint seaside town.
往期:
聊天机器人——ChatGPT全网爆红,马斯克惊叹夸赞!
聊天机器人——ChatGPT小白注册教程,勿被电商割韭菜!
ChatGPT移动端——使用教程,5分钟注册iOS账号!
微软——解散元宇宙,900亿投资压注ChatGPT!
OpenAI王炸官宣——文生视频模型Sora上线!
OpenAI新模型:Sora会冲击影视行业吗?技术解读
OpenAI新模型:Sora会颠覆游戏行业吗?技术解读
OpenAI估值:5700亿,仅次于字节和SpaceX!
OpenAI王炸:仅需15秒音频,即可克隆任何声音!
#gd的ai&游戏杂谈#
#ai人工智能#