【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?


3楼猫 发布时间:2024-02-20 10:50:41 作者:gdtop Language

2月16日,OpenAI发布了全新的文生图模型Sora,能够给予用户给出的提示Prompt,生成一段时长达到1分钟的高清视频,乍一看OpenAI做的事情似乎和游戏无关,主要可能会影响电视剧、电影等影视作品的制作,但是Sora擅长的模拟数字世界能力,结合此前OpenAI已经发布的一款大型强化深度学习模拟器Neural MMO,Sora不止是一个视频生成器,而是更像一个“世界模拟器”的概念,Sora将深入学习模拟现实世界的物理规律,极有可能将颠覆游戏等内容生产行业。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第0张



我们先来看Sora能干什么,以及与竞争者们的优势在哪里。像去年发布的Runaway和Pika生成的视频长度一般在几秒钟以内,画面可能出现模糊、闪烁等问题,而Sora可以生成长达 1 分钟的视频,质量更高,画面更加清晰流畅,能够达到很强的3D一致性。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第1张

在GPT和DALLE的加持下,Sora在理解文本指令上有着无可比拟的优势,对于简短的Prompt,Sora能够先利用GPT对提示词进行转换变得更长,然后再生成视频;搭配上DALLE3,用户可以先生成生成一系列图像,然后让Sora将这些图像拼接成动画,效果十分惊艳。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第2张

对于两个不同视频,Sora也能将视频进行拼接,非常丝滑流畅,我们可以看到无人机直接无缝切换成蝴蝶,Sora不仅能够对语言提示有非常深刻的理解,同时对语言对应现实世界的物理形式,也有深刻的理解能力,这也是本文想要讨论的关键点所在。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第3张

OpenAI形容Sora具备一定的对现实世界物理规律理解能力,以一个Sora生成较为失败的视频为例,提示词为“考古学家在沙漠中发现了一把普通的塑料椅子,小心翼翼地挖掘并除去灰尘。”在这个场景中,Sora正在尝试理解椅子是一个刚性物品。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第4张

但如果放在虚拟的游戏世界,比如我们让Sora生成“我的世界”视频,效果比现实物理世界更好,而且Sora看起来像是真的理解了“我的世界”中的物理运动规律,用户只需要提及《我的世界》,就能让Sora直接生成游戏视频。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第5张

Sora生成的“我的世界”,看起来像素化更低,更像是真实世界,英伟达高级研究科学家、OpenAI第一个实习生Jim Fan表示,这是因为Sora更像一个“数据驱动的物理引擎”,而非是单纯的图像生成器。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第6张

Sora执行了上千次计算,来预测对象如何与其环境交互,在这个过程中,Sora实际上模拟了一个虚拟的世界模型,而且Sora也像是投喂了大量的虚幻5引擎视频,这也让Sora非常适合用于游戏素材生成。输入文本输出视频,Sora如此好用的原理从何而来呢?

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第7张

目前,从OpenAI仅有的官方技术博客挖掘,Sora主要是结合Diffusion model+Transformer模型,将视觉数据转化统一的时空Patch(类似于大模型的token),像其他的模型都需要通过许多预处理工作,将视觉数据切成标准片大小,而Sora可以直接投喂原始大小的视频,这里的Patch很有可能就是Sora如此强大的关键所在。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第8张

目前来看,除了Sora这样的“世界模拟器”以外,GPT4、AI Agent同样也有可能颠覆游戏行业,Jim Fan在去年将GPT-4集成到“我的世界”中,推出Voyager作为史上第一个自主学习如何玩《我的世界》的AI,Voyager能够在游戏中学习如何建造房屋、挖矿、收集仙人掌和狩猎,Jim Fan认为像《塞尔达传说》或者《艾尔登法环》这样的游戏,很快也会有更加强大的AI。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第9张

AI Agent同样也会对游戏造成巨大影响,试想一下,当游戏中的AI变得像人类一样聪明,能够根据情况做出自己的复杂决策时,游戏世界会变得更像真实世界,结合之前OpenAI公开的Neural MMO大规模强化深度学习模拟器,将AI Agent放倒一个MMO环境中,让AI进行模拟博弈,OpenAI正在布局一盘大棋。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第10张

再回到Sora上来,OpenAI的雄心壮志是让Sora成为一个通用的世界模拟器,而不单单只是个生成视频的工具,试想一下,如果给Sora输入文本,Sora就能根据文本模拟出虚拟世界的人、动物和物体,如果再给Sora训练大量的虚幻5引擎视频素材,Sora也能进一步“掌握”虚拟世界的物理规律,届时Sora可能会像GPT对好莱坞编剧们的颠覆性影响一样,对游戏界产生影响,目前也有部分人呼吁应该从安全性方面考虑,尽快着手限制Sora的发展。

【PC游戏】技术解读——OpenAI新模型,会颠覆游戏行业吗?-第11张



ChatGPT:

聊天机器人——ChatGPT全网爆红,马斯克惊叹夸赞!

聊天机器人——ChatGPT小白注册教程,勿被电商割韭菜!

ChatGPT移动端——使用教程,5分钟注册iOS账号!

微软——解散元宇宙,900亿投资压注ChatGPT!

ChatGPT王炸官宣——仅需2.7美元,即可输出100万词!

火爆全网——AI生成的漂亮小姐姐,形象逼近真人!

英伟达重磅:AI读取视频,可直出3D游戏模型!

黄仁勋:给AI圈一点小小的英伟达震撼,11分钟训练ChatGPT!

ChatGPT免费开源平替——200亿参数,前OpenAI团队打造!

ChatGPT王炸升级——可识别图片,考试成绩超九成人类!

ChatGPT史诗升级——1秒生成网站,看图玩梗能力堪比真人!

ChatGPT加强版——60秒生成弹球游戏,零基础也能开发游戏!

ChatGPT王炸官宣——正式解除封印,接入互联网开放插件!

ChatGPT重磅升级——新增函数功能,价格大幅下降!

ChatGPT:预计3亿人将失业,斯坦福封神开源GPT平替版!

ChatGPT突发:iOS版应用上线,冲到总榜第二!

ChatGPT之父:重磅推出世界币,将成为AI时代“身份证”!

ChatGPT之父:奥特曼没有公司股份,因为热爱创造了GPT!

ChatGPT:微软联手奥特曼,重磅投资核聚变发电!

游戏界大变天:斯坦福最新成果,AI角色可模拟真人小镇!

人工智能“觉醒”:自主学习,AutoGPT会颠覆ChatGPT吗?

ChatGPT最强挑战者:谷歌Claude,免注册支持中文!

ChatGPT最强竞品:谷歌免费升级克劳德,20秒逆天速通百页论文!

ChatGPT:显卡每日电费500万,谷歌大脑合并阿尔法狗母公司

ChatGPT:玩转《我的世界》,北京大学强化学习攻克复杂任务!

ChatGPT:成功让AI听懂人话,学会与人类合作!

ChatGPT:7分钟开发一款游戏,成本仅0.3美元!

OpenAI重磅突破:用AI学习AI,开创人工智能新道路!

OpenAI王炸——AI绘画集成ChatGPT,“大力3”来了!

微软重磅官宣:GPT-4接入Win11,下周二免费推送更新!

乔布斯剧本:奥特曼被OpenAI开除,美女工程师接任!

奥特曼回归?OpenAI员工施压希望召回奥特曼!

奥特曼宣布:加入微软,光速跳槽甲方!

奥特曼回归:OpenAI上演“宫斗”大结局!

GPT商店上线:“AI女友”机器人成热门应用!


#gd的ai&游戏杂谈#

#ai人工智能#


© 2022 3楼猫 下载APP 站点地图 广告合作:asmrly666@gmail.com