落日间链接:Alexander R. Galloway 我如何用软件建模居伊·德波的头脑 | ROMchip (2022)
译按
此文是媒介理论哲学家亚历山大·加洛韦(Alexander R. Galloway)谈他作为游戏程序员创作游戏《Kriegspiel》的程序AI的一篇文章。
文章所吸引我的,是一种我认为在当下研究中很缺乏的东西:一种多元且鲜活,充满着冒险动手的,理论研究与创作结合的跨学科实践。
《Kriegspiel》这个游戏是加洛韦根据法国哲学家居伊·德波所常常被人忽略的游戏设计作品《战争游戏》做的数字化重制与再现,德波这个自称「战略家」的国际情景主义创始人以他标志性的《景观社会》电影的异轨,巴黎城市中的漂移等游玩的策略而闻名,而他有个不为人所知的身份:游戏设计师和游戏公司创始人。这种身份异质的多样性与加洛韦自己学术实践相互照映,在这篇文章中得到了充分的展现。
文章内的观点其实并不难读,加洛韦所提到的极小极大(min-max)优化算法也是棋盘类游戏中最为基本的人工智能算法,而他最终达到并不理想的AI效果也许还有待提高,无论可能是进一步做更好的评估函数,增加的算法的剪枝(Alpha–beta pruning),或者是使用 Alpha Go 基础之一的蒙特卡洛树搜索(Monte Carlo tree search, MCTS)等来进行更强力的探索等等。
但我觉得最值得关注和最有意思的地方就如题目所描述的:德波的头脑或想法是怎样的?应该更契合于怎样的一种算法模式?正是在这点上,加洛韦发现了不同于人们通常对德波充满灵活性和漂移的游戏策略的印象:德波的游玩风格与《战争游戏》都是高度结构化的,确定性的,更像是一种符号逻辑的AI或暴力破解的(brute-forcing)模式。
当然我会认为这或许也是加洛韦为自己阶段性程序水平的辩护(就如同他先前因为还不知道如何编写人工智能代码而声称德波并不喜欢人类与计算机对弈)一样,或许我们也可以用一套更偏向非暴力破解的方式进行编写,如更多依据士兵性格划分或场面局势进行类似战棋游戏的有限状态机(FSM, finite state machine)或行为树的建模,或依据整体目标性的大判断的目标导向行动计划(GOAP: Goal Oriented Action Planning)推进;而文章关于机器学习的部分或许也不全准确,因为如基于强化学习(Reinforcement Learning)的机器学习方式也可以不需要使用对人类对局数据的收集和学习的而可以进行自对弈的积累等等(但或许人类数据也需要更多引导)。而文章中对于计算机的论述等等实际上也与加洛韦的新书中的论述无不关联,有服务于其哲学论述之嫌。
但是这个想法是很有意思的,或许我们可以思考:我们是不是能建模更多的哲学家的战术和策略?那如何建模德勒兹/瓜塔利的头脑?如何建模弗洛伊德的战术?这些规则和行动逻辑中怕是不能推演出某种现实世界的最优解,但足够引起我们有关战术的思索,或许结构主义者是类似德波这样的「结晶状」的玩家,而后结构主义者则是更加游牧和随机性掺杂的算法?或者是需要另外一种不同的游戏模式和形态?德波的这种游戏的设计和构造方式远不足以捕捉现实的复杂性?图论和机器学习或聚类算法能够给哲学什么样的新的启示?我们能不能用数学和算法的方式去处理这些如巴黎心理学地图这样的材料?这些都非常有趣值得继续追问和探索。
而实际上加洛韦自己也是将这种算法建模(modeling)以及编程,并且调试(debug)的过程当作是一种进行数字化研究的方法,他提到他一手用代码调试德波的游戏,一手写作并对照着德波的历史档案,由此发现了许多再版书籍档案中的错误,如对于棋局的记录实际上有误等等,这些编程与游戏创作的实践毫无疑问地成为了其研究的一种手段,也是一种 Artistic Research 的过程,而这就像他的新书《Uncomputable》的副标题:悠长数字年代中玩与政治(Play and Politics in the Long Digital Age),我们也能在其文本分析和档案中发掘游戏,在德波的游戏中思考政治与哲学。
此外我在搜索的过程中发现加洛韦与一位桌游的油管视频博主做了一期播客采访,并且一同玩了一局《Kriegspiel》,还似乎与著名游戏设计师 Chris Crawford 做了相关的访谈,这些与游戏行业以及玩家进行交流的研究姿态都非常的宝贵。我很赞赏加洛韦这种从实践延伸串联数字与人文历史的研究方式,他因为再现德波的游戏所引起的关于版权和剽窃进步的讨论也引人深思。
就像德波在他最后一部电影《我们一起游荡在夜的黑暗中,然后被烈火吞噬》(In girum imus nocte et consumimur igni)中所说的「没有任何重要时期开始于理论,最先的总是一场游戏,一场斗争,一段旅程。」(no vital periods ever began from a theory. What's first is a game, a struggle, a journey.)
让我们先开始游戏吧!
叶梓涛
落日间
注:这篇文章发布的刊物是 Romchip,一个旨在推进游戏批判性历史研究的平台,其开放性与跨越学术圈内外的思想与出版实践也非常令人尊敬,充满活力,本次的翻译也非常高兴能得到 Romchip 的回应支持与在其期刊进行发布的机会,这也是对一直以来「日 | 落 译介」计划实践的最好肯定。非常感谢 Romchip 的编辑 Laine Nooney 的联系以及 Alexander R. Galloway 本人的授权。以及非常感谢科学史图书馆的徐露一如既往靠谱的翻译合作。
此外感谢人工智能与算法从业相关的友人rolan和过雨洲给到的答疑帮助,如果对游戏人工智能算法有更多的兴趣欢迎参考 GN Yannakakis 的《人工智能与游戏》(Artificial Intelligence and Games),其中提到了本文中涉及的所有算法。
校按
这篇校按主要分为两个部分,前半部分补充一些论文背后的历史纷争,后半部分回到论文本身谈谈论文里值得注意的一些地方。
其实,加洛韦(Alexander R. Galloway)复刻德波游戏的过程并非一帆风顺,他在《无法计算》(Uncomputable)一书前言提及自己曾收到来自德波遗产委员会的律师信。律师信指出加洛韦已经侵犯了德波的知识产权,并将这份信同时寄给了加洛韦当时驻地的艺术空间负责人。在加洛韦看来,这件事颇具讽刺意味:一方面,德波自己的异轨理论和再挪用的美学实践就建立于大量取材他人思想(例如黑格尔)和成果(例如好莱坞影像)的基础之上;另一方面,加洛韦认为自己完全构不成抄袭的行为,重演历史算法只是研究方法的一种。最后他还引用了德波在《景观社会》第八章的发言:「剽窃是必要的,进步需要它」(Plagiarism is necessary. Progress demands it)。
事实上这个项目在2007年就已经面世,而作为研究成果的论文《德波的怀旧算法》(Debord's Nostalgic Algorithm)则在2009年10月发表在学术期刊《文化机器》(Culture Machine)的「海盗哲学」(「Pirate Philosophy」)特刊上。加洛韦的论文被选入「海盗哲学」特刊,无疑就和2008年围绕德波游戏的知识版权产生的纷争相关。当然从这个结果看来,学术界内大部分学者都更加支持加洛韦,正如情境主义者在1968年5月涂鸦在大学墙上的宣言是「废除版权」(「ABOLISH COPYRIGHTS」)一样,德波力图让思想成为行动的理论本就应是武器而非展品,而武器就是拿来使用的。
围绕这场纷争,同样是媒介学者且与加洛韦常有交流的马修(Matthew Kirschenbaum)撰写了长文《德波的 Kriegsspiel 和棋盘兵棋推演》(On Debord’s Kriegsspiel and Board Wargames),从德波设计和命名的游戏与传统棋盘策略游戏的历史谱系出发,论证德波的游戏本身就与当时市场上流行的其他商业兵棋设计有相似之处,指出所有游戏其实都共享着一些同样的传统和思想,而加洛韦对德波的游戏所做的尝试和改变就如德波对同期游戏所做的事一样,并指出再复刻其实就是赋予德波思想及其游戏第二次生命,为更多人了解和讨论德波的作品提供契机。事实上,就在加洛韦发布项目的第二年,沃克(McKenzie Wark)就在《阁柜》(Cabinet)2008年春季刊上发表了文章《战争游戏: 作为战略家的德波》(The Game of War: Debord as Starategist),其中一个有趣的观察是德波的《战争游戏》虽有诸多不足,但他在除了骑兵、步兵、炮步和兵工厂等常用战斗部件外,特意增加了通信单位,且设置了通信线路会影响其他军事单位在游戏里的移动速度这一设定,并将此延申到战术与战略的区分,从而让德波与其他主张阵地战的葛兰西和卢森堡等马克思主义者同台相比,指出重战略的「游玩」是德波思想的核心线索,是让沟通能够发生和让时空能够交会的关键场所。
可以说,加洛韦对《战争游戏》的关注为德波的思想研究打开了新的视野或者说提供了新的话语联系,例如德波游戏里对通信设置的强调不由得让人想到基特勒的《留声机、电影和打字机》,无独有偶,基特勒这本书里也提到了战争游戏。如果我们再将视野放宽,便会发现英国作家威尔斯(H.G.Wells)也嗜好用玩具和积木开发战争游戏。如果我们将视野拉近,也会发现德波的战争游戏已经洒下了星星之火,除了上文提到的文章,还可以参看受德波启发建立的网站 Class Wargames 上的更多作品。此外,如果了解知识版权及相关事宜,能详细写写这场版权警告纠纷背后牵涉到的「作者」、「原创性」及知识生产制度的变化,应该也会是非常有趣的一篇文章。
从文章以外的纷纷扰扰回到加洛韦的这篇《我如何用软件建模居伊·德波的头脑》( How I Modeled Guy Debord's Brain in Software),我会认为文章的重点是加洛韦的研究路径与他建模的方法,也就是重要的是「how」而非他对德波思想研究的本身「what」。
前面提到加洛韦在2007年就发表了论文《德波的怀旧算法》。其实这篇旧文里的许多观点都沿用了下来,并成为《我如何用软件建模居伊·德波的头脑》和《不可计算》一书里德波一章的主体,但加洛韦在保留主要内容的同时,也删去了部分详细的时间点。例如,在《德波的怀旧算法》中,加洛韦开篇就强调到1978年3月8日,德波作为一个激进的电影制作人和作家的昔日荣耀已经褪色,以便引出德波此后醉心于制作游戏的形象和叙事。但到了论文《我如何用软件建模居伊·德波的头脑》这里,强调德波光芒褪色的情节仍然存在,只是删掉了「1978年3月8日」这个时间点。加洛韦可能也察觉到了其中的硬伤,因为1978年其实是德波非常出名的两部作品《对景观社会的评论》(Comments on the Society of the Spectacle,1988) 和 《颂词》(Panegyric,1989) 还没面世的时候,哪里谈得上是「昔日荣耀已经褪色」。这种用事先埋好的时间线和剧情脚本去填充论述逻辑的行为不止这一处。虽然《我如何用软件建模居伊·德波的头脑》对比《德波的怀旧算法》已经删去了许多错误细节,但只删除时间点而保留叙事逻辑的做法仍然留下了印迹,尤其是要多加留意《不可计算》一书中加洛韦笔下的德波形象。有时加洛韦会因为过于想强调德波醉心于《战争游戏》而忽略或者至少削弱了德波同时关心知识、政治和艺术维度的思想复杂性(正如这篇论文里,加洛韦很坦诚地说他曾经用德波当自己编程能力不够的挡箭牌)。
不过,如果要阅读加洛韦对德波的《战争游戏》研究或者单纯想要了解德波的游戏实践,这篇文章仍然是不错的选择和必要的文献背景,可以看作是《德波的怀旧算法》的改良版和《不可计算》的精炼版,已经校正了许多细节差错并缩减了大量多余的论述。
如前所述,这篇文章非常优秀的一点,也是加洛韦行文写作的特色和风格,就是他沟通学术研究与艺术实践的尝试(「how」):非常注意不同理论中抽象模式的形成过程。基于此,他一直在坚持学习软件和编写代码的同时生产学术论文,且多栖并进并未削弱理论的批判性,而是要在批判理论和数字媒体中找到适合自己的方法。这种对实践过程和上手研究的重视体现在这篇论文里,就是标题中的建模「modeling」。
建模并非对数字化的生搬硬套式演绎,而是强调模式作为人理解世界的方式,能让无序的事物显现出秩序,并能通过对概率的引入让模式之外的混乱有机会被纳入意义的理解循环。可以说模式既是一种表征结构,也是一种认知结果,同时也是一种媒介,沟通着经验科学里的抽象理论和现象事实。与此同时,「model as media」也呼应了近年来人文研究对以往实践过程中被忽略的知识生产的条件和知识对象的作用的重视。这种对知识的物质性和媒介性的关注,也将启发我们思考,新的视觉化技术或认知绘图的需求会给洞察力的生成带来哪些新的可能?
最后以加洛韦《不可计算》的结尾作为收束吧,「我们(人文学科的学者和学生)的目标不是挑战成为数据挖掘者,因为我们总是资金不足,人手不足。关键是要完全退出这场游戏,转而继续研究那些技术科学一直搞砸的问题,因为这些问题产生于特定的意识形态和工业使命。人文主义者更宝贵的是接触到普遍人性中 Laruelle 所说的弱势力量(weak force),与历史和社会的普遍共性以及各种各样的美学和文化现象相遇。这些现象不仅存在于历史中,而且作为血肉之躯,就是历史本身」。
徐露
Alexander R. Galloway
亚历山大·加洛韦(Alexander R. Galloway)是一位作家和计算机程序员,致力于哲学、技术和媒介理论方面的问题。他是纽约大学媒体、文化和传播学教授,著有多本关于数字媒体和批评理论的书籍,包括《Uncomputable》(Verso, 2021)和《The Interface Effect》(Polity, 2012)。他与尤金·塞克和麦肯齐·沃克合著的《Excommunication: Three Inquiries in Media and Mediation》由芝加哥大学出版社出版。Galloway 与Jason e . Smith 共同翻译了 Tiqqun 的《Introduction to Civil War》(Semiotext[e], 2010)。几年来,他一直与RSG合作开发 Carnivore、Kriegspiel 和其他软件项目。
加洛韦获得了古根海姆奖 Fellowship、柏林奖和 Prix Ars Electronica。加洛韦的著作已被翻译成十一种语言。《纽约时报》(The New York Times)形容他的实践「在概念上犀利,在视觉上引人注目,与政治时刻完全合拍」。自2002年以来,加洛韦是纽约大学的教员,他还在宾夕法尼亚大学(2012年春季)和哈佛大学(2016年秋季)担任访问教授。2019-2020年任高等研究院社会科学学院院士。
个人博客:点击跳转
Kriegspiel
Kriegspiel,即战争游戏,是两支实力相当的军队进行作战的游戏,双方都想通过策略手段和作战来摧毁对方。每一方同时都必须在其占领的领土内保护那些有效军事行动所需的资源,并保持其通信线的畅通。——居伊·德波(Guy Debord)
该游戏由两名玩家在一个500格的棋盘上玩,棋盘按20乘25的排列。棋盘被分为北部和南部,每个地区都有一个由九个方格组成的山脉,一个山口,两个兵工厂和三个要塞。每个玩家都有一个必须维护和保卫的通信网。这个网络是由玩家的两个固定的军火库驱动的,它们在垂直、水平和45度对角线上辐射着通信线。每个玩家还有两个可移动的中继广播单元,会反射指向它们的任何通信线。友军单位必须保持与网络的连接,否则就有被捕获的风险。通信线可以被敌人切断,因此它们对战略来说至关重要。游戏的目标是消灭对手,要么消灭其所有力量,要么摧毁对手的两个兵工厂。
译注:这个游戏现在可以在 Mac 的 Appstore 上直接下载和游玩,我自己体验下来的感觉,正如加洛韦自己在文中所说,游戏的人工智能部分确实有点憨,单人模式完全不懂敌人在做什么;但从游戏规则上来看,设计是比较有趣的,例如通信线的限制基本上规定了基本的军队运行的限制空间和方向,但是可移动的中继广播单元对于整体战略通信线的改变也带来了有趣的战局转变,不过目前感受的话,击破和单位数值累加计算的部分有点复杂模糊,可能要对照着不同的单位能力(射程,攻速,移动)的情况仔细再研究,如果有熟悉桌游和机制向的设计师能过给到更多的评价,或许大家应该拉上朋友本地或联网多试试,游戏的美术和音乐的味道都挺不错,哲学家的程序目前感受下来也足够健壮:)
游戏网站:点击跳转
ROMchip
点击跳转
《ROMchip: A Journal of Game Histories》是一个旨在推进游戏批判性历史研究的平台。它支持在地方和全球背景下活跃游戏史相关的任何学科的工作,并拥抱游戏史研究、记录、收集、保存和实践的多样性。ROMchip 是严肃对待游戏史的地方。
ROMchip 以学术文章、口述历史和访谈记录的形式发表作品,以及专门介绍文化机构中与游戏有关的人造物和翻译的短篇作品,致力于从理论和经验上了解历史学,并采用严格的研究方法。我们的内容吸引了众多领域的学者、评论家、记者、爱好者、档案员和学生,不限于文化史、设计研究和历史、游戏研究、计算机史、科技史、物质文化研究、媒体研究、博物馆研究和技术研究等。
ROMchip 致力于接纳学术界和非学术界的作者和读者。我们的创作许可确保作者保持对其作品的控制,而我们的非付费墙意味着每个人都能获得内容。各期杂志在7月和12月一年两次出版。该杂志由Raiford Guins、Henry Lowood 和 Laine Nooney于2019年创立。你可以在网站 上看到目前的所有文章刊物内容。
ROMchip 目前收到了来自纽约大学的媒介,文化和传播系的支持,以及对于版权编辑与维护开销的赞助,网站启动开发和设计的资金由乔治亚理工大学的文学,媒介与传播学院赞助。
原文链接:点击跳转
翻译:叶梓涛
校对:徐露
翻译已获得本人授权,并且将正式发布在 ROMchip 期刊的12月刊的「翻译」板块上。
我如何用软件建模居伊·德波的头脑
How I Modeled Guy Debord's Brain in Software | ROMchip
我从来不是德波崇拜者的一员。我在大学时读过《景观社会》(Society of the Spectacle),甚至自己也看了几部居伊·德波的电影。我主要是把德波与某种沉闷的前卫艺术联系在一起,充斥着愤怒和无聊的话,尽管时常也觉得好玩和令人高兴。
后来在2011年,作为一名教师,我在一个研究生研讨会上布置了《景观社会》的内容,主要是看在旧时代的份上。结果很惨淡。或者说,这本书的教训已变得如此平凡,以至于许多年轻的学生都不明白其中意义。当生活就处于不断的混乱旋转中,为什么还要呼吁一场日常生活的革命?当许多当代艺术:从各种梗(memes)到游戏再到美术都在无休止地采样、翻录和重复时,为什么还要呼吁一种审美上的劫持(aesthetic hijacking)?德波作为毁誉参半的法国作者和电影人,以及情景主义国际(Situationist International)的创始成员,他的工作终于走到了尽头吗?[1] 德波是否因为他的事业已经胜利而已经成为历史了?
大约在同一时间,我偶然发现了游戏史上的一个奇特插曲,这将吸引我深入探索德波的档案。我了解到,对于一个左派先锋派的偶像来说,德波做了件相当奇怪的事情:在1977年1月,他创办了自己的游戏公司。称之为「战略和历史游戏公司」(Strategic and Historical Game Company),德波的新公司只在其名下推出了一款游戏,叫做《战争游戏》(Game of War),一款由德波自己设计并在过去的数年中一直在玩的双人桌游(图1)。该公司首先用铜和银制作了该游戏的限量版,后来又发行了纸和纸板制作的商业版本。德波与他的妻子爱丽丝·贝克尔·霍(Alice Becker-Ho)合作,最终写了关于这个游戏的一整本书。[2]
图1:玩居伊·德波的《战争游戏》。(摄影:Diana Martinez)
然而,德波的档案和遗产很复杂。1991年,在他去世的前几年,德波指示将他所有现存的书籍捣成浆。这个被德波更著名的书籍和电影所掩盖的游戏,渐渐变得默默无闻,最多只能在这个常常难以捉摸的人物的传记中获得一两段的记录。
在个人电脑出现之前,许多艺术家就已经被游戏所吸引。小野洋子用游戏做艺术,其他与上世纪中期国际艺术运动激浪派(Fluxus)有关的艺术家也是如此。包豪斯重新构想了围绕游戏和游玩性的艺术课程,至少在一定程度上是这样。马塞尔·杜尚痴迷于国际象棋。这个名单还可以继续列下去。但德波的游戏有一点不寻常,甚至反常。这个一度成为战后革命狂热标志的人物,为何会将他后来职业生涯的一部分投入到由两名对峙玩家在20x25单位的网格上扮演的拿破仑战争模拟器上?
考虑到这款游戏是他周遭四处延展的网络和数据驱动社会的寓言式索引,我决定把德波的《战争游戏》作为一个研究项目看待,并将游戏移植到电脑上。我选择了个新名字,《Kriegspiel》,和一种新的美学风格,但保留了德波德的规则集(图2)[3] 事实上,这应归功于一个团队的努力。Mushon Zer-Aviv 为《Kriegspiel》创作了艺术和图形设计,DJ /rupture 和 Matt Shadetek 写了一份乐谱。Daniel Perlin 制作了音效。Carolyn Kane 和 Allison Parrish 也为游戏的第一版做出了贡献。
图2:加洛韦等人,《战争游戏》(Kriegspiel, 2022)
这个新名字 Kriegspiel 基于德语中意为「战争游戏」的单词,实际上是德波自己对游戏的非正式称呼,他在游戏正式发行前的私人信件和笔记中使用了这个名字。游戏最初使用了一个Java游戏引擎,第一个《Kriegspiel》软件原型是可以在线玩的,没有单人模式(因此也没有人工智能 [artificial intelligence, AI])。其实坦率地讲,我当时把德波作为挡箭牌,声称德波原则上不希望人们与电脑对弈,而实际上是因为我还没有学会如何编写人工智能的代码。随着时间的推移,应用程序变得老旧,游戏也因为陈旧而变得无法游玩。它从一开始就有点臃肿和过度设计,有2D和3D模式,还有一个从大型多人在线游戏(massively multiplayer online game, MMO)重新设计的复杂多人游戏服务器。因此,几年前我开始尝试从头重写源码,在新冠疫情流行期间缓慢但勤奋地工作。2021年底,一个针对移动和桌面平台进行了重新思考和设计的全新《Kriegspiel》版本发布了。
在今天,重现德波的历史性算法需要什么?为移动设备重建这款游戏需要什么?幸运的是,规则已经公布,且有一个尚好的档案文件线索。(巴黎国家图书馆甚至保存了一个鞋盒,里面装满了德波用来玩军队游戏的玩具士兵)。因此,至少在原则上,在新的世纪以新的形式重建德波的游戏似乎是可能的。在开发游戏软件的过程中,有许多步骤是必要的,包括设计游戏模型,实施规则,以及为多人游戏添加网络组件。我想在这里讲讲这个故事的一部分,谈谈我试图用软件重新开发德波游戏的一些细节,特别侧重于游戏的人工智能部分。事实上,对德波的头脑进行建模的构想是特别诱人的。然而,正如我们将看到的,结果并不完全是我一开始所期望的。
在这篇文章中我不会深入探讨玩法本身,但这里有一些基本坐标[4]。 德波的《战争游戏》分为北方领土和南方领土,每个领土有一条山脉,三个堡垒和两个兵工厂。游戏轮流进行。一个玩家每回合最多可以移动五个单位,然后对敌方单位进行一次攻击。同时,每个玩家必须保持领土上纵横交错的通信线路,使所有的友方单位都在自己的基地的传输范围内。这些通信线路是游戏的一个特殊部分;它们推动了玩家的战略,是获胜的关键。游戏在20世纪70年代末发布后,德波对他的创造感到很高兴:「这个[游戏]的惊喜似乎是无穷尽的,」他后来在回忆录中坦言。「这可能是我所有作品中唯一一件——我不敢承认——人们可能敢说有些价值的东西。」[5]
德波对自己的作品感到高兴,但他对二战后几十年中的法国生活感到厌恶,无论是法国对戴高乐主义传统的懦弱承诺还是超资本主义(hypercapitalism)的羸弱成功。而且我毫不怀疑,如果德波今天还活着,他会唾弃2022年的世界,因为这个世界已经过度充斥着景观、意识形态和异化。我也毫不怀疑他会讨厌看到他珍视的军队游戏在 iPhone 上运行。不过,我从不是德波崇拜者的一份子,而且我对违背大师的偏好没有任何顾虑。在某种程度上,《Kriegspiel》的重现项目,是对这位特殊历史人物的一种友好报复,我们知道,他就以报复他人为乐。尽管这一项目在移动端的运行和当前世界的处境能让德波从坟墓里气得跳出来,但他不满足于现状的精神将作为一种计算机算法再次崛起。
注意:我将在下面描述的大部分内容都是非常基础的,可应用于许多不同种类的游戏。这都是人们在游戏人工智能的入门教科书中可能遇到的材料。考虑到这一点,让我们直接跳入其中,专注于德波牌人工智能(Debord AI)的构建。我将在最后补充一些想法,关于这是否,以及这为何对德波来说特别重要。
图3:一个由两种不同权重的链接连接的节点图,用实线和虚线表示。
像国际象棋或围棋一样,德波的游戏是高度结构化的。游戏在一个网格系统上进行。网格中的每个位置都可被一个或多个单位占据。因此,创建德波牌人工智能的首要任务是建立所谓的图(graph, 图3)。
图是一种数据结构,它是将不同的数据片段组合在一起的一种方式。图由一系列的节点(nodes)组成。这些节点通过各种链接(link, 也叫边 edges)连接起来。一个简单的比喻可能是城市中的街道:广场和十字路口是节点,它们通过各种大街小巷连接。有些道路只能是单向的(one-way),而其他道路是双向的(bidirectional)。图非常有用。它们表示多个实体之间的空间关系。更普遍地说,图能表示任何形式的动态关系(dynamic relationship),(例如一个决策树也可以用图来表示。决策树中的各种问题是节点;问题的答案被链接到树中的后续节点上)。
因此,德波式人工智能的第一步是建立一个包含节点的图,每个节点是游戏面板上的一个位置,能够容纳游戏中的各种指示物(tokens,如兵工厂、步兵、山脉等)。同时,有必要为与图相关的基础应用程序提供基础方法,执行如,向图中添加新节点、从图中删除现有节点,以及将图元素从一个节点移到另一个节点等等任务。例如,如果一个骑兵单位向前推进了一个空间,就有必要从图中的一个节点中删除该单位,同时将其添加到图中的另一个节点上。
当图不简单以静态形式出现,而是当它们被动态解析和分析时才变得最有用。因此,一旦图被建立起来,它就变得有利于以各种方式在图中移动。幸运的是,计算机科学家们已设计了基本的算法来进行所谓的图遍历(graph traversal)。这些技术允许玩家从图中的任何任意位置沿着最有效的路径移动到图中的任何其他任意的位置(图的边可被赋予不同的权重,这些权重可以影响在图中移动成本的计算。例如,一个游戏角色可能很容易在陆地上移动,但在水中的移动速度就比较慢)。总的来说,这些方法都属于寻路(pathfinding)的范畴。
寻路就是指在图中寻找可行路径的技术(图4)。有许多不同的寻路方法,有些比其他方法更高效,有些则更适用于特定任务。例如,人们可能希望从一个原始节点开始,然后以同心圆的方式向外探索图(所谓的广度优先[Breadth-first]的图遍历)。或者,人们可能希望从原点节点开始,然后在尝试所有其他方向之前,尽可能地沿着一条候选路径探索(深度优先遍历)。广度优先的图遍历在游戏中非常常见用于确定距的远近。玩家是否靠近了一个敌人?或者,给定一个游戏指示物,相邻最近的其他指示物是什么?
图4:寻路算法显示了一条从原点到目的地的有效路径,可以避开障碍物。
有了图,再加上手头一些基本寻路算法,人们就可以在一个假想的景观中以某种合理的方式移动游戏指示物。这使得游戏角色可以瞄准图中的一个特定位置,然后向它移动。这一切都很好,但对于大多数游戏来说,这并不足够。德波式人工智能的决策比这更复杂,它需要一个额外的技术。首先是如何确定目标的?为什么选择某个目标,而不是另一个目标?我们需要另一个人工智能组件来补充寻路。
有许多不同的做出决策(decision-making)的方法。对于像第一人称射击游戏这样复杂的、开放式(open-ended)游戏,创建所谓的行为启发法(behavior heuristics)往往是有意义的。这些本质上是由状态变量控制的简单规则。例如,一个环境触发器可能使一个怪物或其他非玩家角色(NPC)从空闲(idle)状态进入攻击状态。
但德波的游戏并不是这样的。德波牌人工智能需要一种不同的方法。《战争游戏》不是开放式的。事实上,这个游戏结构严格,高度受规则约束,甚至有些确定性(deterministic)。从人工智能的角度来看,《战争游戏》更像是国际象棋或井字棋,因此需要一种适合此类游戏的特定类型的人工智能。
这种人工智能被称为极小-极大优化(min-max optimization),起步需要两个要素。
首先,有必要为棋盘游戏的任何给定状态下确定(下一步)每一个可能的步骤(move)。(对于像足球这样涉及身体和物体在空间中不断移动的开放式游戏,虽然不是不可能,但要逐项列出每一个可能的动作是非常困难的;对于像国际象棋这样高度结构化的游戏,记录每一个可能的卒子的前进,每一个可能的骑士的巡行,每一个可能的车的平移等等,都是很容易的。)
其次,一个人必须能够计算出任何给定状态的游戏棋盘的数字得分。继续以国际象棋为例:人们可能会计算每个棋子的分数,并在比赛开始时给出一个相对较高的分数;但如果一个棋手失去了皇后,该棋手的分数就会急剧下降,其他棋子也是如此。分数数字本身并不那么重要。最关键的是,任何给定的游戏配置都可以被指定一个特定的分数,至少在原则上是这样的。
有了这两项技术——即,记录所有可能的棋步,并为每一步棋都指定一个分数之后,极小-极大优化的过程进行如下:人工智能创建一个相同的游戏棋盘副本,在上面进行实验;人工智能按顺序依次执行每一步可能的棋;并为每一步棋产生的新配置计算分数;最终,人工智能根据计算的分数为每一步棋排名。随着优化过程结束,人们可以直接选择最高排名的棋步,并知道这将是最优的。(这里的最优[optimal]完全是通过配置得分来定义的;因此,这种评分标准的设计将对决定何为最优的产生深远影响)。在通常说法中,极小-极大优化也被称为暴力破解(brute forcing),因为它不依赖于任何特殊的策略或直觉,只是对棋盘任何给定状态下的所有可能的棋步进行详尽彻底的计算。
总结一下目前为止拼凑的德波牌人工智能的各个部分:一个节点图代表网格上的单位位置;一个寻路算法确定通过该图的可行路线;一个极小极大操作来收集合符合规则的棋步并为它们打分,以便从最佳到最差进行排序。这些工具促成初级水平的游玩。计算机现在能识别符合规则的棋步,并且能在符合规则的棋步中,识别哪些选择可能比其他的要更好。然而,在这种状态下,德波的人工智能仍然是相当有限的。即便它具有简单的句法知识(syntactical knowledge),但缺乏较大的战略语义感(strategic semantics)。为什么要进入一个棋盘区域,而不是另一个?如何计划在三或四个回合内进行更复杂的军事部署?如何虚张声势,或者表演出假装不敌的样子?
图5:应用K均值(k-means)等聚类算法之前(左侧)和之后(右侧)的数据点。在这个例子中,k被设置为3,生成了三个不同的组,在此标记为红色、绿色和蓝色。
为了解决这些更大的战略问题,让我们为德波的人工智能添加最后一个组件。有趣的是,图节点可以像任何数据集一样被分析和筛选。比方说,在 Adobe Photoshop 中使用的各种算法,往往也是在游戏编程中使用的算法。它们毕竟只是数据,无论这些数据是像素或游戏指示物的网格,都不那么重要。出于此原因,我们有可能将各种数据处理算法改编来为游戏中的人工智能使用。一些从数据分析中借用的最有用的工具被称为聚类算法(clustering algorithms)。这些是简单的函数,将结构化的数据作为输入,然后试图在数据的分散图景中识别出聚类或群组。K均值(k-means)算法(图5)是将数据集划分为各种聚类的一种常用方法,还有其他一些方法,针对不同情形进行了优化。[6]
对于德波的人工智能来说,知道敌方单位在地形上的位置及其聚集程度是很有用的。敌人是集中在一个大队伍中?还是已经分成了两个不相干的势力?是否有游离的单位偏离得太远?同样,对于盟友势力:我的盟军单位是集中在一起还是分散的?我们是否有一个小的或大的集群驻扎在敌人的据点附近?在聚类算法的帮助下,德波的人工智能被赋予更多的战略知识。它可以开始更好地区分某些可能在其他情况下看起来相同的军事演习。
一个初级的德波式人工智能对德波本人和他的遗产有什么意义?考虑一下德波所写的一些战略和技术,其中许多也是情景主义国际的特点。回顾一下心理地理学(psychogeography)和漂移(dérive)的技术。回顾德波关于剽窃和劫持的讨论(异轨,détournement)。或者回想一下标志性的巴黎情景主义地图(图6),其中各种街区被切割、重新排列,并以一种流动和灵活的结构连接在一起。
图6:对巴黎情景主义地图中流动和灵活运动流的分析。(图画来源于Guy Debord, "The Naked City" [1957])
人们可能会自然而然地认为,德波尔的《战争游戏》会显示出一系列类似的美学价值,游玩风格会是归纳的、联想的、根茎状的和灵活的。人们可能会认为这个游戏会是关于心理地理学、漂移或劫持的。令人惊讶的是,《战争游戏》与这些技巧中的大多数都不兼容。在德波的游戏的游玩中没有心理地理学,而只有高度理性化和确定性的地理学。而我们可以从德波与贝克尔·霍(Becker-Ho)的比赛记录中了解到他的游玩风格,那实际上是严格结构化的规则性图形,并且已被优化成最佳打法(图7)。[7]
我用结晶状(crystalline)来形容它,因为晶体是通过对规则结构的迭代而生长发展的。德波被那些为特定游戏规则优化过的规则形状所吸引。这些结晶式的形状看起来像格栅或桁架:十字形、翼形、X形和方框。在研究他的游戏之前,我曾认为德波是一个更加灵活和动态化的思想家。但在研究了这个游戏后,我意识到他也是逻辑性和决定论式的。也许德波比我先前想象的更像一台计算机?
游戏很适合计算机中原生的那种数字结构和逻辑学。当然不是所有的游戏;我指的是高度结构化和规则约束的游戏,罗杰·凯洛瓦(Roger Caillois)在他的《游戏与人》(Man, Play, and Games, Les Jeux et les hommes)一书中把它们归类为竞赛(agôn)游戏。[8] 这类的游戏有分数(数字)。它们有明确定义的胜利状态(逻辑条件)。它们有规则(算法和控制结构)。难怪这类游戏在计算机上运行得如此之好。从某种意义上说,游戏已经是计算机了,至少某些游戏已经是了,包括德波的《战争游戏》。
图7:对居伊·德波《战争游戏》中的结构化作战关系的分析 ......(引自 Alice Becker-Hoand 与 Guy Debord,《战争游戏》[伦敦:Atlas出版社,2007],33页)
我们得出了两个可能的结论,这两种结论在我看来都合情合理。
首先,计算机没有我们想象的那么僵硬。作为一种数据结构,图实际上是高度灵活的。那张著名的巴黎情景主义地图看起来已经很像一张图了。而且将聚类算法应用到德波的心理地理学的路线上也不会太难。(我并不是说结果会很有成效,只是说这些材料已经很适合于这种形式了)。
第二个结论是,德波不是我们想象中的那个人。明智的做法是不要试图通过一个作者的作品来对他进行心理分析。但从这部特殊的作品中得到的证据是压倒性的。德波的《战争游戏》不是关于漂移或劫持。这个游戏是高度结构化、理性和确定性的。在过去,我称之为「怀旧算法」(nostalgic algorithm)[9],因为德波喜爱一种与皮特头盔一同消失的早期现代军旅生活。对于德波的人工智能,人们也可以用另一种方式来描述它:一种战术性算法(tactical algorithm),一种用代码来思考战略和结构最纯粹形式的方法。「我不是一个哲学家,」德波在与吉奥乔·阿甘本(Giorgio Agamben)的谈话中最终承认,「我是一名战略家。」[10]
事后看来,我们也可以说,德波对严格结构的喜爱意味着他(不自觉地、巧合地)是以符号人工智能(symbolic AI),即1970年代的「老式人工智能」(Good Old-fashioned AI, GOFAI)的方法和风格来工作的。这就是为什么我决定使用极小极大值的方法来开发人工智能,尽管它是一种更古老的人工智能风格:但它似乎与德波结构化、演绎式的风格相匹配。从本质上讲,德波是在对他自己的游戏进行暴力破解。因此,显而易见,德波牌人工智能也应对这游戏进行暴力破解。
但我很快就发现这个方法存在一个巨大问题。我在测试时了解到,即使是最新的、最没有经验的玩家,也可以不费吹灰之力就打败电脑。作为一个开发者,我有些沮丧地承认这一点,但是,唉,我的德波牌人工智能只是没有那么好。我能否想出一个办法让它更聪明?我是否应该简单地继续完善现有代码,希望通过小的增量来改善它?还是说我必须完全放弃极小极大值的技术,采用一种新的人工智能方法?毕竟,今天的人工智能革命不是由暴力破解的操作驱动,而是由数据驱动的机器学习来驱动的。
在某种意义上,我正在重温人工智能在20世纪80年代,即所谓的人工智能冬天中经历的那种离散理性(discrete rationality)危机。当时,符号化的人工智能还不足以处理复杂性。暴力破解的理性不足以应付现实世界的场景。也许极大极小方法对于国际象棋来说是可行的,但对于需要更细微决策的场景来说,它还不够好。
在这期间,计算机科学家是如何解决这些问题的?我能否以他们为榜样,以免我屈服于自己版本的人工智能寒冬?第一个问题的答案是,计算机科学家们改变了他们对整个人工智能基础的理念。他们不再使用符号、法则和逻辑推理进行暴力计算,而是开发了一种新的人工智能,即数据驱动的、统计学的和归纳式的。我是不是也可以把老式人工智能抛在脑后,重新设计德波的人工智能,使其更加经验性,更以数据为中心?
幸运的是,对计算机科学家们来说,这些历史性的转变正好发生在用户愿意(或被迫)交出大量数据的时候,其形式包括撰写的网页、电子邮件和文本、数码照片、链接、赞和点击。所有这些丰富数据可以被谷歌或亚马逊收集,利用大量算力进行分析,并再处理为人工智能。如果没有必要的数据来驱动,新的数据驱动的方法就永远不会成功。
在这里,我得出了一个具有讽刺意味的结论。旧的符号式人工智能最适合德波的游玩风格。但它作为人工智能的效果并不是特别好,因为它不能让人在与计算机的对抗中获得游玩的乐趣。为了改进人工智能,我怀疑我将不得不跟随计算机行业的发展,从一个演绎/逻辑的方法,切换到一个更经验性的、自下而上的依靠数据和机器学习方法。
换句话说,为了最好地模拟德波的头脑,我可能需要打破该头脑的易读行为(legible behavior),这是我仍在思考的问题。问题是我还没有积累足够的游玩数据来驱动任何种类的机器学习算法。而且目前还不清楚这些数据集究竟可以如何收集,以及是否该进行收集。在这一天到来之前,德波牌人工智能将继续维持呆头呆脑和确定性,这有点像它的名字(译注:Debord 和 Dumb),尽管他有其他的名声。
在此期间,我建议与朋友而不是电脑来一起玩《Kriegspiel》。这样会更有趣。
注释
1.情景主义国际由居伊·德波共同创立,是一个存在于1957年至1972年的先锋派团体。
2.最初以 Alice Becker-Ho 和 Guy Debord, Le Jeu de la Guerre:Relevé des positions successives de toutes les forces au cours d'une partie(巴黎。Éditions Gérard Lebovici, 1987),该书于2006年由 Gallimard 重新发行,并被翻译成英文,名为 Alice Becker-Ho 和 Guy Debord, A Game of War, trans. Donald Nicholson-Smith(伦敦:Atlas,2007)。
3.Kriegspiel, updated March 22, 2022, http://r-s-g.org/kriegspiel/
4.虽然本文主要是关于Kriegspiel的软件,但我在《不可计算:在漫长的数字时代的游玩和政治》(纽约:Verso,2021年)一书中,用了很长一章来介绍德波《战争游戏》的历史和政治背景,包括一些围绕德波作为游戏设计师和玩家的倾向性的复杂章节。
5.Guy Debord, Panégyrique, vol. 1 (Paris: Gallimard, 1993), 70.
6.k均值(k-means)算法将数据筛选成一系列的组,每个组都围绕一个中心点或均值进行聚类。输入变量,k,指的是想要的聚类数量。一个典型的实现可能如下:给定一组100个数据点,将这些点组织成四个聚类(基于一些关于相似性的假定,例如,这些点在空间上相互接近)。
7.See Becker-Ho and Debord, A Game of War.
8.Roger Caillois, Man, Play, and Games, trans. Meyer Barash (New York: Schocken Books, 1979).
9.Galloway, Uncomputable, 197–202.
10.Quoted in Giorgio Agamben, “Repetition and Stoppage—Debord in the Field of Cinema,” in In Girum Imus Nocte et Consumimur Igni—The Situationist International (1957–1972), ed. Stefan Zweifel et al. (Zurich: JRP Ringier, 2006), 36.
Bio for Translators
Zitao YE (translator)
Zitao YE is a game designer, writer, translator, works at Tencent NExT Studios for creative game incubation in Shanghai, producer of "Gameplus+" project and "Gameplus" cross-border game research and creation workshop, manager of independent media lab "Sunset Sway", host of its podcast and its translation/curation project about video game called "sunset project". He is also the author of independent experimental game works such as "Make a Poem"(A literature machine that produced 100k poems), "Sword Zen" and "The Shape of Time" (IGF 2022 Nuovo Award Honorable Mentions, GDC EGW 2022) etc.
He is actively promoting the cross-border connection, clarification and creative activities between video games and humanities, art and technology ; He is currently developing an "interface research creation" methodology for game studies research, creation and ontological thinking to address the current cultural dilemma of video games. He graduated from Nanjing University and went on an exchange trip to l'Université Paris-Diderot, and has an interdisciplinary background in history, philosophy, art history and cultural creativity, and IAS (Institute of Advanced Studies in Humanities and Social Science).
Xu Lu (Proofreading)
Xu Lu is a writer and Ph.D. student. She is currently studying at Sichuan University and is active in the academic community History of Science Library. As a researcher in the field of culture and literature, her dissertation, tentatively titled Textile in theory: Techniques and Technologies of Patterns, will focus on an often-overlooked aspect of the cultural technique: is this theory gendered? Why are mathematics (e.g., Badiou) and folds (e.g., Deleuze) important in contemporary critical theory? This work will base on the intertextual background of science and humanities, focusing on the keywords "textile," "surface," and "atmosphere." Moreover, She is also curious about the broadening of academic forms by artistic practice.
计划近期收录了 Tuur Ghys 科技树:历史策略游戏中的自由与决定论 Technology Trees: Freedom and Determinism in Historical Strategy Games (2012)(翻译:王玉 校对:苗青)
日 | 落译介计划 是媒体实验室落日间对一些有助于思考游戏/电子游戏的外文文本翻译和推荐/索引计划。(查看网站)
Alexander R. Galloway 不在运作的界面 Unworkable Interface (2008)
感谢支持落日间的朋友
欢迎赞赏或在爱发电赞助落日间