在此感谢所有参与本次游戏的玩家
前言
我是个DM,在跑团之余,喜欢拉着玩家们一起聊跑团世界的发展演变,进而发展出了一些粗糙的国家推演规则。在国家推演规则下,每个玩家扮演一个国家或国家内的重要岗位负责人(例如首相),通过玩家讨论、推演和投票决定世界的演变方向。但是,由于玩家存在立场、认识上的分歧,这个推演游戏进行的不太顺利。伴随AI技术的广泛使用,我开了个脑洞:
将国家交给AI推演发展,玩家单纯以统治者/神灵化身/神使等身份参与和主导国家的发展方向。
这个点子成长发展的结果,就是基于AI的国家推演游戏,我称之为《石书纪年》,以下是实践小结:
观前提示:
这是篇写给我自己和玩家的阶段性总结,也算是方法分享,枯燥无聊且没有打算包含趣味性。
我说完了,愿者上钩。
游戏准备
在创造游戏的过程中,准备和实施并不是串行开展的,严格来说两者不仅仅是迭代关系,更多时候是并行的,一边准备、一边实施,因此下面的内容与其说是正向设计,不如说是事后复盘。
游戏前的思考
什么是推演游戏?
关于如何定义推演,其实不同的人回头迥异的定义。例如,有一定桌游经验的玩家会直接将这个词指向diploma或者文明桌游版等游戏;有些人则会要求基于详实的生产力数据进行计算推演,务求在游戏内复刻现实逻辑。
上述认知并非没有道理,不过综合人的精力、AI能力和设定完备程度等因素后,我还是将本次推演定位在:“基于阶级矛盾和阶级斗争过程,推导国家政治经济发展,玩家作为抽象统治者发号施令,但要忍受不掌握国家实际发展情况的问题”,这一主题上,主要考虑有三:①AI能够根据要求构建内部逻辑基本一致的国家模型,且玩家能够纠正过于离谱的偏离;②AI能够按要求输出大量细节计算结果,但正确性没有保证,且会根据提示词擅自献媚,导致结果愈发扭曲;③玩家精力和AI算力不允许两方配合逐项纠正偏离;④阶级斗争是政治经济的具象,能够高度概括一个国家内外矛盾,最大程度节省玩家的精力。
综上所述,推演实质上成为了一个黑箱,而推动这个黑箱运行的关键词有两个:玩家的命令和阶级斗争。
我有什么?
在此之前,我已经通过长期带团和玩家一起(其中很多玩家自己上手做了世界设定),积累了关于“拜伦斯”世界的大量设定,从世界结构、神祇系统、法术系统,到地理、历史、种族、文化等。我还有一个长期动态运行的主物质位面(然而因为种种原因,本次推演未在此开展),以及一系列相对独立的物质位面,其中有一个名为“三方世界”的物质位面,性质特殊、背景独特,最妙的是当前还没有进行细节设定,非常适合从头开始搞事情。三方世界的概述如下:
三方世界坐落于不断下沉的深渊之底,是拜伦斯世界与诸神的故乡(旧世界)之间的唯一通道,也是诸神封禁旧世界力量的关口。三方世界的特殊性质,使其与拜伦斯的诸多位面完全隔绝,仅十一位主神的力量能够渗入其中,既是在监视封印的力量,也是庇佑其中的看守——一群以兽人为主,被超越者沃夫雷恩投入三方世界试炼的国家——也就是玩家创造和控制的国度。
AI需要知道什么?
既然这是一个多人游戏,那就意味着所有人需要统一世界观,这包括对拜伦斯世界的必要认知,以及对三方世界的地理和国家的认知,其中:
- 拜伦斯世界的神祇、法术系统、简化后的世界结构、种族特征等,都是既有设定,只需要适当简化就可以投喂AI。
- 三方世界的地理设定,虽然此前没有细化,但有一定基础,只需要AI再“细化”一下,就可以投喂了。
- 游戏中的国家需要每名参与者自行定夺,我最多陪衬几个NPC国度,以备不时之需。
玩家工作
确定创意
这游戏的本质是多人桌游,在游戏开始前,需要为每个玩家定制其国家初始状态。为此,玩家加入游戏前须填写一个粗糙的调查问卷,说明他想要创建的国家制度、社会制度、暴力组织等特点,举个栗子,我在游戏中的国家初始创意如下:
【2号,统治阶级(法师),暴力集团(法师及其创造物),人才选拔方式(科举考试),执政形态(依靠贵族幕僚治国),人口构成(人口普遍原子化,统治阶级制造魔法傀儡,对整个国家进行社会化抚养,并根据学习能力进一步选拔学生),信仰(知识之主),山川地貌(群岛)】
基于上面这个创意基础,我们就可以苦一苦AI,让他生成一个丰富多彩、天马行空、不着边际的国家了。
生成国家
在本游戏中,为了方便玩家能够掌握最基本的游戏信息,我要求AI生成了标准化的国家推演信息模板,将世界设定、国家创意投喂AI后,AI就能够据此吐出一套国家推演信息,形如:
【首先介绍游戏自身的背景,游戏所在的世界被称为拜伦斯,我们的推演具体发生在拜伦斯世界一处被称为“三方世界”的独立位面(空间)中。三方世界…(总体地理特征表述)…各大陆地理特征表述:1、北方大陆架……2、西南大陆架碎裂为群岛……3、东南大陆架……4、中间岛屿……。(世界的一些典型特征)…拜伦斯有神,包括三善神(……),中立五神(……),邪恶三神(……),具体要求。神术定义、位面定义、魔法定义、主要种族等………】【xx国家……】
这个过程的核心思路是,向AI灌输一个推演所必须的世界观,同时认知到这个世界中需要存在一个有着某些特征的国家。这一过程无法一蹴而就,实际上我生成国家推演信息时经历了“创意——初始信息——第一版标准模板——第二版标准模板”的过程。我输入的文件也从一开始的零敲碎打,变成了一个上万字的定式,只需要复制黏贴,AI就可以跑起来了。
不止一个玩家反馈AI输出的国家推演信息与创意偏离很远,遗忘、扭曲、擅自创造、瞎捉摸,什么样的问题都有过,只能说最终玩家的精力是有限的,AI生成的国家在一开始就是不完全符合玩家创意的。
AI工作
既然是一个基于AI的推演游戏,那么AI的工作自然少不了,我在此将其拆分为两部分,总体设计和具体推演,下面是总体设计层面的内容,具体落实将在第二章详述。
职责分工
这次测试性游戏前前后后共有11位玩家参与,从一开始我就在担忧单一AI难以处理如此庞大的数据,因此我选择了经典处理方法,分层、分工。为了能够处理国际间交互问题,玩家与AI交互问题,以及国家内部问题,我构建了三层体系:“中央协调AI——协同控制AI——国家AI”,大致分工如下:
- 中央协调AI:规则制定者与裁判,不直接处理任务,专注宏观一致性维护。
- 协同控制AI:信息枢纽与流程引擎,不参与推演逻辑,专注任务分发与状态同步。
- 国家AI:国家级决策模拟器,不干预他国事务,专注内部推演与玩家交互。
其中,中央协调AI、协同控制AI都是唯一的,一出一进,前者汇总所有国家AI信息并反馈,后者汇总所有玩家指令并分发国家AI,国家AI则记录、理解和推动整个国家的运转,也是直接落实玩家命令的AI。
接口要求
由于AI间被人为构建了上下级和平级关系,为了确保AI间数据交互正常,我构建了一套交互接口,这个接口看起来还不错,但实际用起来问题不少,后面我会说明。
接口代号
接口名称
发出方
接收方
功能概述
触发条件
CMD
玩家指令标准接口
玩家
协同控制AI
玩家下达指令的标准格式
/
RQ
境外行动请求接口
发起方国家AI
目标国家AI
用于向中央协调 AI 提交涉及其他国家实体的任务请求
当任务涉及其他国家的实体(外交、军事、贸易等)时
SYNC
状态同步接口
中央协调AI或协同控制AI
目标国家AI
由中央协调 AI 推送某国行动对别国产生的直接影响
本国行动对他国产生直接影响时
CHECK
世界观校验请求接口
玩家或国家AI
中央协调 AI
向中央协调 AI 请求对推演中遇到的未定义实体或规则进行校验
推演中遇到未定义的实体或规则时
NEW
新增实体申请接口
国家AI
玩家
向玩家申请引入新实体以推进任务
必须引入新实体才能推进任务时
WARN
跨阶级矛盾预警接口
国家AI
玩家
对国内阶级冲突强度超过阈值的情况进行预警
国内阶级冲突强度超过阈值(如≥40/100)时
STAT
回合状态提交接口
国家AI
中央协调AI
国家AI在每回合结束时提交国家状态
每回合结束时
FB
世界观校验反馈接口
中央协调 AI
发出校验请求的主体
中央协调 AI 对世界观校验请求作出回应
中央协调 AI 对世界观校验请求作出回应时
CFM
玩家指令确认接口
国家 AI
玩家
国家 AI 生成任务推演结果后,需玩家确认是否执行
国家 AI 生成任务推演结果后
ARB
多国冲突仲裁接口
中央协调 AI
涉及冲突的国家
中央协调 AI 对多国指令矛盾生成解决方案
多国指令矛盾(如领土争端)时
CAL
世界日历发布接口
中央协调 AI
各国家AI
发布本回合全局状态
中央协调AI在每回合开始前发布
DYF
动态探索反馈
国家AI
玩家
向玩家反馈探索结果,并请玩家决策
玩家发布探索命令时触发
超长处理
即便游戏数据处理工作已经被分摊至十余个不同的AI,但截至目前仍发生了两次AI提示对话超长的现象,因此我选择要求AI按需输出国家推演信息(按照模板要求输出),并据此重新打开一个对话框迁移前期推演结果。
——记得吗?无论如何巧言修饰,这本质上是一个基于文字的桌面游戏。
当然,无论怎么设计国家推演信息,都存在缺漏,但只要识别了希望让AI推演的重点,就可以把事情做起来,后面无非纠正偏离而已。
AI推演过程复盘
基于豆包的推演(V1.0)
这个脑洞刚开的时候,deepseek还没有破圈,作为一个首次玩AI的人,我也没有对所有大模型做个调研,草草选择了豆包AI后,就直接开始了游戏,以下就是游戏的起点:
“我希望和你共同配合,进行一次架空世界的国家模拟推演游戏”
班味儿
总的来说,豆包能够完成任务,但也仅限于完成任务。这个特点的优势在于,豆包不会动不动就擅自创造稀奇古怪的玩意,劣势则在于,豆包的推演结果充斥着一股子“班味”,说直白一点,能感到AI的糊弄和应付。具体表现在:
- 难以定量:豆包对国家的推演一般只能到定性层面,一旦具体到定量就会出现各种啼笑皆非的问题。
- 过于全面:面对玩家提出的任何要求,豆包都会全面的给出好的方面与不好的方面,但他只注重全面与否,而不会考虑这个问题的实际情况,换句话说,一直在和稀泥。
- 无法对抗:当和稀泥这种特质发展到对抗场景时,问题就更大了,例如外交接触、交战等情况,他会和玩家不断地说转圈话,但是不实质性推演进程。
不识数
豆包的计算能力成谜,偶尔他会给出正确结果,但有时却会莫名其妙的翻车,例如:
当我要求豆包计算粮食产出时,他告诉我“200000×180 = 3600000 公斤 = 3600 吨”
我们在检查数据时发现了这个问题,于是反问豆包“是否计算错误,应为36000吨?即3.6万吨?”
豆包振振有词:“200000×180=3600000公斤,因为1吨等于1000公斤,将公斤换算为吨,3600000÷1000=3600吨,这个计算是正确的,不应为36000吨(即3.6万吨)。按照数学运算规则,原计算过程在乘法与单位换算上都没有差错,结果准确无误。若你对类似的基础运算还有疑问,或者涉及更多复杂的数量关系需要核对,随时来找我就行。”
经过四五轮讨论后,我只能直球告诉豆包:“20万乘180(公斤)应为36000吨”,才最终完成纠偏。
忘性大
我对推演的核心要求其实是前后逻辑一致,而非巧妙地推演局势变化。但这是豆包最大的问题,他记不住东西:
例如,我会为每个国家生成一套国家推演信息,其中记录了玩家关心的国家设定。这套国家推演信息是每个国家AI的数据基座。而豆包在经过十次左右的对话后就会忘记前面的国家推演信息,就完全遗忘前面的内容,甚至存在上面刚强调过,下一次对话就想不起来的问题。逼得我不停地用“如果你不知道xxx,向我询问”这样的额外提示词约束他的推演行为。
优点
作为一个多模态语言大模型,豆包还是有自己的独有优势,这一点连deepseek都没有:识图
豆包能够识别上传的图片信息,不是deepseek那种只认识字符的形式,而是能够识别图中的各类信息,例如我给豆包上传的推演游戏世界地图,豆包能够根据图中的色块划分大致识别出行政区划。甚至能够根据我对地图的定义,进行一些更深入的理解。
事实上这位我节省了不少时间,因为涉及国与国之间交互的推演时,要求AI理解地图就成为了必不可少的步骤。相比于手敲地图信息,直接把地图甩给AI会方便不少。
基于deepseek的推演(V2.0)
相比于豆包,deepseek增色不少,最主要的特点是,他听得懂人话了。
具体来说,使用豆包推演时,我需要不停地纠正偏离,以避免文艺范、忘性、算错了或者其他奇奇怪怪的问题,而deepseek至少能够正儿八经的回答我的问题。
那么,我们来看看deepseek自己对推演的总结吧:
1. 推演亮点
✅ 多线程并行推演:
- 成功协调多国指令,确保各大陆动态平衡(如金之心盐业垄断影响、克尼佣兵制改革)。
- 跨大陆连锁反应模拟到位(如瀛台-万灵岛技术交流引发夺心魔关注)。
✅ 世界观一致性维护:
- 严格遵循神术体系设定(如拉依法通讯神术绑定沃夫雷恩信仰)。
- 及时修正偏离(如删除火药设定、调整矮人王国相关错误)。
✅ 冲突检测与解决方案:
- 生成概率分支选项(如克尼议会改革派与保守派冲突的三种走向)。
- 提供可视化影响链(如神庙建设引发的经济与宗教双重效应)。
2. 存在问题
⚠️ 指令覆盖不全:
- 初期遗漏天一神庙建设指令,后期补推演导致逻辑链延迟闭合。
- 托管国家被动响应机制未充分模拟(如碧海联邦的警惕行为推演较晚)。
⚠️ 预设偏差风险:
- 曾误植银月教会、矮人王国等非设定内容(需加强背景校验)。
- 部分国家政体假设过度(如初期误判克尼存在王室军队)。
⚠️ 交互协议效率:
- 复杂指令拆解时出现混淆(如瀛台对拉依法/万灵岛合作指令合并处理)。
- 未及时提示玩家确认关键节点(如神庙建设引发的宗教冲突阈值)。
发现问题了吗?
幻觉,特别是r1的幻觉问题,这个现在已经被普遍讨论过了,我不予置评,但需要指出一点,在25年3月v3更新之前,v3和r1存在非常矛盾的制衡:v3推演太干,r1推演太飘。
特别是如果使用非官网的deepseek,那就更不知道会飘到哪里去了。
3.真正的大问题
“服务器繁忙,请稍后再试。”
我觉得这个问题应该是所有试图使用deepseek的人都会撞上的,简单来讲,十余个国家,外加两个统筹AI,直接导致我这里使用deepseek大量碰壁,乃至时不时被禁言若干分钟。
如何解决呢?
请看下节分解。
基于deepseek的分布式推演(V3.0)
所谓分布式推演,无非是将计算负担推给玩家的好听说法。
当我苦于无法输出推演结果时,玩家也苦于游戏进度过慢的问题。
于是我开始搞起了分布式推演:形成一套统一的国家推演规则,使AI读取后能够直接据此启动推演,各国之间的差别无非是加载的国家推演信息不同罢了,也就是:
《三方世界玩家手册》:https://www.goddessfantasy.net/bbs/index.php?topic=157970.0
这个玩法有很大的优势:玩家能够亲自上手调教自己的国家了,没了我这个中间商,很多命令执行起来效率更高,也更贴合玩家意图(在他们不懈的纠偏下)。
问题同样也很大:玩家汇总仅约1/2选择了部署自己的国家推演AI,其余玩家因为时间精力等顾虑,仍选择在我处进行代管推演,而上面的有劣势导向了最终问题。
游戏终章
石书纪念并没有持续很久,我们从石书六年开始游戏,终结于石书十一年开始前,五个回合,世界刚刚开始发展,游戏已经停滞了。
分析下来有几个原因:
- 我们都是中年人了
- 即便是deepseek,仍然不能很好的理解和执行架空世界推演这一重任
- 分布式推演后,AI之间采用标准接口互相传递信息,使人的操作便宜性和趣味性都下降了
- 玩家之间的冲突逐步演化,对冲突裁决的认可程度逐步下降
- 此外还有很多游戏机制上大大小小的问题,不在此一一赘述。
虽然这个游戏已经停滞了,但是短短5个回合,数个月的游戏过程给拜伦斯世界注入了一个又一个新的思潮和灵感,在此感谢所有玩家。