基於AI的國家推演遊戲小結


3樓貓 發佈時間:2025-04-16 00:32:30 作者:archrai12 Language

在此感謝所有參與本次遊戲的玩家

前言

我是個DM,在跑團之餘,喜歡拉著玩家們一起聊跑團世界的發展演變,進而發展出了一些粗糙的國家推演規則。在國家推演規則下,每個玩家扮演一個國家或國家內的重要崗位負責人(例如首相),通過玩家討論、推演和投票決定世界的演變方向。但是,由於玩家存在立場、認識上的分歧,這個推演遊戲進行的不太順利。伴隨AI技術的廣泛使用,我開了個腦洞:
將國家交給AI推演發展,玩家單純以統治者/神靈化身/神使等身份參與和主導國家的發展方向。
這個點子成長髮展的結果,就是基於AI的國家推演遊戲,我稱之為《石書紀年》,以下是實踐小結:
觀前提示:
這是篇寫給我自己和玩家的階段性總結,也算是方法分享,枯燥無聊且沒有打算包含趣味性。
我說完了,願者上鉤。

遊戲準備

在創造遊戲的過程中,準備和實施並不是串行開展的,嚴格來說兩者不僅僅是迭代關係,更多時候是並行的,一邊準備、一邊實施,因此下面的內容與其說是正向設計,不如說是事後覆盤。

遊戲前的思考

什麼是推演遊戲?

關於如何定義推演,其實不同的人回頭迥異的定義。例如,有一定桌遊經驗的玩家會直接將這個詞指向diploma或者文明桌遊版等遊戲;有些人則會要求基於詳實的生產力數據進行計算推演,務求在遊戲內復刻現實邏輯。
上述認知並非沒有道理,不過綜合人的精力、AI能力和設定完備程度等因素後,我還是將本次推演定位在:“基於階級矛盾和階級鬥爭過程,推導國家政治經濟發展,玩家作為抽象統治者發號施令,但要忍受不掌握國家實際發展情況的問題”,這一主題上,主要考慮有三:①AI能夠根據要求構建內部邏輯基本一致的國家模型,且玩家能夠糾正過於離譜的偏離;②AI能夠按要求輸出大量細節計算結果,但正確性沒有保證,且會根據提示詞擅自獻媚,導致結果愈發扭曲;③玩家精力和AI算力不允許兩方配合逐項糾正偏離;④階級鬥爭是政治經濟的具象,能夠高度概括一個國家內外矛盾,最大程度節省玩家的精力。
綜上所述,推演實質上成為了一個黑箱,而推動這個黑箱運行的關鍵詞有兩個:玩家的命令和階級鬥爭。

我有什麼?

在此之前,我已經通過長期帶團和玩家一起(其中很多玩家自己上手做了世界設定),積累了關於“拜倫斯”世界的大量設定,從世界結構、神祇系統、法術系統,到地理、歷史、種族、文化等。我還有一個長期動態運行的主物質位面(然而因為種種原因,本次推演未在此開展),以及一系列相對獨立的物質位面,其中有一個名為“三方世界”的物質位面,性質特殊、背景獨特,最妙的是當前還沒有進行細節設定,非常適合從頭開始搞事情。三方世界的概述如下:
三方世界坐落於不斷下沉的深淵之底,是拜倫斯世界與諸神的故鄉(舊世界)之間的唯一通道,也是諸神封禁舊世界力量的關口。三方世界的特殊性質,使其與拜倫斯的諸多位面完全隔絕,僅十一位主神的力量能夠滲入其中,既是在監視封印的力量,也是庇佑其中的看守——一群以獸人為主,被超越者沃夫雷恩投入三方世界試煉的國家——也就是玩家創造和控制的國度。

AI需要知道什麼?

既然這是一個多人遊戲,那就意味著所有人需要統一世界觀,這包括對拜倫斯世界的必要認知,以及對三方世界的地理和國家的認知,其中:
  1. 拜倫斯世界的神祇、法術系統、簡化後的世界結構、種族特徵等,都是既有設定,只需要適當簡化就可以投餵AI。
  2. 三方世界的地理設定,雖然此前沒有細化,但有一定基礎,只需要AI再“細化”一下,就可以投餵了。
  3. 遊戲中的國家需要每名參與者自行定奪,我最多陪襯幾個NPC國度,以備不時之需。

玩家工作

確定創意

這遊戲的本質是多人桌遊,在遊戲開始前,需要為每個玩家定製其國家初始狀態。為此,玩家加入遊戲前須填寫一個粗糙的調查問卷,說明他想要創建的國家制度、社會制度、暴力組織等特點,舉個栗子,我在遊戲中的國家初始創意如下:
【2號,統治階級(法師),暴力集團(法師及其創造物),人才選拔方式(科舉考試),執政形態(依靠貴族幕僚治國),人口構成(人口普遍原子化,統治階級製造魔法傀儡,對整個國家進行社會化撫養,並根據學習能力進一步選拔學生),信仰(知識之主),山川地貌(群島)】
基於上面這個創意基礎,我們就可以苦一苦AI,讓他生成一個豐富多彩、天馬行空、不著邊際的國家了。

生成國家

在本遊戲中,為了方便玩家能夠掌握最基本的遊戲信息,我要求AI生成了標準化的國家推演信息模板,將世界設定、國家創意投餵AI後,AI就能夠據此吐出一套國家推演信息,形如:
【首先介紹遊戲自身的背景,遊戲所在的世界被稱為拜倫斯,我們的推演具體發生在拜倫斯世界一處被稱為“三方世界”的獨立位面(空間)中。三方世界…(總體地理特徵表述)…各大陸地理特徵表述:1、北方大陸架……2、西南大陸架碎裂為群島……3、東南大陸架……4、中間島嶼……。(世界的一些典型特徵)…拜倫斯有神,包括三善神(……),中立五神(……),邪惡三神(……),具體要求。神術定義、位面定義、魔法定義、主要種族等………】【xx國家……】
這個過程的核心思路是,向AI灌輸一個推演所必須的世界觀,同時認知到這個世界中需要存在一個有著某些特徵的國家。這一過程無法一蹴而就,實際上我生成國家推演信息時經歷了“創意——初始信息——第一版標準模板——第二版標準模板”的過程。我輸入的文件也從一開始的零敲碎打,變成了一個上萬字的定式,只需要複製黏貼,AI就可以跑起來了。
不止一個玩家反饋AI輸出的國家推演信息與創意偏離很遠,遺忘、扭曲、擅自創造、瞎捉摸,什麼樣的問題都有過,只能說最終玩家的精力是有限的,AI生成的國家在一開始就是不完全符合玩家創意的。

AI工作

既然是一個基於AI的推演遊戲,那麼AI的工作自然少不了,我在此將其拆分為兩部分,總體設計和具體推演,下面是總體設計層面的內容,具體落實將在第二章詳述。

職責分工

這次測試性遊戲前前後後共有11位玩家參與,從一開始我就在擔憂單一AI難以處理如此龐大的數據,因此我選擇了經典處理方法,分層、分工。為了能夠處理國際間交互問題,玩家與AI交互問題,以及國家內部問題,我構建了三層體系:“中央協調AI——協同控制AI——國家AI”,大致分工如下:
  • 中央協調AI:規則制定者與裁判,不直接處理任務,專注宏觀一致性維護。
  • 協同控制AI:信息樞紐與流程引擎,不參與推演邏輯,專注任務分發與狀態同步。
  • 國家AI:國家級決策模擬器,不干預他國事務,專注內部推演與玩家交互。
其中,中央協調AI、協同控制AI都是唯一的,一出一進,前者彙總所有國家AI信息並反饋,後者彙總所有玩家指令並分發國家AI,國家AI則記錄、理解和推動整個國家的運轉,也是直接落實玩家命令的AI。

接口要求

由於AI間被人為構建了上下級和平級關係,為了確保AI間數據交互正常,我構建了一套交互接口,這個接口看起來還不錯,但實際用起來問題不少,後面我會說明。
接口代號
接口名稱
發出方
接收方
功能概述
觸發條件
CMD
玩家指令標準接口
玩家
協同控制AI
玩家下達指令的標準格式
/
RQ
境外行動請求接口
發起方國家AI
目標國家AI
用於向中央協調 AI 提交涉及其他國家實體的任務請求
當任務涉及其他國家的實體(外交、軍事、貿易等)時
SYNC
狀態同步接口
中央協調AI或協同控制AI
目標國家AI
由中央協調 AI 推送某國行動對別國產生的直接影響
本國行動對他國產生直接影響時
CHECK
世界觀校驗請求接口
玩家或國家AI
中央協調 AI
向中央協調 AI 請求對推演中遇到的未定義實體或規則進行校驗
推演中遇到未定義的實體或規則時
NEW
新增實體申請接口
國家AI
玩家
向玩家申請引入新實體以推進任務
必須引入新實體才能推進任務時
WARN
跨階級矛盾預警接口
國家AI
玩家
對國內階級衝突強度超過閾值的情況進行預警
國內階級衝突強度超過閾值(如≥40/100)時
STAT
回合狀態提交接口
國家AI
中央協調AI
國家AI在每回合結束時提交國家狀態
每回合結束時
FB
世界觀校驗反饋接口
中央協調 AI
發出校驗請求的主體
中央協調 AI 對世界觀校驗請求作出回應
中央協調 AI 對世界觀校驗請求作出回應時
CFM
玩家指令確認接口
國家 AI
玩家
國家 AI 生成任務推演結果後,需玩家確認是否執行
國家 AI 生成任務推演結果後
ARB
多國衝突仲裁接口
中央協調 AI
涉及衝突的國家
中央協調 AI 對多國指令矛盾生成解決方案
多國指令矛盾(如領土爭端)時
CAL
世界日曆發佈接口
中央協調 AI
各國家AI
發佈本回合全局狀態
中央協調AI在每回合開始前發佈
DYF
動態探索反饋
國家AI
玩家
向玩家反饋探索結果,並請玩家決策
玩家發佈探索命令時觸發

超長處理

即便遊戲數據處理工作已經被分攤至十餘個不同的AI,但截至目前仍發生了兩次AI提示對話超長的現象,因此我選擇要求AI按需輸出國家推演信息(按照模板要求輸出),並據此重新打開一個對話框遷移前期推演結果。
——記得嗎?無論如何巧言修飾,這本質上是一個基於文字的桌面遊戲。
當然,無論怎麼設計國家推演信息,都存在缺漏,但只要識別了希望讓AI推演的重點,就可以把事情做起來,後面無非糾正偏離而已。

AI推演過程覆盤

基於豆包的推演(V1.0)

這個腦洞剛開的時候,deepseek還沒有破圈,作為一個首次玩AI的人,我也沒有對所有大模型做個調研,草草選擇了豆包AI後,就直接開始了遊戲,以下就是遊戲的起點:
“我希望和你共同配合,進行一次架空世界的國家模擬推演遊戲”

班味兒

總的來說,豆包能夠完成任務,但也僅限於完成任務。這個特點的優勢在於,豆包不會動不動就擅自創造稀奇古怪的玩意,劣勢則在於,豆包的推演結果充斥著一股子“班味”,說直白一點,能感到AI的糊弄和應付。具體表現在:
  1. 難以定量:豆包對國家的推演一般只能到定性層面,一旦具體到定量就會出現各種啼笑皆非的問題。
  2. 過於全面:面對玩家提出的任何要求,豆包都會全面的給出好的方面與不好的方面,但他只注重全面與否,而不會考慮這個問題的實際情況,換句話說,一直在和稀泥。
  3. 無法對抗:當和稀泥這種特質發展到對抗場景時,問題就更大了,例如外交接觸、交戰等情況,他會和玩家不斷地說轉圈話,但是不實質性推演進程。

不識數

豆包的計算能力成謎,偶爾他會給出正確結果,但有時卻會莫名其妙的翻車,例如:
當我要求豆包計算糧食產出時,他告訴我“200000×180 = 3600000 公斤 = 3600 噸”
我們在檢查數據時發現了這個問題,於是反問豆包“是否計算錯誤,應為36000噸?即3.6萬噸?”
豆包振振有詞:“200000×180=3600000公斤,因為1噸等於1000公斤,將公斤換算為噸,3600000÷1000=3600噸,這個計算是正確的,不應為36000噸(即3.6萬噸)。按照數學運算規則,原計算過程在乘法與單位換算上都沒有差錯,結果準確無誤。若你對類似的基礎運算還有疑問,或者涉及更多複雜的數量關係需要核對,隨時來找我就行。”
經過四五輪討論後,我只能直球告訴豆包:“20萬乘180(公斤)應為36000噸”,才最終完成糾偏。

忘性大

我對推演的核心要求其實是前後邏輯一致,而非巧妙地推演局勢變化。但這是豆包最大的問題,他記不住東西:
例如,我會為每個國家生成一套國家推演信息,其中記錄了玩家關心的國家設定。這套國家推演信息是每個國家AI的數據基座。而豆包在經過十次左右的對話後就會忘記前面的國家推演信息,就完全遺忘前面的內容,甚至存在上面剛強調過,下一次對話就想不起來的問題。逼得我不停地用“如果你不知道xxx,向我詢問”這樣的額外提示詞約束他的推演行為。

優點

作為一個多模態語言大模型,豆包還是有自己的獨有優勢,這一點連deepseek都沒有:識圖
豆包能夠識別上傳的圖片信息,不是deepseek那種只認識字符的形式,而是能夠識別圖中的各類信息,例如我給豆包上傳的推演遊戲世界地圖,豆包能夠根據圖中的色塊劃分大致識別出行政區劃。甚至能夠根據我對地圖的定義,進行一些更深入的理解。
事實上這位我節省了不少時間,因為涉及國與國之間交互的推演時,要求AI理解地圖就成為了必不可少的步驟。相比於手敲地圖信息,直接把地圖甩給AI會方便不少。

基於deepseek的推演(V2.0)

相比於豆包,deepseek增色不少,最主要的特點是,他聽得懂人話了。
具體來說,使用豆包推演時,我需要不停地糾正偏離,以避免文藝範、忘性、算錯了或者其他奇奇怪怪的問題,而deepseek至少能夠正兒八經的回答我的問題。
那麼,我們來看看deepseek自己對推演的總結吧:

1. 推演亮點

多線程並行推演
  • 成功協調多國指令,確保各大陸動態平衡(如金之心鹽業壟斷影響、克尼傭兵制改革)。
  • 跨大陸連鎖反應模擬到位(如瀛臺-萬靈島技術交流引發奪心魔關注)。
世界觀一致性維護
  • 嚴格遵循神術體系設定(如拉依法通訊神術綁定沃夫雷恩信仰)。
  • 及時修正偏離(如刪除火藥設定、調整矮人王國相關錯誤)。
衝突檢測與解決方案
  • 生成概率分支選項(如克尼議會改革派與保守派衝突的三種走向)。
  • 提供可視化影響鏈(如神廟建設引發的經濟與宗教雙重效應)。

2. 存在問題

⚠️ 指令覆蓋不全
  • 初期遺漏天一神廟建設指令,後期補推演導致邏輯鏈延遲閉合。
  • 託管國家被動響應機制未充分模擬(如碧海聯邦的警惕行為推演較晚)。
⚠️ 預設偏差風險
  • 曾誤植銀月教會、矮人王國等非設定內容(需加強背景校驗)。
  • 部分國家政體假設過度(如初期誤判克尼存在王室軍隊)。
⚠️ 交互協議效率
  • 複雜指令拆解時出現混淆(如瀛臺對拉依法/萬靈島合作指令合併處理)。
  • 未及時提示玩家確認關鍵節點(如神廟建設引發的宗教衝突閾值)。
發現問題了嗎?
幻覺,特別是r1的幻覺問題,這個現在已經被普遍討論過了,我不予置評,但需要指出一點,在25年3月v3更新之前,v3和r1存在非常矛盾的制衡:v3推演太乾,r1推演太飄。
特別是如果使用非官網的deepseek,那就更不知道會飄到哪裡去了。

3.真正的大問題

“服務器繁忙,請稍後再試。”
我覺得這個問題應該是所有試圖使用deepseek的人都會撞上的,簡單來講,十餘個國家,外加兩個統籌AI,直接導致我這裡使用deepseek大量碰壁,乃至時不時被禁言若干分鐘。
如何解決呢?
請看下節分解。

基於deepseek的分佈式推演(V3.0)

所謂分佈式推演,無非是將計算負擔推給玩家的好聽說法。
當我苦於無法輸出推演結果時,玩家也苦於遊戲進度過慢的問題。
於是我開始搞起了分佈式推演:形成一套統一的國家推演規則,使AI讀取後能夠直接據此啟動推演,各國之間的差別無非是加載的國家推演信息不同罷了,也就是:
《三方世界玩家手冊》:https://www.goddessfantasy.net/bbs/index.php?topic=157970.0
這個玩法有很大的優勢:玩家能夠親自上手調教自己的國家了,沒了我這個中間商,很多命令執行起來效率更高,也更貼合玩家意圖(在他們不懈的糾偏下)。
問題同樣也很大:玩家彙總僅約1/2選擇了部署自己的國家推演AI,其餘玩家因為時間精力等顧慮,仍選擇在我處進行代管推演,而上面的有劣勢導向了最終問題。

遊戲終章

石書紀念並沒有持續很久,我們從石書六年開始遊戲,終結於石書十一年開始前,五個回合,世界剛剛開始發展,遊戲已經停滯了。
分析下來有幾個原因:
  1. 我們都是中年人了
  2. 即便是deepseek,仍然不能很好的理解和執行架空世界推演這一重任
  3. 分佈式推演後,AI之間採用標準接口互相傳遞信息,使人的操作便宜性和趣味性都下降了
  4. 玩家之間的衝突逐步演化,對沖突裁決的認可程度逐步下降
  5. 此外還有很多遊戲機制上大大小小的問題,不在此一一贅述。
雖然這個遊戲已經停滯了,但是短短5個回合,數個月的遊戲過程給拜倫斯世界注入了一個又一個新的思潮和靈感,在此感謝所有玩家。

© 2022 3樓貓 站點地圖 購買域名:asmrly666@gmail.com