Lingsing 2024.10.22
這次寒冷抑制的perk組合概率遭到了非常多人的質疑,我也不例外。RNG在許多遊戲中都是一個被玩家相當看重但對於具體細節卻又模糊不清的東西,在多數時候它會直接與玩家的遊戲利益相關。在看完事件始末之後我也是與PVE podcast的一些佬們有過些微交流,那麼作為一個數據愛好者,在下不才,願分享我的一些拙思。
觀前聲明:本人不對“棒雞是否調整了部分perk組合的出率”這個論題發表任何的看法,僅是對本次事件中所提出的概率統計能否支持“棒雞修改了概率”這個假設進行儘量客觀公正的評判。還望讀者在讀完這篇文章之後不要在評論區大打出手,和平且理性的討論才是最好的。
一、推特Spark的統計
Spark的統計犯了一個很嚴重的問題。對於一個大規模的數據集,當我們想要獲取其中某一個/幾個數據的近似頻率時,抽樣調查是一個很好的手段。但若要抽樣中數據頻率能夠反映總數據集中數據的頻率,那麼需要滿足幾個條件:
隨機抽樣:該樣本應當是儘可能地從數據集中隨機抽取數據組成的。
樣本大小:樣本應當足夠大以保證頻率估計的準確性,一個太小的樣本很容易導致結果的不可靠。
樣本獨立性:樣本中的數據點應當互相獨立。一個數據點間具有強相關的樣本很可能不能反映數據集的真實特徵。
無偏估計:抽樣的方式不應當對某一種數據具有偏向性。該條不只是指選擇數據的過程,也是指收集數據的過程(如問卷調查的題目等)不應該出現偏倚。
而Spark的數據是這麼收集的:他找到了幾位刷了非常多把(通常都在200把以上)並且尚未出貨的玩家,統計他們的總把數,並對其進行統計分析。這很顯然嚴重違反了無偏以及隨機抽樣的條件,因而以這個抽樣做出的概率統計是無法反映總數據集的情況的。
如果使用這樣子的數據收集方法,我不僅能證明老一榴彈嫉妒誘導的出貨率低於1/216,我甚至能證明這個概率低於1/324(此時3901次不出貨的概率為5.79*10^(-4)%=0.000579%,約17.3W條世界線中出現一條)。更進一步的,只要我找到足夠多刷了沒有出的數據,我可以證明這個概率低於任意值。
這就好像我現在有5000顆質地均勻的骰子,我把每個骰子投20次,從這5000顆骰子裡找出了50顆骰子,他們在這20次中一次都沒有投到6(20次不出6概率約為2.61%,比方舟無水位單抽出金的概率要高那麼一點)。而5000顆骰子裡有至少50顆骰子20次不出6的概率近似為99.99999999995183%。
該例的概率計算,其中不少於50個骰子的概率將二項分佈近似為正態分佈
然後我說根據這個抽樣,可以證明骰子骰出6的概率遠小於1/6,因為50顆骰子骰20次共1000次不出6的概率是6.59*10^(-78)%,幾乎不可能,這顯然是荒謬的。
二、light.gg的數據統計
除了Spark的這份統計之外,我也看到拿出light.gg數據的帖子。light.gg約有21.71W的數據,其中嫉妒誘導(哎我說嫉妒軍械庫和嫉妒刺客都簡寫嫉妒疑似有點容易搞混了)的概率不在前八之內,而反觀賽季榴彈則以9.63%居於榜首。
light.gg所統計的數據是玩家所留存的武器,那麼嫉妒誘導就應該因玩家篩選而擁有額外高的頻率,就像賽季榴彈那樣,而不應該連前八都進不了,畢竟嫉妒誘導是公認的gr——但果真如此嗎?玩家偏好留存是一個主觀的行為,可能有人認為已經有賽季榴彈了,這把榴彈不必要再留一個相同perk組的;可能有人認為相比嫉妒誘導,級聯點誘導更具優勢;可能有人認為速射榴彈輸出不如適配,留一點清怪的就行;也可能還沒仔細看嫉妒軍械庫的效果,認為這個perk效果並不如其他的好。社交媒體中大部分玩家公認的gr並不一定就被所有玩家接受,除了有自己理解的人群外,也有許多不怎麼關注社交媒體的玩家。因此我們很難非常肯定的下結論,絕大多數玩家在獲取到嫉妒誘導時都會將其保留下來。
那麼綜上所述,light.gg是否滿足抽樣的幾個條件呢?答案是不滿足的,從玩家篩選留存中選出的樣本顯然不符合無偏估計的要求。那麼我們能否從這個數據中得到有效的結論?也不一定。首先我們不能保證嫉妒誘導一定是留存率高的那個,如上所述。其次light.gg使用API查詢玩家的倉庫與揹包進行統計,但前提是玩家需要在官網的賬戶設置-隱私中勾選“顯示我的非裝備物品欄”,light.gg只能查詢到約10%玩家的數據。而這(無論出於什麼原因)開放API給light.gg的玩家,也不一定就能認為這部分玩家能夠代表整體。
有人可能會說:放屁!大夥都公認的gr,留存率肯定高,10%玩家中這頻率這麼低顯然就是有問題還有什麼好洗的?
但我們在使用統計學的方法來求證它是否真的調整了概率,使用科學的方法自然需要科學的分析。那麼light.gg的數據在統計學上可以得到顯著有效的結論嗎?不是很能,因為它的數據樣本具有不低的有偏可能性。它無法支持沒有調整概率,也不能明確地支持調整了概率。對於這樣的數據,最好的方案是——棄用,不使用這一份數據進行任何分析。
三、如何求證概率是否真的被調整?
我們需要更原始,更好的數據樣本。最好的辦法就是建一個數據庫或者共享文檔之類的,所有人每出一把榴彈就向庫中加入一條數據,收集到足夠量,然後對這一份樣本進行分析,這99%能夠得出正確的結論(只要沒有人故意搗亂)。
四、結論與雜談
總的來說,我並不認為現有的數據樣本非常確鑿地證明了棒雞調整了組合的掉落概率,只能說我們可以有所懷疑,但不可以已經實錘的角度對其發表意見。
那麼棒雞有沒有用過pRNG的手段?答案是有的!棒雞確實在護甲的屬性隨機上動過一個手腳。在高屬性護甲的隨機器中,棒雞在護甲第二條和第四條屬性組的隨機表中多插入了一組(1,1,11),以略微提高護甲出現極限屬性分佈的情況。
其實統計學有很多反直覺的東西,有些“體感”可能與真實情況大相徑庭。比如我看到的一個450把老一沒出嫉妒誘導,看上去好像非常的不合理,都這麼多把了怎麼還不出呢?但按照均勻分佈(也即出率1/216),這種情況的發生概率為約12.39%,這可比二遊抽卡的概率高多了,平均每8-9個人裡就會有這麼一個眉筆(無意冒犯)。
五、結束語
非常感謝各位讀者能夠看到這裡,這篇文章省去了多數的公式,並且主要是文字分析,希望讀者們沒有感到太過於乏味。如果有什麼謬誤,還望各位讀者能夠在評論區斧正;有更多不同的觀點與意見,也歡迎在評論區發表並理性進行討論。
該文章基於CC BY-SA 4.0協議共享。