聊聊職業國際象棋水平是怎麼衡量的


3樓貓 發佈時間:2022-03-12 13:22:11 作者:貓毛卯茂 Language

想象一下你過年回家,七大姑八大姨很仁慈沒有問經典問題。聊到最近玩兒什麼的時候你說國際象棋。哦?下棋?你下的怎麼樣?
請作答。
如果他們一點不懂國際象棋,你的回答可能是跟隔壁工位的誰誰五五開,下不過庫管大爺,曾經血洗小學象棋班。
如果他們稍微瞭解一點,你的回答可能是絕對沒到特級大師和國際大師的水平,跟棋聯大師下過幾盤輸多贏少,和候選大師互有勝負。
而如果他們也玩兒,你的回答可能就是個數,1764(42*42)。
可見回答是隨著談話者對這個遊戲瞭解的水平逐步深入的。但想講清楚這個事兒,順序的反著來。

天國的階梯

作答中最後的那個數字有個名字,Elo。它是天梯匹配機制的基礎,當今很多線上對戰類遊戲,以及相當多的體育賽事都用這個算法作為基礎制定匹配機制。
該計數法由物理學家阿帕德·伊洛(Arpad Elo)開創,它由兩個主要公式組成。細看公式之前我們先談一下這兩個公式的分工。第一個公式負責給每對選手設置一個獲勝的預期值,該預期值由雙方的分數差距作為變量計算。第二個公式負責根據對弈結果給兩位選手的分數作調整。
阿帕德·伊洛,本文中談到其人時會稱伊洛,談賦分系統時稱Elo

阿帕德·伊洛,本文中談到其人時會稱伊洛,談賦分系統時稱Elo

而既然是分數調整系統,那就有個先有雞還是先有蛋的問題。我要開發一個賦分系統,但這個系統首先需要兩個棋手有分數才能計算,怎麼辦?各位如果前往國際象棋對戰網站(主流的Lichess 或 chess.com)上註冊一個新號,會發現自己的所有賽制分數起始都是1000,隨著對戰數增多,分數逐漸上升或下調到相對準確的水平。國際棋聯最初預計俱樂部棋手的平均水平是1500,而這個1500分的平均,並不只是多個棋手分數的平均,同時也表示一個棋手當天發揮水平的平均。也許今天文章入精選了開心,發揮出了1550的實力;又或許明天評論區爆了特鬱悶,只能發揮1450的實力。但不管怎麼樣,他平均水平是1500。順帶一提,評分的最低分是100,因此就算我想整活,也沒法把自己偽裝成戰鬥力只有5的渣。
我們已知卡斯帕羅夫比庫管大爺強,庫管大爺比剛註冊的阿偉強,阿偉比幼兒園象棋班的孩子強。我們先大致給他們賦分,然後根據結果進行調整。當然,首先樣本不會這麼少;其次預計賦分不會這麼隨便,還是會根據1000~1500作為平均人水平;最後更不可能真的叫來上到卡斯帕羅夫下到黃口小兒的棋手來對弈觀察。
當我們把兩個棋手的分數差和他們的預計結果投入正態分佈函數中,則在以10為底時,生成如下圖形。
BMP手動作圖見諒

BMP手動作圖見諒

可以看出,90%的情況下,差異越大,分數高者獲勝預期越大,並在差異達到400的時候最大。請注意這條曲線本身是雙方差異的絕對值,因此0左邊的部分並不是分數低於對手,而是在分數差距比較小的情況下有一定概率分數高者也會吃癟。而由於這個差異圖形是一個對稱的大鐘型,因此從0點所在的分數差異開始,分數高者吃雞和吃癟的概率是各佔50%的。
在伊洛的計算中,分數相差200的棋手,其獲勝預期為75%。這個75%很精髓,它作為預期是一個單純的數,而不是“是”或“否”。國際象棋賽制中,獲勝得1點,平局各得0.5點,輸棋不得點,則這個75%可以表示一個棋手75%勝利,0平0負。也可以表示50%的勝利,50%的平(即0.25)和0負。因此他不是絕對的你一定贏比其他結局多的概念。這裡理解成75%是多種情況的數字體現就好了。此處可能產生一個誤會,賽制得點和我們今天介紹的Elo分數並不是一樣,本文中將比賽結果得分以“點”稱呼。
有a、b兩位棋手,E表示預計得分,R表示分數,R’表示變化後的分數,S表示得分,K是一個常數,^表示次方。手頭沒有公式軟件,對Excel式公式深感抱歉。
如果你上網搜Elo,就會得到這麼個公式。看起來是統計函數,它是將上面Elo 預估90%情況下天梯分數差別400時預計勝利倍數最大這句話轉換成公式:
Ea=[10^(Rb-Ra)/400]xEb
一場比賽中雙方點數的和總是1,也就是100%。因此乙方獲勝的預計Eb與甲方獲勝預計Ea的和是1。Ea+Eb=1,上式中的Eb=(1-Ea),公式可以簡化為:
Ea=1/[1+10^(Rb—Ra)/400]
也就是剛才找到的公式。至此,選手a獲勝的概率可以依靠雙方的天梯分數做出預估。接下來,我們可以將這個預期帶入第二個公式,該公式的功能是根據棋手的每場比賽結果進行調整。首先我們看一下公式:
R’a=Ra+K*(Sa-Ea)
棋手a分數的變化是他原本的分數加上他們實際的點與預期的點的差與係數K的乘積。這裡的K是一個人為設置的係數,它限制了每場比賽之後選手分數變化的最大值。國際棋聯將這個係數定為32(不是42差評!)。
關我屁事

關我屁事

光看公式還是一頭霧水,我們看個例子。比如每次都能把我們的臉按在地上摩擦的庫管大爺有幸和侯逸凡(目前Elo 2650)來一場比賽,在此之前我們教大爺在電腦上下棋,發現大爺的戰鬥力居然高達2400。那麼,大爺對侯逸凡的獲勝預計是
1/[1+10^(2650-2400)/400]=0.19
毫無勝算,然而當天我們給大爺進貢了一瓶牛二,大爺有如神助,居然贏了侯逸凡得1點,那麼大爺的分數變化如下:
2400+32*(1-0.19)=2426
分數需要四捨五入到整數,大爺憑此一戰狂攬26分。而侯逸凡呢?我們已知大爺的獲勝預期為0.19,則侯逸凡的預期為0.81。此戰倉庫裡翻船得0點,她的分數會下降:
2650+32*(0-0.81)=2624
侯選手丟掉26分。分數變化是一樣的,數學路徑是一樣的嘛,想引起注意的是兩者計算時分數和的點數與獲勝預期的計算方法。
然而大爺有生之年終於棋逢對手,一定要侯逸凡再來一局。對方欣然應允。然而第一局耗費了一定時間之後,牛二的Buff有所削弱,第二局雙方戰成平手,則我們快速算一下大爺的分數變化。首先大爺的勝利預期有所變化:
1/[1+10^(2624-2426)/400]=0.24
雙方戰成平手,大爺的分數變化有:
2426+32*(0.5-0.24)=2434
即便是平局,大爺仍然可以從大師身上拿到8分,因為對方差異是在是太大了。
至此,大家應該對這個計算有一定了解了。但是為了說明Elo的特性,我們還要把時間往回調。賣給我們牛二的無良商家給了我們假酒,大爺即上頭又上火,輸了第一局。我們已經知道獲勝預期是0.19,大爺輸了的變化是:
2400+32*(0-0.19)=2394
大爺與高手過招雖敗猶榮,只損失6分。這就是Elo 系統的好處,選手的分數動態變化與其對手的水平相關。首先作為匹配機制,你的對手和你不會有太大的差別,否則一方的獲勝預期過低。而想要上分的選手無法通過加好友炸魚塘來獲得大量分數,因為自己的獲勝預期越高,勝利之後得到的分數越低。

小光3000分速通,速通玩家都要開小號,不僅是因為有看點,更是因為一個高分號想要薅羊毛很慢。

所以炸魚塘通常是娛樂和教學。

小光3000分速通,速通玩家都要開小號,不僅是因為有看點,更是因為一個高分號想要薅羊毛很慢。

所以炸魚塘通常是娛樂和教學。

小光3000分速通,速通玩家都要開小號,不僅是因為有看點,更是因為一個高分號想要薅羊毛很慢。

1 / 2
我記得MCAT-oncle的遊戲開發分享裡有相關內容,但寫文章的時候找了一下沒找到,很可能在數學和線性那些大系列中。大家可以前去搜索,非常值得關注的寶藏機友
是不是有一點終於弄懂了 Elo 系統的感覺了?有些玩家興奮地在chess.com或者lichess上來一盤,照著這個公式算了一下積分,然後發現分數不一樣。這是因為雖然 Elo 系統被廣泛應用在包括國際棋聯在內的多個主辦方實體,chess.com卻覺得它過於簡單。當然,作為一個成功的商業實體,chess.com面對的棋手從數量到質量再到動機都比棋聯這種目的較為單一的主辦方複雜得多。他們使用的是一套 Elo 的超魔改mod,叫做Glicko的系統。
Glicko系統的發明人是馬克·格里克曼(Glickman)。與Elo 系統一樣,該系統也被大量運用到電子遊戲匹配當中,《反恐精英:全球攻勢》,《Splatoon 2》等都採用這個方式。Glicko 系統的基本思路和Elo 系統是相似的,但其中引入了一個新的概念,分差(Rating Deviation),一個賦分的標準差。比如我們上面提到一個棋手高興或者不高興可能會導致當天棋力比平時高或低出50分,這50分就是賦分標準差,連續兩天波動最多形成一上一下兩個標準差的和100分。
RD表示分差,RD’表示新的分差,min表示最小值,t表示本次比賽與上次之間間隔的時間,c表示一個棋手因為停止下棋,其分差迴歸到不確定所需要的特定時間週期,√表示根號,根號內的內容在()中表示。m表示的是比賽的數量。
Glicko的計算分三步。首先確認分差,然後調整分數,最後調整分差。先看一下第一步的公式:
RD’=min(√(RD^2+c^2t),350)
看了防劇透也還有未知信息。這個350指的是由於一位棋手水平未知,我們先假定他的分差是350分(!!!)。這個公式就是一個新手剛上來打幾盤,分差在他的上一盤分差一通操作之後與350之間取最小值。
那我剛上來,這個RD怎麼來呢?有一個默認數,我們按50算吧。那c呢?我們為了推導需要知道t,這個只要看你上一把啥時候打的就行。哦你是新人,那我們按100天算。由於c的定義是棋手停手後迴歸到分差為350時的空窗期,我們可以把上面的公式反過來:
350=√(50^2+100c^2),求c
C=√((350^2-50^2)/100)=35
知道了分差,接下來我們看調整天梯分數的第二個公式:

d^2

公式2

g

E

d^2

公式2

g

E

d^2

1 / 4
r表示新天梯分數,r0表示舊分數。與r’和r一致。m表示的是比賽的數量。ri和RDi分別表示的是對方的分數和分差,si表示的是比賽結果,仍舊是勝1平0.5負0。E為自然常數。q=ln(10)/400
……我就不上手算了……將m把遊戲後獲勝預計與實際結果的差與對方分差的加權的積合計後與考慮動態分差後形成的預計獲勝的加權,其結果是本次應產生的天梯分數變化。
很繞,而且這裡的分差不應該以單純數字理解。我們看到在這個公式裡,對方分差一直不斷變化加權,其原因是在這套體系中,分差的概念是一個棋手真正實力的範圍,而不是平均值。而公式只看比賽數量和對手基本分數、分差。
最後一步調整棋手本身的分差:
RD’=√((1/RD^2+1/d^2)^-1)
好難啊,交給計算機算吧。這個系統還有-2型號哦,是原型號的另一個版本,這裡就不再冗述了。我們可以看到Glicko系統的好處是他將棋手水平的浮動考慮進來了。並且因為不是所有玩家都像專業棋手一樣每天對弈,他也考慮到了棋手對遊戲生疏後對分差,也就是水平範圍的影響。
不難看出它在電子遊戲和對弈網站上受青睞的原因。試想一下,你有沒有過這樣的經歷:一個遊戲打了一段時間很厲害,各種原因放下幾天有點生疏,但回來第一場對戰似乎也還行,沒有想象中被血虐。就是因為在這個算法中,由於大數據分析 c 是預知的,而你上一次進入遊戲的時間 t 以及你水平飄忽程度RD都是已知的,對戰平臺可以算出你現在的水平大概可以和誰對戰。
有了這個認識,下次在大廳裡等待匹配的時候可以稍微耐心一點,後臺正在努力計算誰配得上和你牽手。辛苦伺服器了。
然而就像早年間回力鞋就是帆布的代名詞一樣,雖然我們網上對戰用的是Glicko系統,但炫耀吹牛的時候還是會習慣性地說Elo,或者我在哪兒哪兒哪兒的Elo是多少什麼的。也不必太較真,Elo 發音多簡單,而且畢竟是鼻祖,非常婆羅門。真要較真的話,首先因為棋聯的Elo選手和網站選手並不一定重合,沒有爭吵的必要。這次安排用Glicko的關公對戰Elo排名的秦瓊,必然是不會在真實世界中發生的。其次Elo 或者 Glicko 分本身就是一個區間的平均值或範圍加權值,若兩人真的同在一個池子裡,Elo 2000 和 2010 鹿死誰手還未可知。以及最後,Elo 和Glicko 可以粗略轉換,但也沒有必要。
伊洛的這個劃時代的發明出自1960年,於是就有了一個問題。這之前的國際象棋大師們過年回家都怎麼炫耀自己多牛嗶呢?現在我們經常看到文章視頻介紹以前人物的時候他們還都有Elo評分,但那都是後人預估的。實際上在Elo之前,各地棋聯就已經開始使用評分系統。只是這些系統很少實現大一統,且多半有人為的硬性數據設計。比如哈肯尼斯系統中得點超過50%則超出部分衰減10%。
1933年是大型聯合主體最早使用數據排名的年份,美國棋聯採用了舒爾特計分法。沒找到相關介紹。這個計分法並不是在33年才出現,而是在此之前只在俱樂部小範圍使用。而在此之前,棋手們就只能根據名聲,偶爾見到的棋譜,以及去各個俱樂部裡瞻仰其中的名人堂來了解各位的水平。
比如頭圖中是《第七封印》中騎士安東尼烏斯和死神猜棋子決定黑白的鏡頭。當時死神正要帶他上路,安東尼烏斯聽說死神是個國際象棋高手,於是提出象棋決鬥。如果自己能贏,死神就得放過他。想想還挺浪漫的。這要是兩者都在棋聯註冊過,各自一報Elo,安東尼烏斯就要直接被帶走。開始嫌棄Elo 了。

你算老幾?我特級大師。

不玩兒國際象棋的人多少也會對一些大師有所耳聞:鮑比費舍爾,保羅墨菲,卡爾波夫,卡斯帕羅夫,各個兒特級大師。最不濟也知道劉適蘭——我國第一個女子特級大師,跟深藍的二回戰劍走偏鋒,如子面意義上把深藍給整不會了(眾說紛紜)。

劉適蘭,我國的第一個女子特級大師,並且也是亞洲第一個女子特級大師。其他神童12歲拿到特級大師,劉老師12歲才第一次碰國際象棋。是努力方面的天才。

保羅·墨菲,傳奇棋手,六邊形戰士。棋力遠超同時代的其他棋手。

鮑比·費舍爾,不但棋下的好,不少現代化規則的創新都有他的影子。大概算是第一個現代意義上的偶像。

卡斯帕羅夫,家喻戶曉、婦孺皆知。在我國更算得上是國際象棋的代言人。

卡爾波夫,自帶BGM的男人。恩怨情仇幾多輪,至今都是標杆。

馬格努斯·卡爾森,目前的世界第一。他有多強呢?13歲的時候有機會和卡斯帕羅夫對弈,對方特意遲到(眾說紛紜)。

丁立人,新六邊形戰士,下一個世界第一。非常不喜歡拋頭露面,隱修士一般。

侯逸凡,巾幗不讓鬚眉的典範,對陣特級大師也是砍瓜切菜。跟大爺對弈您辛苦。

劉適蘭,我國的第一個女子特級大師,並且也是亞洲第一個女子特級大師。其他神童12歲拿到特級大師,劉老師12歲才第一次碰國際象棋。是努力方面的天才。

保羅·墨菲,傳奇棋手,六邊形戰士。棋力遠超同時代的其他棋手。

鮑比·費舍爾,不但棋下的好,不少現代化規則的創新都有他的影子。大概算是第一個現代意義上的偶像。

卡斯帕羅夫,家喻戶曉、婦孺皆知。在我國更算得上是國際象棋的代言人。

卡爾波夫,自帶BGM的男人。恩怨情仇幾多輪,至今都是標杆。

馬格努斯·卡爾森,目前的世界第一。他有多強呢?13歲的時候有機會和卡斯帕羅夫對弈,對方特意遲到(眾說紛紜)。

丁立人,新六邊形戰士,下一個世界第一。非常不喜歡拋頭露面,隱修士一般。

侯逸凡,巾幗不讓鬚眉的典範,對陣特級大師也是砍瓜切菜。跟大爺對弈您辛苦。

劉適蘭,我國的第一個女子特級大師,並且也是亞洲第一個女子特級大師。其他神童12歲拿到特級大師,劉老師12歲才第一次碰國際象棋。是努力方面的天才。

1 / 8
一眾大神
特級大師是一個終身稱號,除非利用這個身份招搖撞騙,下棋出千,會被除籍,否則一日為大師,終身牛嗶。那麼如何才能成為與鮑比費舍爾比肩的特級大師呢?首先,從睡夢中醒來。
你得經歷千錘百煉,天將降特級大師與斯人也,必先苦其心志,勞其筋骨,餓其體膚,行拂亂其所為,然後動心忍性,增益其所不能。直到你的Elo達到2500分。庫管大爺加油啊!
想要得到特級大師資格,就需要參加國際棋聯資格賽(Norm),賽事並不一定是專門設置的,任何國際棋聯舉辦或承認的比賽滿足資格賽要求都可以作數,有些資格賽會要求參賽者達到一定Elo。需要注意的是,我們現在提到的特級大師主要指的是國際棋聯的特級大師,世界上還有其他一些組織授予不同名號,此處暫且不表。這些賽事的要求有:
  • 至少三位來自不同主體(國家或地區)的特級大師參賽;
  • 賽制有九輪;
  • 時限至少120分鐘;
以及,
  • 現場必須有國際裁判。
通常參加過三場這樣的資格賽之後,該棋手需要滿足以下條件:
  • 國際象棋生涯中達到過2500分;
  • 對手中33%是特級大師;
  • 對手中50%有國際棋聯稱號(稍後介紹);
  • 對手平均Elo至少達到2380;
以及,
  • 得到足夠點數
實際上的條件要比上面的稍微複雜一點。
這個2500分,只要在象棋生涯中達到過2500即可。比如我們大爺,2400,資格賽期間上分到了2500,但之後輸了幾把又跌回2400了。沒關係,照樣有資格申請。
要求對手中50%有國際棋聯稱號,他們有特級大師,國際大師,棋聯大師和候選大師。在資格賽滿足相應條件後,選手需要的分數從特級大師的2500,逐級下調100分。同時,女選手有相應的女子資格,分數要求與男子組每級下調200分。獲得這些稱號的方式也是參加資格賽,但相應的,需要獲得特定點數的區間和對手水平比例也會有所下調。就不再冗述了。
最後兩個條件,對手平均Elo 2380 和得到足夠點數是一個大表格的簡單描述。由於我們上面介紹的Elo 天梯匹配系統,你更有可能和自己旗鼓相當的對手對戰,而不同水平的對手代表著獲勝難度和機會的不同。比如我們的庫管大爺參賽,對戰都是2380到2433這個區間的對手,那我們大爺的勝算還挺高的。以及又因為大家分數都差不多,勝勝負負不太能有突破這個區間的情況。根據棋聯的規定,在這個區間作戰的大爺需要獲得7個點。還記得之前的積分制度嗎?勝平負分別是1分,0.5分和0分。
也就是說,大爺需要在三場資格賽的27場對決中,在自己的Elo區間滿足對手有足夠數量的大師,還要得到7點積分。27的33%,要對陣9位特級大師;50%,要對陣14個經歷過資格賽拿到足夠點數的選手,新人凶多吉少啊。剩下最多13場,必須拿到至少一勝!因為湊夠7點積分如果一場沒贏,就需要有14場和棋……私下裡,棋手們都覺得想要成為特級大師,至少得贏過一位特級大師,這就使算著點數前進的棋手們壓力山大。
但這還有幾個問題。首先如果大爺一直在最低限度的區間對戰,很可能接觸不到指定數量,即33%的特級大師。其次如果大爺其中某場比賽Elo產生較大變化,不管是突破還是跌破,對應的點數積分和條件都有變化。此外你還不知道下一場對陣的是誰,因為大家的Elo都在變化。是對上一個風頭正勁的精神小夥,還是一個假酒剛醒的特級大師?命運多舛啊。
王之凝視

王之凝視

於是這裡介紹一下資格賽兩種形式。剛才一直在提得是公開賽。棋聯舉辦,來自五湖四海滿足條件者均可參賽,主辦方還會邀請大咖前來與民同樂。
而另一種是所謂的關門賽。不同區間的選手已經給你安排妥當,第幾輪對陣誰,用什麼顏色也都明明白白,區間裡的大師數量也給你準備好。基本就是挑戰資格的一個副本,套路已經備妥,就看你夠不夠格。當然,這種關門賽想要邀請大師,還要大師們按照副本boss區域來,那是要花銀子的。銀子從哪兒來?羊毛出在羊身上。
當然,這只是最常見的獲得稱號的辦法。如果機緣巧合之下,一個棋手居然在洲際冠軍賽中爆冷奪冠,或者在國際棋聯世界冠軍賽中打進前16強,或者在女子世界冠軍賽等可以直接獲得稱號的冠軍賽奪冠,那麼特級大師的稱號便會直接授予。但這得是什麼機緣啊!

臥虎藏龍

對於國際象棋棋手的實力,各位應該有了個籠統的瞭解。但這個實力畢竟只是個數字或者稱號,並不直觀。必須親自下場打上一段時間,才能發現大神何以為大神,你大爺憑啥還是你大爺。想想自己看大神們打《Quake》的視頻,大概可以類比看大師下棋的感嘆。
庫管大爺的實力我們已經見識到了,隔壁工位跟咱們只能算是臭味相投。而至於血洗小學象棋班,現在可能已經洗不動了。特級大師謝爾蓋,獲得稱號時12歲7個月。特級大師古喀什,獲得稱號時12歲7個月又17天,就是興趣班報晚了點兒。卜祥志和十幾年後的韋奕,兩位都是不到14歲就獲得特級大師稱號。
小神童們先姑且不表,庫管大爺可都是隱士高手,但大爺無他,唯手熟爾。我們總說人老了學不了新東西,但那些有閒情逸致又有業餘時間的大爺們,從籃球場到象棋盤,從KTV到詩朗誦,不斷刷新著我們的認知。
我們是不是也應該從中感應到什麼?有一天我看了個侯逸凡的訪談,被問到最近在看什麼劇,記得似乎說在看《實習醫生格雷》還是《傲骨賢妻》來著,總之就是和你我他一樣一樣的。但她同時也仍然在看國際象棋的書,而且似乎是重看。他們強大的原因也僅僅是對這個遊戲的熱愛和投入。而這份熱烈的感情是Elo 所不能計量的。
明年過年,你也許可以帶一套國際象棋回去。教教長輩、晚輩們怎麼玩兒。能不能玩兒下去先不談,總之給他們報個好。在這麼個紛亂迷醉的世界裡,我有一個熱愛的遊戲,並且想和你們分享。

© 2022 3樓貓 下載APP 站點地圖 廣告合作:asmrly666@gmail.com