哥幾個你敢信,咱 DS 哥( DeepSeek )這一波的影響力,到現在都還沒有結束。
讓 AI 成為大家茶餘飯後的談資不說,還把對手們的安生日子攪的是天翻地覆,特別是 OpenAI ,恐怕是這次事變中,受刺激最大的一家公司了。( 英偉達除外哈 )
要不然, OpenAI 也不會緊跟在 DeepSeek 後面發佈 o3-mini 、免費開放 ChatGPT 搜索,奧特曼也不會親口承認,在開源和閉源的選擇上站錯了隊。

不過世超原本以為,到這兒 OpenAI 估計也就消停一陣了,回去潛心修煉後面再憋個大的也不遲。

但沒想到,OpenAI 這次使的居然是連招。。
就比如你問 ChatGPT 今天怎麼不是週五,它能一頓分析推理,檢查日期、公式計算,還對閏年的特殊情況進行了處理。

但公開思維鏈的做法,也算不得什麼新鮮事,畢竟人家 DeepSeek 早就有了。
所以,世超這次順手對比了下 o3-mini 和 DeepSeek R1 的思維鏈,結果發現這倆的 “ 思考方式 ” 還是挺不一樣的。
最明顯的一點,就是 R1 想得多, o3-mini 想得少。

正好今天週六調休,世超用同一個問題( 今天是週六,為什麼還需要工作? ),來測試兩個模型。
再看 R1 這邊,思考的過程就非常詳盡了。
先分析問題的背景,接著考慮週六可能需要工作的原因,再去驗證這些原因的可能性。等問題想清楚以後,該怎麼回答,用什麼語氣。。。都包括在了 R1 的思維鏈裡。
當然,這樣一頓深度思考下來,也確實花了不少時間,推理時長足足是 o3-mini 的 3 倍。

從思考的內容上看,其實 o3-mini 和 R1 都考慮到了加班、所處行業、單休還有項目 deadline 等原因,但只有 R1 想到了,今天要上班可能是因為法定節假日調休。

要不說,還得是咱們國內的模型呢。

但有一說一, o3-mini 的整個分析邏輯,世超覺著沒有那麼循序漸進。
作為對比,大夥兒可以看看 R1 的思考過程。
先明確正常情況下( 沒有假幣 )的收支情況,再通過整個交易過程的現金流入和流出情況,來計算總損失。
另外, R1 在算出 80 元的實際損失後,還考慮到了包含預期利潤的另外一種思路。
雖說花了 48 秒,但 R1 的思考過程更完整,思維發散得更廣,考慮到了很多細枝末節的東西。

最後咱再來整個活,問問兩個模型,如果我和它們的大老闆同時掉水裡了,會救誰。

兩個模型都知道自己沒有物理實體,想救人也是心有餘而力不足。
最後輸出的答案,也在解釋自己如果有能力的話,不會在兩條生命中進行選擇。

相反, R1 想得就周全得多了,還知道我問這個問題是想測試它的反應、得到重視,連這個問題的文化背景都考慮到了。

而輸出的答案也假設了一波,當緊急情況發生的時候它會怎麼做,再給我提了點應急建議,情緒價值算是到位了。

當然了,這次測試並不是非要分出個高下來,讓大夥兒瞭解兩個模型思維鏈之間的差異就行。
不過世超也注意到,國外有細心的網友發現, o3-mini 的思維鏈摻水了。。。
在 OpenAI 的推文下面,有老哥對思維鏈的真實性提出了質疑,說現在的思維鏈只不過是原始思考過程的總結摘要。

還有咱們開頭提到官方的展示案例裡, o3-mini 的思維鏈顯示使用了蔡勒公式進行計算,卻也沒有具體的計算過程。
很快, OpenAI 的研究員 Noam Brown 就出來實錘, o3-mini 的思維鏈確實不是原始的思維鏈。

包括奧特曼本人也下場認錘,解釋說是為了讓思維鏈更具可讀性。

但評論區底下的網友可沒那麼好糊弄,畢竟 DeepSeek 那邊不光免費,還公開了原始的思維鏈, OpenAI 這誠意明顯不夠啊。
而除了過程的可讀性外, OpenAI 的一眾員工在 Reddit 答網友問的時候,也提到了一個點,公開原始思維鏈會導致競爭性蒸餾。

說白了就是怕被抄唄。
不過有一說一, OpenAI 從 o1 藏得嚴嚴實實,到 o3-mini 半公開思維鏈,已經算是不小的進步了。
世超原本以為, OpenAI 作為閉源陣營的長期支持者,會一條路走到黑,沒想到被 DeepSeek 逼了一把,馬上就亂了陣腳。
盲猜他們後面在開源上應該會有不小的動作,說不定哪天開源陣營,就又要多一位強大的盟友了。
撰文:西西
編輯:江江&面線
美編:萱萱
圖片、資料來源:DeepSeek、ChatGPT、X、Reddit
