讓Deepseek和GPT來一場PK


3樓貓 發佈時間:2025-02-15 14:15:33 作者:Firestar98k Language

都說Deepseek r1強於ChatGPT o1,總得有證據吧?

剛好今天我想起了12月餵給過GPT的問題

讓Deepseek和GPT來一場PK-第0張

某次作業第二題

我打算把這個問題也餵給Deepseek,看看怎麼個事🤓👆

順便說一些我作為一個數學專業的大一學生關於AI和數學的看法

(注:這題用的是一個基於Cantor-Lebesgue函數的經典構造,感興趣的盒友可以去知乎搜一下)

以下是ChatGPT方面的互動:(非數學專業的盒友可以忽略GPT的發言)

讓Deepseek和GPT來一場PK-第1張
讓Deepseek和GPT來一場PK-第2張
讓Deepseek和GPT來一場PK-第3張
讓Deepseek和GPT來一場PK-第4張
讓Deepseek和GPT來一場PK-第5張

固執是AI的天性嗎

GPT測試結論:對可測函數定義錯誤,且無法糾正,知錯不改,最終不知所云;思考時間少至幾秒,深度思考形同虛設


以下是Deepseek方面的互動:(非數學專業請繼續忽視ds消息)

讓Deepseek和GPT來一場PK-第6張

注意此圖倒數第二段

讓Deepseek和GPT來一場PK-第7張
讓Deepseek和GPT來一場PK-第8張
讓Deepseek和GPT來一場PK-第9張
讓Deepseek和GPT來一場PK-第10張
讓Deepseek和GPT來一場PK-第11張
讓Deepseek和GPT來一場PK-第12張
讓Deepseek和GPT來一場PK-第13張
讓Deepseek和GPT來一場PK-第14張

Deepseek的測試結果其實也不盡如人意,但有兩個亮點引起了我的關注:①Deepseek的思考過程中涉及了Cantor-Lebesgue函數(即它所說的Cantor函數),這是GPT全程都沒有提到的;②在前一次失敗的(我手欠輸錯題目的)測試中,Deepseek曾給出了x+g(x)取反函數的正確構造(可惜我手欠把記錄刪了)

這說明Deepseek對測度論至少有基本的涉獵(當然也有可能是訓練的時候不小心混進去了髒東西)


下面是我關於AI和數學的一些思考:

我一直在想一種可能:人類的自然語言在某種角度下可以被精準地數字化,這不是單純給字符編訂編碼的那種數字化,而是給每個詞義賦以某個值,使得每一個合理的句式和每一條合理的邏輯都能滿足特定的數學條件;

這就意味著,我們平時的言語並沒有完全符合這一套邏輯,而在我們所認為的詭辯中,一定存在著某種邏輯錯誤,這種邏輯錯誤恰好擊中我們平時所忽略的邏輯漏洞,從而使我們暫時很難發現問題所在;

這種例子有很多,出自你觀念落後的長輩、某些逆天網絡言論(此處不指開車)、以及弱智吧等各路神仙;

正是因為人們訓練AI去適應自然語言,而人們對自然語言的應用又毫無底層邏輯或公理可言,自然就無法建立起一套嚴整的推理體系。我並不是說自然語言應該朝著這種方向發展,因為這樣會讓所有人都很累;我想表達的意思是,目前自然語言和數學語言是兩套完全不同的體系,AI理解自然語言對於理解數學沒有任何的幫助(從0.11>0.9這個繞不過的坎就完全足以說明問題)


總結:我認為AI目前不可能對數學有任何的理解,如果要讓AI真正理解數學,需要一種專門設計的訓練和標註方式,“教”AI從公理體系出發進行推理,不能僅靠投入大量沒有邏輯的數據進行訓練。


疊甲: lz只是數院大一新生 對AI的開發和訓練沒有什麼瞭解 唯一經歷只是看字節跳動來學校招過數據標註的苦工(當然也沒去幹) 故以上內容純屬臆測 就不開創作計劃丟人了


© 2022 3樓貓 下載APP 站點地圖 廣告合作:asmrly666@gmail.com