都说Deepseek r1强于ChatGPT o1,总得有证据吧?
刚好今天我想起了12月喂给过GPT的问题

某次作业第二题
我打算把这个问题也喂给Deepseek,看看怎么个事🤓👆
顺便说一些我作为一个数学专业的大一学生关于AI和数学的看法
(注:这题用的是一个基于Cantor-Lebesgue函数的经典构造,感兴趣的盒友可以去知乎搜一下)
以下是ChatGPT方面的互动:(非数学专业的盒友可以忽略GPT的发言)





固执是AI的天性吗
GPT测试结论:对可测函数定义错误,且无法纠正,知错不改,最终不知所云;思考时间少至几秒,深度思考形同虚设
以下是Deepseek方面的互动:(非数学专业请继续忽视ds消息)

注意此图倒数第二段








Deepseek的测试结果其实也不尽如人意,但有两个亮点引起了我的关注:①Deepseek的思考过程中涉及了Cantor-Lebesgue函数(即它所说的Cantor函数),这是GPT全程都没有提到的;②在前一次失败的(我手欠输错题目的)测试中,Deepseek曾给出了x+g(x)取反函数的正确构造(可惜我手欠把记录删了)
这说明Deepseek对测度论至少有基本的涉猎(当然也有可能是训练的时候不小心混进去了脏东西)
下面是我关于AI和数学的一些思考:
我一直在想一种可能:人类的自然语言在某种角度下可以被精准地数字化,这不是单纯给字符编订编码的那种数字化,而是给每个词义赋以某个值,使得每一个合理的句式和每一条合理的逻辑都能满足特定的数学条件;
这就意味着,我们平时的言语并没有完全符合这一套逻辑,而在我们所认为的诡辩中,一定存在着某种逻辑错误,这种逻辑错误恰好击中我们平时所忽略的逻辑漏洞,从而使我们暂时很难发现问题所在;
这种例子有很多,出自你观念落后的长辈、某些逆天网络言论(此处不指开车)、以及弱智吧等各路神仙;
正是因为人们训练AI去适应自然语言,而人们对自然语言的应用又毫无底层逻辑或公理可言,自然就无法建立起一套严整的推理体系。我并不是说自然语言应该朝着这种方向发展,因为这样会让所有人都很累;我想表达的意思是,目前自然语言和数学语言是两套完全不同的体系,AI理解自然语言对于理解数学没有任何的帮助(从0.11>0.9这个绕不过的坎就完全足以说明问题)
总结:我认为AI目前不可能对数学有任何的理解,如果要让AI真正理解数学,需要一种专门设计的训练和标注方式,“教”AI从公理体系出发进行推理,不能仅靠投入大量没有逻辑的数据进行训练。
叠甲: lz只是数院大一新生 对AI的开发和训练没有什么了解 唯一经历只是看字节跳动来学校招过数据标注的苦工(当然也没去干) 故以上内容纯属臆测 就不开创作计划丢人了