近期Deepseek也是在互联网上爆火啊,并且又引起了一阵AI浪潮。我一时看见的都是在体验和吹捧deepseek的文章或是帖子。仿佛是将deepseek捧上了神坛。那么今天让我们来聊一聊这个Deepseek带来新AI时代。

自从2022年末,OpenAI发布了chatgpt3.5模型开始,全球好像就进入了语言大模型的狂热时期。各家厂商纷纷跟进并推出了自己的语言模型和相关产品。可以说我们进入了一个AI时代,让我们把镜头往回拉,看看AI的发展历程。
居然说到了AI,肯定是要先从语言大模型和AI时代的掀起者∶OpenAI开始说起了。在3.5模型推出之前,其实AI就已经被人类研究了很长很长时间了。我在这方面还是很有印象与感触的。最早的接触这方面,也许是还在小学的时候,刚接触上不算AI的AI∶手机语音助手开始,就迷上了。和笨蛋语音助手聊了半个小时。这个时候的语音助手确实也还算不上AI,能做的实在是太少了,也太笨了。
随后则是在初中时期,这个时期接触的是∶Glow,XEva,小冰岛这类虚拟人物类的AI,和大家说一说我的具体感受吧。就是这类的AI非常的“傻”,是的,就是字如其意。很傻,相比于现在的AI,他们已经可以做到上下文结合,正常交流了。但是还是很笨,交流的前言不搭后语的,就算好不容易调教的玩了一会,过了一段对话后又会回到之前笨蛋的状态。而且相比于现在AI的“百科全书”定位,那时候的AI其实更偏向于一种玩具,游戏一类。

小冰岛APP
接下来,则是22年末。这个时间,OpenAI发布了GPT3.5模型,震惊了世界。一时间全世界都在争相体验这个AI,并且惊叹道其强大,以及一直在说的AI时代要到来了。并且这款产品在国内也火过一小阵子,后来由于一些可以说不可以说的原因,处于一个相对来说比较尴尬的位置。很多人也就没有继续使用了。不过想要在国内简单的使用到也是有办法的,比如各类仿站。我就用了比较长一段时间的这类网站。并且使用体验不错,我对那个时期ChatGPT的印象是不错的,但是也仅限不错。我在使用过程中还是出现了很多问题,比如中文语料很差,逻辑上仍然有很多问题。不过在这个时候我就已经开始使用chatgpt辅助我写代码了。

在接下来,就是国内AI的“井喷时期”,我印象里这段时间各家互联网大场是你追我赶的推出自己的产品,我用的比较多的则是智谱清言和豆包。别家的产品也有体验过,不过没有一直使用下去。这个时间段里,我个人的感受就是不同的AI使用起来没有太大的差距,但是厂商们都在让自己产品更适合本地化使用,比如AI画图,AI视频,还有各种AI设定。这些都是更加的丰富了AI的使用,而AI模型这方面体验是不会差太多的。而且我个人使用感受则是比较方便,当做ChatGPT的平替使用了。比较GPT每次还要挂一下梯子确实麻烦一点。所以在日常使用和搜索中,就习惯了国产AI。国产AI也没有令我失望,在我日常搜索和写代码辅助这些来说,没有差GPT太多。不过像数学问题这种比较考验模型能力的问题我也很少去问就是了,主要测试的多的是对话能力和编程能力。

接下来则是重头戏∶Deepseek
深度求索的产品其实我在它火之前就已经用过了,那个时候还只有网页版和API。模型也没有r1模型,那个时候问问题好像会自动像r1模型这样告诉使用者思考过程。当时给我的体验感觉就是很好用,要比目前大部分国产AI好用。那么这个好用具体在哪呢?我坦诚的告诉大家,那些具体的数据我说不出来。但是体感上,其一就是对话的时候Deepseek比大部分AI舒服,而且更加聪明。我当时刚好在玩一款游戏,叫手机帝国,具体就是造手机。我刚好就用游戏数据测试了一下,参与的AI有∶GPT,Deepseek,豆包,通义千问,kimi,智谱清言。
首先有个前提,因为使用的是游戏数据,所以这份数据非常有迷惑性,并且由于是我手动记录,很多部分是错误的而且很乱。很考验AI的能力。结果也是让我比较意外,表现最差的是我之前很喜欢用的豆包,它告诉我的内容不仅歧义很多,而且内容很乱,还有错误内容。最后让他生成csv的文件他也不愿意生成。然后就是达到了正常水平的智谱清言等AI,这几个AI的表现都只能说是中规中矩,没什么错的,但是都很平庸。而且说的话也很像轱辘话。
重头戏来了,GPT和Deepseek的表现最好。不仅输出内容整洁雅观,在极其容易有歧义的地方也没有被带到坑里,而且给出的总结和最终表格数据都非常令我满意。当时我就觉得这个Deepseek是有点东西在的。

但是话又说回来,Deepseek怎么突然就爆火了呢,甚至是各家已经有了大模型的互联网厂商都选择接入Deepseek,甚至是央视都报道Deepseek的厉害了呢?难道真的是Deepseek的各项能力已经世界第一,无人能及了吗?并不是,背后的原理很简单∶便宜
是的,Deepseek并没有做到各项能力遥遥领先于同行,但他做到了目前最难的事情∶便宜并且厉害的模型能力。
先说便宜,Deepseek的API输出价格已经是目前市面上普遍大模型价格的十几分之一,这个价格对于大模型来说是非常致命的了。其次就是模型能力,十几分之一的价格却做到了模型能力对比中较为领先的排名,甚至几项能力达到了第一,这就十分的恐怖了。

分享一段网友的话,简单易懂的说明了Deepseek是怎么做到价格这么低却训练出了这么强大的模型的∶老师每次都会给ab布置非常难的作业题,a都不会做但是每次都要拿到接近满分,原因是因为a每次都可以b帮他做出来,但是这个b每次只告诉a最终答案结果却不告诉他过程,于是a就跟b给它的正确答案结果反推中间过程,于是a就可以在没有b这么强聪明才智的情况下还能达到和b一样的好成绩。大家明白了吗
不过还有一个很有意思的是我刚刚在使用gpt和Deepseek的过程中,同样询问了一个我的博客网址,GPT则可以读取网站内容和总结,deepseek则不可以。暂时没搞懂原因,有没有懂得小伙伴给我解释解释。
PS∶麻烦大家点点赞点点关注吧,我正在努力提升小黑盒作者等级,其中有一个任务是要达到600粉丝。我如果成功达到600粉丝,会给大家roll出一台rg350游戏掌机。麻烦各位点点赞,充充电让更多人看到,然后点点关注。我每篇文章也写的非常用心,关注我不吃亏