DeepSeek熱度持續席捲全球
短短一週內
微軟Azure、英偉達等海外科技巨頭
以及國內阿里雲、華為雲、騰訊雲、百度雲等雲廠商
均宣佈上線DeepSeek大模型
並以“零代碼”“超低價”等優惠
吸引更多用戶
2025年以來,DeepSeek陸續開源大語言模型V3、推理模型R1和多模態模型Janus Pro,因其高性能、低成本等優勢,率先受到海外市場關注。作為OpenAI的“金主”之一,微軟CEO納德拉在1月29日大讚DeepSeek的創新之處,同時也為微軟自身拉了一波廣告:DeepSeek-R1模型可通過微軟的AI平臺Azure AI Foundry和GitHub獲取,並承諾未來將在搭載Copilot+的電腦上運行。
1月30日,英偉達也緊隨其後,宣佈英偉達的開發者網站已將DeepSeek-R1模型納入“最受歡迎的模型”欄目,可在NVIDIA NIM微服務預覽版上使用。NVIDIA NIM是NVIDIA AI企業版服務的一部分,為跨雲、數據中心和工作站的自託管GPU加速推理微服務提供容器,用於預訓練和自定義AI 模型。
很快,國內各大互聯網雲服務商開始爭相接入DeepSeek系列模型,並拿出“真金白銀”相互競爭。
2月3日,阿里雲宣佈,阿里雲PAI Model Gallery支持雲上一鍵部署DeepSeek-V3和R1模型。在該平臺上,用戶可以零代碼實現從訓練到部署再到推理的全過程,簡化模型開發流程,為開發者和企業用戶帶來了更快、更高效、更便捷的AI開發和應用體驗。
同一天內,百度智能雲千帆平臺也正式上架DeepSeek-R1和V3模型,推出了超低價格方案,還可享受限時免費服務,登錄百度智能雲千帆ModelBuilder即可快速體驗。同時,百度還融入自身大模型技術,比如將DeepSeek模型融合千帆推理鏈路,集成百度獨家內容安全算子,實現模型安全增強保障。
記者瞭解到,包括華為雲、騰訊雲、360數字安全、雲軸科技ZStack等多家國內AI公司已接入DeepSeek模型,相當於DeepSeek模型幾乎成了主流AI雲平臺服務的標配。
DeepSeek一路“狂飆”的同時
AI大模型業內逐漸進入“拉力賽”
1月29日,阿里通義千問上線旗艦級模型Qwen2.5-Max,採用超大規模MoE(混合專家)架構,基於超過20萬億token(詞元)的預訓練數據。阿里團隊表示,該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領先的性能。隨著後訓練技術的不斷進步,下一個版本將有望達到更高水平。
2月1日,OpenAI上線o3-mini,這是OpenAI首款支持開發者需求功能的小型推理模型,具備低成本、低延遲優勢,並支持函數調用、流式傳輸、結構化輸出等功能,還支持與搜索功能結合,能夠提供最新答案並鏈接至相關網絡資源。經過部分開發者的測試後發現,OpenAI o3-mini性能與DeepSeek R1相比沒有明顯優勢,部分環節仍被R1反超。
“DeepSeek引發轟動
說明技術遏制無法奏效”
2月4日,據參考消息援引德國之聲電臺網站2月3日報道,美國開放人工智能研究中心(OpenAI)首席執行官奧爾特曼2月3日表示,該公司沒有計劃起訴中國AI初創公司杭州深度求索人工智能基礎技術研究有限公司(DeepSeek),“我們打算繼續打造出色的產品,並在模型能力方面引領世界,我認為這樣會很好。”
奧特曼稱:“DeepSeek是一個令人印象深刻的模型,但我們相信我們會繼續開拓前沿並推出出色的產品,所以很高興能有另一個競爭對手。”
此前,OpenAI在1月29日表示,有證據表明DeepSeek使用OpenAI專有模型來訓練自己的模型,並暗示這可能違反了OpenAI服務條款,但沒有進一步提出證據。
在1月27日的一次採訪中,奧特曼表示,DeepSeek的“這種性能並不新穎,我們早已具備這一水平的模型,今後將持續開發更先進的模型”。
當地時間1月31日,奧特曼在回答網友問題時坦言,DeepSeek讓OpenAI的領先優勢將不會像前幾年那麼大了,並稱個人認為在開源權重模型和研究成果的問題上,OpenAI已經站在了歷史的錯誤一邊,需要制定不同的開源策略。
值得注意的是,據央視新聞,北京時間2月4日凌晨,中國常駐聯合國代表傅聰在紐約聯合國總部舉行記者會,介紹中國本月輪值安理會主席期間的主要議程設置。
當被問到中國人工智能企業深度求索(DeepSeek)發佈的模型以及中美人工智能合作問題時,傅聰強調,“永遠不要低估中國科研人員的聰明才智。DeepSeek引發全球轟動和一些人的焦慮恐慌,說明技術遏制和技術限制無法奏效,這是全世界、特別是美國需要學習的一課”。
年薪百萬!
DeepSeek“招兵買馬”
據中國基金報報道,目前DeepSeek約有150名員工,但正在迅速擴張。
某招聘平臺顯示,杭州深度求索人工智能(AI)基礎技術研究有限公司即DeepSeek(以下簡稱深度求索公司)發佈了多個崗位的招聘信息。
根據公開信息,深度求索公司有52個在招職位,涵蓋深度學習研究員、核心系統研發工程師及資深UI設計師等,工作城市是北京或杭州。
薪酬方面,從正式員工崗位的招聘信息看,DeepSeek對員工薪酬採取“14薪”的模式。 在Deepseek掛出的職位中,大部分崗位的起薪在2萬元以上,不少年薪能夠達到百萬元級別。
其中,年薪最高的職位是“深度學習研究員-AGI”,月薪水平為8萬—11萬元,年薪最高可達154萬元。同時,深度學習研究員也是Deepseek唯一開放的實習職位。
此崗位要求顯示,需要精通機器學習(深度學習),具備創新研究能力;編程能力出色,熟練掌握至少兩種編程語言;有豐富的研究成果,在國際頂會或期刊發表相關論文;在領域內知名比賽取得優異成績者優先。
此外,核心系統研發工程師(校招)的薪資範圍為6萬元至9萬元,按一年14薪估算後,可達最高126萬元的年薪。大模型全棧工程師的薪資範圍為5萬元至8萬元,可達最高112萬元的年薪。
而深度學習研發工程師、資深UI設計師(負責APP應用程序的視覺層面的設計)等崗位的月薪範圍在3萬元至7萬元,年薪最高可達98萬元。
數據架構工程師、全棧開發工程師、客戶端研發工程師的最高年薪分別達到91萬元、84萬元、56萬元。
值得一提的是,上述估算年薪均為稅前薪酬,而且崗位都面向應屆生開放。部分崗位的招聘月薪,針對不同學歷的應聘者會有差別,而且很多崗位校招薪酬更高。
本文綜合自:上觀新聞、新華社、央視新聞、中國基金報
相關作者:查睿
微信編輯:Rong
校對:LXC