DeepSeek何以創造了“行業奇跡” | 新京報專欄

3個月前來源：觀看：26

▲堅持長期視角，專注底層創新，探索新的路徑。圖/DeepSeek界面截圖

一家此前不在多數媒體的“明星企業”列表中的“小企業”，一家走開源路線而非走閉源或率先開發應用的“創新組織”，卻意外在2025年開年成為了中國大模型領域科技創新的全球代表。

據多家媒體報道，這家名為DeepSeek（深度求索）的中國大模型企業，最近發布的大模型，在多項性能測試中已經達到了OpenAI的最新大模型o1水平，部分項目還實現了超越。由此引發了全球科技行業的熱烈討論，有媒體形容“DeepSeek朝硅谷‘開了一槍’”，甚至“震動美國科技界”。

底層創新提升算力效率

DeepSeek當前所創造的“神話”，主要是兩類敘事。第一類，是DeepSeek的算力成本投入與表現出來的性能對比，超出了行業的一般認知。據部分行業媒體報道，DeepSeek r1的訓練成本僅為ChatGPT o1的零頭。第二類神話則是，DeepSeek的成功證明了開源路線的逆襲勝利，對大公司、巨頭的閉源路線進行了一次底層顛覆。

這兩類看法被灌注到社交平臺上進行廣泛討論后，事實上都或多或少因人們的真誠期待而略有扭曲。例如，DeepSeek r1的真實算力成本投入遠不止600萬美元，且最早報道的媒體混淆了DeepSeek在論文中提及的訓練成本。根據原文，550萬美元是DeepSeek v3在正式訓練階段的成本，不包括前期研究、實驗的成本。

并且，從行業發展的邏輯看，探索與迭代、追趕所需的算力成本，也不應該放在一起對比。OpenAI在ChatGPT o1的研發探索，與v3在前序產品基礎上的迭代，成本無法簡單對比。創新和探索必然伴隨著算力和各項成本的浪費，在確定性的路徑上優化所付出的代價，與探索未知所付出的代價，互相之間不宜簡單對比。

而從大模型現階段的發展看，準確地說，一家企業的階段性產品的成功，還不能定義為閉源與開源路線的成敗。

綜合以上，比較嚴謹地看待DeepSeek帶給我們的驚喜，應該是：DeepSeek展示了模型架構底層創新的價值，不斷提升了算力效率。并且，這一家架構的底層創新，推動了開源大模型產品在能力上的超越，從而將進一步提升行業整體的應用研發水平。

更重要的仍是“創新”本身

盡管比起人們熱愛的傳奇故事，上面的這個故事顯得有些過于審慎無聊。但事實上，這樣一個嚴謹的故事，更值得我們去探討本文開篇的兩句話：為什么是一家資金量不占優勢的、專注于底層創新而非商業化的開源企業，創造了中國企業在大模型領域的一次“彎道超車”？

2024年8月，在接受媒體專訪時，DeepSeek創始人梁文鋒提及了團隊的研發思路，“如果目標是做應用，那沿用LLaMA模型（LLaMA，是元宇宙平臺公司，即Meta公開發布的產品）短平快上產品也是合理的，但我們的目的地是AGI（通用人工智能），這意味著我們需要研究新的模型結構，在有限資源下，實現更強的模型能力”。

這句話揭示了“奇跡”誕生的出發點：因為目標不同，所以方法不同，面對差距的態度也不同。

就在DeepSeek創造“行業奇跡”不久前，國內大模型行業的共識幾乎仍然是“要做應用”，因為做通用大模型的機會已經沒有了。一些明星創業企業更是放棄了對通用AGI的探索，轉而借助現有的模型去研發應用。

在這種行業共識之下，我們所接觸到的多數國產大模型企業，津津樂道的多數都是具體且仍不成熟的應用。如，多如牛毛的陪伴型AI聊天機器人，或是文生圖、文生視頻等“奇觀展示”。

這并非刻意貶低應用層的研發努力，面對差距做策略性的舍棄，是正常的科技與商業選擇。就連梁文鋒自己也在訪談中承認，在模型結構和訓練動力學上，國內的最高水平比起國外最高水平可能有一倍的差距，與此同時，數據效率上國內比起海外可能也有一倍的差距，兩者相加，相當于國內要用四倍的算力才能取得同樣的效果。

再加上復雜宏觀環境下算力本身的成本差距。在這種現實下，多數企業選擇了繞開這些差距，確實是一個直覺上可以理解的選項。

但DeepSeek選擇的方向卻顯得反直覺和常識。既然資源差距大，那就干脆回到模型架構底層去創新和優化。而事實證明，這條路最終反而能更快地達成目標。

事實上，AGI的長期發展固然與算力成本息息相關，但AGI本身仍然處在不斷迭代的過程之中。在科技創新之中，決定長期結果的固然是宏觀環境、經濟投入等底層基礎，但在動態的創新發生過程中，更重要的或許仍舊是“創新”本身。

大模型已經火熱許久，但時至今日，仍然不是簡單的資源加總游戲，不是簡單地囤更多算力就能快速實現突破，也不是誰更早擁有更多用戶，有更多商業化的場景和賺錢的能力，就能笑到最后。而這正是那些曾經風光無二但卻迅速退潮的企業所沒有想明白的基礎邏輯。

從這個更嚴謹的行業發展故事來看，DeepSeek的最大啟發，是我們仍舊處在充滿不確定性的創新探索周期里。而短視，恰恰是創新的最大敵人。堅持長期視角，專注底層創新，探索新的路徑，比起融資、囤卡和商業化，更有可能獲得最終的勝利。

撰稿 / 王曉凱（媒體人）

編輯 / 遲道華馬小龍

校對 / 趙琳

點擊展開全文

本文鏈接：http://www.020gz.com.cn/news-4-1125-0.htmlDeepSeek何以創造了“行業奇跡” | 新京報專欄

聲明：本網頁內容由互聯網博主自發貢獻，不代表本站觀點，本站不承擔任何法律責任。天上不會到餡餅，請大家謹防詐騙！若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。

上一篇：相信春天的力量 | 新京報春節社論

下一篇：“比手腕還粗”的網紅煙花，還是別買了|新京報快評

為你推薦

太火爆！這筆生意火到美國！狂攬超10億元！好萊塢演職人員也加入了

近年來，短小精悍、劇情跌宕的短劇，發展成網絡影視的一種新業態，短劇出海也成為我國文化產業的一個新風向。截至2024年8月，頭部海外短劇App的地區數據中，美國的收入達1.51億美元（約...

01-22

我國已有570多家工業企業入圍全球研發投入2500強

新華社北京1月21日電（記者張辛欣、張曉潔）工業和信息化部副部長張云明在21日國新辦舉行的“中國經濟高質量發展成效”系列新聞發布會上表示，我國已有570多家工業企業入圍全球研...

01-22

北京現代的2025：新合資時代的“又一春”

沒有一個春天不會到來，無論經歷過怎樣的寒冬。風云變幻的汽車行業，有迅猛地崛起，有突然地倒下，也有在艱難中堅定前行……2024年底，北京現代迎來新的轉機，雙方股東再次增資10.95億...

01-21

上汽通用別克 GL8 陸尊 PHEV 八方來財版上市：“金頂青云”雙色車衣、座椅頭枕篆體刺繡，35.99 萬元起

2 月 2 日消息，上汽通用別克品牌宣布別克 GL8 陸尊 PHEV 八方來財版上市。該車以“八方來財”套件形式提供，GL8 陸尊 PHEV 全系款型均可免費選裝（限量 888 輛）。作為比...

02-02

《難哄》穆承允的扮演者是誰穆承允說桑延說了什么

《難哄》穆承允的扮演者是誰？穆承允說桑延說了什么在電視劇《難哄》中，穆承允的扮演者是原野。穆承允說桑延說了什么在《難哄》中，穆承允并沒有明確提及桑延說...

02-19

《怎敵她千嬌百媚》第14集劇情解析

《怎敵她千嬌百媚》播出后，許多觀眾對劇情和角色的發展產生了濃厚興趣。接下來，我們來看看第14集的劇情。周揚靈得知羅令妤身體好轉，便邀請她相聚。羅令妤提到...

02-22

奧司他韋對非流感病毒無效

　　春節假期結束，目前北京市仍處于流感等呼吸道傳染病高發期。近日，抗流感藥物奧司他韋相關的多個詞條沖上熱搜，抗流感藥物奧司他韋到底應該怎么吃？相關專家提示：奧司他韋...

02-07

醫健IPO解碼｜維昇藥業即將登陸港交所：“生長發育第一股”能否走穩商業化路徑？

21世紀經濟報道記者季媛媛上海報道近期，安科生物發布重要公告，宣布將運用自有資金，最高不超過3100萬美元（含相關手續費如經紀傭金及征費等）...

02-14

鄭皆連院士：用“三頁半”建議成就“世界第一拱”

　　“如果不是鄭皆連院士堅定的科學執言，‘世界第一拱’極有可能與我們擦肩而過。”這是廣西大...

01-21

小記者活動感受 | 西安鐵五小學一年級錢韜宇

　　今天我們來到了公安局浐灞分局。警察叔叔先帶我們參觀了他們審訊的地方。警察阿姨還教給我們很多在野外保護自己的知識。最后我們還進行了射擊體驗。　　射擊體驗讓我...

01-21

紙漿盤中拉漲原因找到了……

　　摘要　　昨日下午，紙漿期貨主力合約2503盤中突然拉漲，收于6102元/噸，上漲1.8%。在弘業期貨金融...

01-24

四部門發布指導意見促進新能源車險高質量發展

　　本報記者劉琪　　1月24日，國家金融監督管理總局（以下簡稱“國家金融監管總局”）發布消息，為進...

01-28

水瓶男無法抗拒的女生，水瓶男喜歡單純傻傻的女生嗎

水瓶座的男生通常被認為是理性、獨立和思想開放的人。他們喜歡追求自由和創新，對于傳統...

01-22

天蝎男和什么座最配？這三個星座女都是他們的命中注定

天蝎座男生以其神秘、深沉的性格而聞名，他們對感情非常專一，善于保護自己和所愛的人。然...

01-22

180男生冬季穿搭？ 180男生穿搭冬季？

180男生冬季穿搭？ 180男生穿搭冬季？一、180男生冬季穿搭？襯衫+修身長褲+大衣作為身高180甚至180+的男生來說真是要恭喜你了，這樣的身高可以說是男神身高了。180的男生也能輕松駕...

02-17

museum服飾品牌介紹？玫服飾品牌介紹？

museum服飾品牌介紹？玫服飾品牌介紹？museum服飾品牌介紹？品牌 MUSIUM 的名字是揉合了 Museum(博物館)以及 Music(音樂)兩者的意思，其整體的設計氛圍猶如一所集實驗室化學元素與...

02-17

馬云回國，干了件大事

阿里蘋果或將聯手，為iPhone開發AI功能一則重磅消息，讓阿里股價再創階段新高。2月11日晚間，據The Information援引知情人士消息稱，蘋果為了應對在中國市場銷售下滑的局勢，正積極尋...

02-13

淘寶情人節送禮榜：護膚類產品訂單增長124%

2月15日消息，淘寶發布“情人節送禮榜”，護膚品、化妝品穩坐情人節禮物前排，淘寶天貓上的護膚類產品、唇部彩妝訂單分別增長了124%、144%。口紅、眼影、粉底液的“色號難題”，幾...

02-16

超66萬人“想看”，刀郎演唱會門票成“盡孝硬通貨”，網友：比周杰倫還要難搶

圖源：圖蟲創意一張刀郎演唱會門票，成為眼下最熱門的“盡孝...

03-04

起底情感咨詢服務③｜收費“看人下菜”，霸王條款致維權困難重重

國內心理咨詢行業的發展歷程并不長，2000年之后才真正進入高速發展階段。復旦大學心理健康與教育中心心理咨詢師陳倩對《消費者報道...

03-04

交銀投資等在陜西成立航空航天股權基金

【#交銀投資等在陜西成立航空航天股權基金# 出資額10億】天眼查App顯示，近日，陜西財金交匯航空航天新動能股權投資產業基金合伙企業（有限合伙）成立，執行事務合伙人為陜西空天宏遠...

01-21

浙創浙江自貿區股權投資基金登記成立

【#浙創浙江自貿區股權投資基金登記成立# 出資額10億】天眼查App顯示，近日，浙創（浙江自貿區）股權投資基金合伙企業（有限合伙）成立，執行事務合伙人為北京浙商華盈創業投資管理有限公...

02-09

日語學習主題RPG游戲《主人公》將于2025年2月13日正式推出

由Rice Games Inc打造的日語學習主題RPG游戲《主人公（Shujinkou）》，現已在Steam平臺推出試玩Demo。本作中玩家將沉浸在這款JRPG冒險中，學習世界上最難的語言之...

01-27

南美地區部分國家Nintendo Switch Online價格上漲

任天堂宣布對Nintendo Switch Online服務進行漲價，但僅涉及拉丁美洲部分地區。此次價格調整將于今年3月實施。任天堂今日開始向用戶發送有關價格變動的郵件。...

02-01

《封神2》路演現場觀眾情緒失控，質問導演烏爾善

2月4日，據報道，《封神2》太原路演現場觀眾情緒失控，導演烏爾善被觀眾貼臉質問： “為什么封神的口碑兩極分化，你想過沒有？我們作為路人一直在給你說好話，你有沒有想過自己去解決這...

02-05

徐夢桃、寧忠巖再度領銜沖金亞冬會今日比賽看點→

在2月9日的比賽中，中國代表團獲得7金7銀9銅。其中，中國短道速滑隊以2金2銀4銅收官。△點擊圖片，查看哈爾濱第九屆亞冬會獎牌榜。2月10日，將決出7枚金牌。比賽有哪些精彩看點？一起...

02-10

預測蛋白質序列的新AI模型問世

...

01-21

東風奕派與華為達成深度戰略合作

1月22日，汽車產業再迎重大戰略合作：東風汽車集團有限公司（以下簡稱東風汽車）旗下主流科技電動品牌東風奕派與華為技術有限公司（以下簡稱華為）在華為深圳...

01-24

電影《哪吒之魔童鬧海》登頂影史全球單一市場票房榜

　　據網絡平臺數據，截至2月7日21時，電影《哪吒之魔童鬧海》票房(含預售)突破67.922億，超過《星球...

02-08

遼東灣海冰快速融化總體冰情較常年偏輕

　　中國自然資源部北海區海洋預報臺16日發布的監測數據顯示，當日，遼東灣海冰面積為1157平方公里，海上浮冰...

02-17

日本高清中文字幕一区二区三区a-日本高清专区一区二无线-日本高新1区2区3区-日本国产亚洲-操操操综合网-操操久久

全部導航

DeepSeek何以創造了“行業奇跡” | 新京報專欄

奧司他韋、瑪巴洛沙韋怎么選？吃多了會產生耐藥現象嗎？

“天賦基因檢測”是噱頭還是科學？專家：避免落入消費陷阱

取消門診預交金，讓患者就醫更便捷 | 新京報快評

都在江蘇！中國第二個5000億縣級市誕生，江陰GDP預計創新高

武漢市民返鄉更安心！蘿卜快跑春運服務升級：7×24小時在線、多重安全保障

國家能源局：2024年全社會用電量同比增6.8%

百位華商預見2025｜泰國鄺錦榮：數字化技術將加速驅動文化產業發展

百位華商預見2025｜捷克胡世隆：把握中高端中餐市場機遇