▲示意圖
似乎就在一夜之間,來自中國的AI公司DeepSeek(深度求索)在大洋彼岸全面“破圈”,從高高在上的美股巨頭,到使用AI工具的普通用戶都被DeepSeek最新發布的R1模型深深震撼。
當地時間27日,DeepSeek應用登頂蘋果美國地區應用商店免費App下載排行榜,在美區下載榜上超越了ChatGPT。Meta、Open AI等科技巨頭員工發帖稱,公司內部已開啟了“恐慌模式”,緊急制定對策。德國經濟學家豪爾格·查皮茲表示,DeepSeek將成為“美國股市的最大威脅”。美國“投資百科”網站稱,特朗普才剛剛喊出5000億美元的“星際之門”計劃,就被中國一個僅僅訓練了2個月的AI模型打擊了信心。
當地時間27日,阿斯麥、英偉達、博通盤前跌超10%,臺積電跌超9%。
據報道,DeepSeek創始人梁文鋒1985年出生于廣東省湛江市吳川市,根據領英等網站公開可查的資料,DeepSeek團隊成員約超過一半為95后,90后占比超過75%。梁文鋒曾表示,公司員工“都是一些Top高校的應屆畢業生、沒畢業的博四、博五實習生,還有一些畢業才幾年的年輕人”。DeepSeek內部的團隊氛圍也較為寬松,梁文鋒曾表示團隊中每一個成員可以調用的資源都“沒有上限”,并且管理制度上非常推崇扁平化。
“低成本訓練”震撼美國巨頭
專家:對美股泡沫沖擊大
去年12月26日,DeepSeek發布的V3模型就初露鋒芒,以大約Open AI二十分之一的訓練成本獲得了比肩世界頂級性能的大模型。緊接著在今年1月20日,DeepSeek再度發布R1模型。美國加州的Scale AI公司致力于測評各種AI模型的實際性能,其創始人亞歷山大·王在接受采訪時表示:“老實說,我覺得DeepSeek在很多項指標上都達到了美國最先進模型的水平”。
除了性能優異,DeepSeek作為一個開源模型,對終端用戶始終免費開放,而它對于開發者調用API的收費定價水平幾乎為Open AI的百分之一。此前DeepSeek曾公開回應“價格戰”的指控,表示在這樣的定價之下自己仍有合理的利潤結構。低廉的價格來源于該公司在軟件算法層面的創新,改變了美國科技巨頭們囤積GPU顯卡“堆算力”的慣性思維。據悉R1的訓練只調用了2000余塊顯卡,為期53天,總的訓練成本僅為558萬美元,不到其他世界頂級大模型一次訓練成本的十分之一。
這樣的極致性價比,讓在AI熱潮下被炒高了兩年的美國科技股感到巨大的“寒意”。豪爾格·查皮茲25日寫道:“這家中國公司以極端低廉的成本,在缺少最頂尖芯片供應的情況下打造出一個震動世界的模型,這是對美股泡沫構成的最大威脅。”美國經濟學家亞德尼表示,“DeepSeek的成功可能會給美股財報季帶來壓力,尤其是在谷歌、Meta和微軟等公司加大AI資本投入的情況下。尤其是微軟,它是OpenAI的最大投資者。”
在DeepSeek熱潮的帶動下,英偉達股價在當地時間26日下跌3.12%。27日盤前,英偉達股價重挫超10%,帶動納指期貨下跌4%。英偉達下一次財報公布預計在2月26日。27日,A股市場迎來春節前最后一個交易日,一些“算力概念股”也因DeepSeek的成功受到影響。不過和DeepSeek公司關聯較深的浙江東方、每日互動等個股出現一字漲停。
此外有Meta員工在論壇匿名發帖表示,公司內部針對DeepSeek崛起的威脅感到高度緊張。“畢竟人家模型的訓練成本還不如Meta一位高管的年薪,而我們這里有幾十位這樣的高管,想想這些人怎樣才能向上級交差吧。”
創始人梁文鋒:
85后“老股民”從量化投資起家
▲梁文鋒(右)參加工作座談會
據湛江發布,DeepSeek創始人梁文鋒是吳川市覃巴鎮米歷嶺村人,父母都是小學語文老師。“85后”的梁文鋒從小就是“學霸”,在數學方面天賦突出。同學們反映,梁文鋒并非“書呆子”類型,而是很有獨立思考的精神。梁文鋒本科和碩士都就讀于浙江大學,2008年,研究生畢業的梁文鋒并沒有走上“碼農”的道路。當時推崇“量化投資之父”西蒙斯的他和朋友一起在出租屋內刻苦鉆研,想要找到對股票價格建模的方法。
2010年,滬深股指期貨推出,這給了梁文鋒充分發揮計算機建模天賦的機會。很快他的自營資金盤就達到了5億元的水平。2015年,梁文鋒與校友一起共同創立幻方量化,在A股市場系統性地進行量化交易。2021年,幻方量化的資產管理規模達到千億水平,被譽為國內四大頂級量化私募之一。
幻方量化的成功離不開人工智能的深度融合,梁文鋒很早就產生了用AI自動制定量化交易策略的想法,并堅持不懈地付諸實踐。2020年,英偉達發布了A100芯片,這是英偉達下一代旗艦作品,而幻方量化成為亞太地區第一批拿到貨的客戶。幻方量化多年來不僅儲備了大量的尖端芯片,而且在軟件算法層面不斷推陳出新,這給梁文鋒在AI領域的創業奠定了扎實的基礎,2023年7月他創立了DeepSeek(全稱“杭州深度求索人工智能基礎技術研究有限公司”)。
DeepSeek團隊:
90后、95后為主,喜歡“高潛力年輕人”
據報道,DeepSeek的員工規模不到140人,是Open AI的十分之一左右。據領英網站檢索樣本發現,DeepSeek員工85%以上擁有碩士學位,40%以上有博士學位。團隊成員平均年齡約為28歲,90后占比超75%,95后(1995年后出生)員工占比50%以上。該公司成員大多畢業于北大、清華、中科大等國內頂尖院校,也有少數畢業于麻省理工學院、卡內基梅隆大學等海外知名高校。同時DeepSeek的員工中也有相當一部分具有交叉學科背景。
▲幻方量化旗下大模型公司DeepSeek
和動輒上千人的“大廠”AI開發團隊相比,DeepSeek百余人的規模顯得相當精煉,并且在選人標準上兩者也大有不同:互聯網公司一般看重成熟的經驗,最好有在核心項目成功過的經歷,而DeepSeek則喜歡“高潛力年輕人”。以該公司選擇的“稀疏訓練”技術路徑為例,剛畢業的博士生由于在學校里接觸過相關前沿課題,對這一技術路徑更加熟悉,而“業界老鳥”則不一定對最新技術能保持高度敏感。
據“智能涌現”,一名曾與DeepSeek有過合作的獵頭表示,DeepSeek非常偏愛沒有工作經驗的年輕人,而且指明不要資深人士,“工作經驗在3~5年已經是最多的了,工作超8年的基本就pass了”。
梁文鋒曾在采訪中表示,留住年輕人才的方法主要是“高薪”和“算力管夠”兩條路。業內人士表示,DeepSeek的薪資水平能夠對標業內任何頂尖機構,而且人才如果在字節跳動等取得offer,DeepSeek還會加碼競爭。DeepSeek開出的應屆工程師薪酬已經等同于業界同等崗位的“總監/經理”的薪酬了。
此外梁文鋒非常推崇“極客文化”,在公司內部推行扁平化管理,并且鼓勵員工個人發揮潛能進行學習和創新。DeepSeek也不會采用互聯網巨頭常用的“賽馬”機制,減少團隊內耗。在算力資源的調配上,梁文鋒對每個人都不設上限,只要提出有潛力的思路,他都會給員工調撥足夠的資源進行嘗試研究。據悉產生R1模型的技術思路就是一名年輕員工“突發奇想”提出的點子,梁文鋒為他搭配了一個團隊,“花了幾個月時間才跑通(技術路線)”。事實證明,DeepSeek這種“輕經驗、重潛力”的用人思路,為中國AI界迎來了一次劃時代的創新發展。
紅星新聞記者 鄭直
本文鏈接:http://www.020gz.com.cn/news-4-1006-0.html美股震撼、科技巨頭恐慌,95后成群的DeepSeek如何就一夜“破圈”?
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕