日本高清中文字幕一区二区三区a-日本高清专区一区二无线-日本高新1区2区3区-日本国产亚洲-操操操综合网-操操久久

DeepSeek成功的底層邏輯及產(chǎn)業(yè)影響

2個月前 來源:新華網(wǎng) 觀看:18

仿佛是一夜之間,DeepSeek迎來了“滔天的流量”。它不僅在全球引發(fā)了新一輪的AI應用熱潮,而且給全球的算力資本市場帶來了重大沖擊。究其原因,DeepSeek不僅在訓練成本及使用成本、模型訓練及優(yōu)化方式等領域實現(xiàn)了大量的工程創(chuàng)新,而且打破了AI領域許多的傳統(tǒng)敘事邏輯。簡而言之,DeepSeek正在改變游戲規(guī)則。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek最新推理模型R1的橫空出世,帶來了一個非常大的驚喜,僅用6天就發(fā)展了1億用戶。“用好奇心來揭開AGI的神秘面紗”這一愿景,更增添了神秘色彩。那么,DeepSeek在技術上究竟有哪些創(chuàng)新,成功的背后有哪些深層次的原因?這一切將對中美下一個十年的科技競爭產(chǎn)生哪些影響?YdN即熱新聞——關注每天科技社會生活新變化gihot.com

工程創(chuàng)新YdN即熱新聞——關注每天科技社會生活新變化gihot.com

成就與眾不同YdN即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek不僅引發(fā)了全球新一輪的AI應用熱潮,而且對全球的算力資本市場產(chǎn)生重大沖擊。究其原因,DeepSeek在訓練成本及使用成本、模型訓練及優(yōu)化方式方面均實現(xiàn)了大量工程創(chuàng)新。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

成本是最大的亮點。DeepSeek-R1的整體訓練成本比OpenAI少了一個數(shù)量級以上。R1在整個訓練過程中的工程優(yōu)化和創(chuàng)新亮點非常多,包括“Multi-Head Latent Attention——多頭隱形注意力機制”“Multi-token predication——多token預測”“有選擇性地使用8個浮點數(shù)精度FP8來替代FP16甚至FP31”等。這些優(yōu)化其實都不容易實現(xiàn)。每一個看似不顯著的優(yōu)化,在層級疊加效應下卻產(chǎn)生了非常驚人的效果。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek其實一共發(fā)布了兩個模型,分別是R1和R1-zero。DeepSeek基于V3這個基礎模型聚焦強化學習獲得了R1-zero。但是,R1-zero在回答一些問題的時候容易產(chǎn)生包括“多語言混雜”在內(nèi)的諸多問題。Deep-Seek又對這個模型進行了SFT(監(jiān)督微調(diào)優(yōu)化),從而產(chǎn)生了R1。R1的強化學習功能可以實現(xiàn)自動化,是比較容易去scale的。這樣一來,該模型未來的想象空間接近無限。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

顛覆性改變YdN即熱新聞——關注每天科技社會生活新變化gihot.com

打破傳統(tǒng)敘事邏輯YdN即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek之所以備受關注,本質在于打破了很多AI領域的傳統(tǒng)敘事邏輯,例如OpenAI對于推理模型的算力堆疊霸權邏輯、AI應用圈的OpenAI寡頭壟斷格局邏輯、美國對中國的高制程芯片封鎖邏輯以及AI大模型的開源閉源邏輯……YdN即熱新聞——關注每天科技社會生活新變化gihot.com

首先,AI圈公認這種推理模型的實現(xiàn)難度是極大的。此前,比較好的推理模型只有OpenAI的GPT o1。Anthropic做不出來,Google“卡”了很久才推出表現(xiàn)一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力還要強于o1。進一步來看,R1不僅免費還開源,訓練成本和使用成本均實現(xiàn)了指數(shù)級下降。原先o1憑借領先性可以“收割”相當長一段時間的價值,但DeepSeek-R1的出現(xiàn)以及開源的舉措,讓絕大多數(shù)開發(fā)者以及聚焦應用的創(chuàng)業(yè)公司都能夠以更低的門檻去做開發(fā)。更加便宜且更容易私有化部署的R1,擊碎了華爾街對于所有大模型公司的估值邏輯。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

其次,DeepSeek的出現(xiàn)打破了AI應用圈原有的競爭枷鎖。就算是美國的頂尖應用公司選擇DeepSeek和ChatGPT時,答案也很清楚。Cursor、Perplexity這些AI領域的超級明星應用,都第一時間進行了DeepSeek模型的部署,而且設置了推薦第一優(yōu)先級。此外,Google、Amazon、NV等平臺也都部署了Deep-Seek模型。這些改變,同步影響了云服務的市場格局。國內(nèi)大量從事應用開發(fā)的企業(yè),在DeepSeek-R1出現(xiàn)之前不得不使用微軟云(為了便捷使用GPT-4的API);現(xiàn)在,使用阿里云上部署的Deep-Seek成為可選項。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

再其次,DeepSeek帶來了芯片封鎖邏輯的崩塌。DeepSeek在輝達CUDA生態(tài)的更底層(例如PTX層),通過微調(diào)底層代碼來優(yōu)化性能,從而解決“連接通信能力和調(diào)度能力被閹割”的問題。專家普遍認為,目前中美AI大模型領域的技術差距約為4個月。從技術能力發(fā)展的趨勢來看,這一差距繼續(xù)縮小的概率大于擴大的概率。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

最后,開源讓DeepSeek在輿論戰(zhàn)中至少“不落下風”。在AGI的道路上做出最強大的模型并開源,應該是OpenAI最早的初心和使命。市場永遠不會說謊,誰的模型能力強誰就能掌握最終的話語權。2024年12月DeepSeek V3發(fā)布的時候,國際主流媒體主要關注其“成本低廉”;當Deep-Seek-R1發(fā)布時,情況則截然不同,因為“滔天的流量”來了。作為一個開源模型,DeepSeek讓所有用戶在任何領域都增加了一個“頂尖專家”,免費且24小時隨時在線。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

仿佛是一夜之間,DeepSeek迎來了“滔天的流量”。它不僅在全球引發(fā)了新一輪的AI應用熱潮,而且給全球的算力資本市場帶來了重大沖擊。究其原因,DeepSeek不僅在訓練成本及使用成本、模型訓練及優(yōu)化方式等領域實現(xiàn)了大量的工程創(chuàng)新,而且打破了AI領域許多的傳統(tǒng)敘事邏輯。簡而言之,DeepSeek正在改變游戲規(guī)則。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek最新推理模型R1的橫空出世,帶來了一個非常大的驚喜,僅用6天就發(fā)展了1億用戶。“用好奇心來揭開AGI的神秘面紗”這一愿景,更增添了神秘色彩。那么,DeepSeek在技術上究竟有哪些創(chuàng)新,成功的背后有哪些深層次的原因?這一切將對中美下一個十年的科技競爭產(chǎn)生哪些影響?YdN即熱新聞——關注每天科技社會生活新變化gihot.com

工程創(chuàng)新YdN即熱新聞——關注每天科技社會生活新變化gihot.com

成就與眾不同YdN即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek不僅引發(fā)了全球新一輪的AI應用熱潮,而且對全球的算力資本市場產(chǎn)生重大沖擊。究其原因,DeepSeek在訓練成本及使用成本、模型訓練及優(yōu)化方式方面均實現(xiàn)了大量工程創(chuàng)新。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

成本是最大的亮點。DeepSeek-R1的整體訓練成本比OpenAI少了一個數(shù)量級以上。R1在整個訓練過程中的工程優(yōu)化和創(chuàng)新亮點非常多,包括“Multi-Head Latent Attention——多頭隱形注意力機制”“Multi-token predication——多token預測”“有選擇性地使用8個浮點數(shù)精度FP8來替代FP16甚至FP31”等。這些優(yōu)化其實都不容易實現(xiàn)。每一個看似不顯著的優(yōu)化,在層級疊加效應下卻產(chǎn)生了非常驚人的效果。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek其實一共發(fā)布了兩個模型,分別是R1和R1-zero。DeepSeek基于V3這個基礎模型聚焦強化學習獲得了R1-zero。但是,R1-zero在回答一些問題的時候容易產(chǎn)生包括“多語言混雜”在內(nèi)的諸多問題。Deep-Seek又對這個模型進行了SFT(監(jiān)督微調(diào)優(yōu)化),從而產(chǎn)生了R1。R1的強化學習功能可以實現(xiàn)自動化,是比較容易去scale的。這樣一來,該模型未來的想象空間接近無限。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

顛覆性改變YdN即熱新聞——關注每天科技社會生活新變化gihot.com

打破傳統(tǒng)敘事邏輯YdN即熱新聞——關注每天科技社會生活新變化gihot.com

DeepSeek之所以備受關注,本質在于打破了很多AI領域的傳統(tǒng)敘事邏輯,例如OpenAI對于推理模型的算力堆疊霸權邏輯、AI應用圈的OpenAI寡頭壟斷格局邏輯、美國對中國的高制程芯片封鎖邏輯以及AI大模型的開源閉源邏輯……YdN即熱新聞——關注每天科技社會生活新變化gihot.com

首先,AI圈公認這種推理模型的實現(xiàn)難度是極大的。此前,比較好的推理模型只有OpenAI的GPT o1。Anthropic做不出來,Google“卡”了很久才推出表現(xiàn)一般的Germini 2.0。DeepSeek-R1至少是o1的平替,甚至部分能力還要強于o1。進一步來看,R1不僅免費還開源,訓練成本和使用成本均實現(xiàn)了指數(shù)級下降。原先o1憑借領先性可以“收割”相當長一段時間的價值,但DeepSeek-R1的出現(xiàn)以及開源的舉措,讓絕大多數(shù)開發(fā)者以及聚焦應用的創(chuàng)業(yè)公司都能夠以更低的門檻去做開發(fā)。更加便宜且更容易私有化部署的R1,擊碎了華爾街對于所有大模型公司的估值邏輯。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

其次,DeepSeek的出現(xiàn)打破了AI應用圈原有的競爭枷鎖。就算是美國的頂尖應用公司選擇DeepSeek和ChatGPT時,答案也很清楚。Cursor、Perplexity這些AI領域的超級明星應用,都第一時間進行了DeepSeek模型的部署,而且設置了推薦第一優(yōu)先級。此外,Google、Amazon、NV等平臺也都部署了Deep-Seek模型。這些改變,同步影響了云服務的市場格局。國內(nèi)大量從事應用開發(fā)的企業(yè),在DeepSeek-R1出現(xiàn)之前不得不使用微軟云(為了便捷使用GPT-4的API);現(xiàn)在,使用阿里云上部署的Deep-Seek成為可選項。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

再其次,DeepSeek帶來了芯片封鎖邏輯的崩塌。DeepSeek在輝達CUDA生態(tài)的更底層(例如PTX層),通過微調(diào)底層代碼來優(yōu)化性能,從而解決“連接通信能力和調(diào)度能力被閹割”的問題。專家普遍認為,目前中美AI大模型領域的技術差距約為4個月。從技術能力發(fā)展的趨勢來看,這一差距繼續(xù)縮小的概率大于擴大的概率。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

最后,開源讓DeepSeek在輿論戰(zhàn)中至少“不落下風”。在AGI的道路上做出最強大的模型并開源,應該是OpenAI最早的初心和使命。市場永遠不會說謊,誰的模型能力強誰就能掌握最終的話語權。2024年12月DeepSeek V3發(fā)布的時候,國際主流媒體主要關注其“成本低廉”;當Deep-Seek-R1發(fā)布時,情況則截然不同,因為“滔天的流量”來了。作為一個開源模型,DeepSeek讓所有用戶在任何領域都增加了一個“頂尖專家”,免費且24小時隨時在線。YdN即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://www.020gz.com.cn/news-2-674-0.htmlDeepSeek成功的底層邏輯及產(chǎn)業(yè)影響

聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:中央網(wǎng)信辦部署推進2025年信息化重點工作

下一篇:小心AI伴侶背后的“溫柔陷阱”

為你推薦
1月22日,有網(wǎng)友發(fā)現(xiàn)國補后iPhone13 128G版本到手價格跌破3000元,降到歷史低價。記者在京東平臺上看到,iPhone13銷售頁面顯示,指定地區(qū)...
01-23
隨著操作人員在地面發(fā)出遙控指令,大載重無人機將除冰機器人準確放置于距離地面120米的架空地線上,并讓機器人沿著架空地線行走。在機器人前端震動錘...
01-24
    1月23日,大熊貓國家保護研究中心的兩大組成機構——中國大熊貓保護研究中心(簡稱熊貓中心...
01-24
  近日,省人力資源社會保障廳面向全省人社領域出臺若干措施,加強人社領域一攬子政策供給,用好吸納就業(yè)補...
02-14
  多地出現(xiàn)“俄羅斯商品館”被查,俄羅斯駐華大使館發(fā)聲  中新網(wǎng)1月19日電 俄羅斯駐華大使館微信公眾號近日發(fā)布公告稱,最近,中國一些城市出現(xiàn)了大量銷售俄羅斯食品的商店。...
01-21
  中新經(jīng)緯1月17日電 (林琬斯)近日,日本資生堂集團官網(wǎng)發(fā)布“價格調(diào)整通知”稱,自2025年4月17日(星期四)起,由于原材料成本上漲,資生堂將對部分產(chǎn)品價格進行調(diào)整。  通知顯...
01-21
[本站 新車上市] 1月10日,特斯拉Model Y煥新版價格公布,共推出2款配置,售價分別為26.35萬和30.35萬。煥新Model Y首發(fā)版不僅擁有首發(fā)版標識,包括尾門徽章、迎賓燈徽章投...
01-21
1 月 24 日消息,截至 2024 年 12 月 30 日,理想超充站上線超過 1600 站,其中高速理想超充站 714 座、理想城市超充站 895 座。然而,這距離年初公布的2000 站的建站目標...
01-25
《重癥外傷中心》一經(jīng)播出便迅速登上各大平臺的熱門榜單,吸引了眾多觀眾的關注。這部電視劇中,白江赫醫(yī)生在醫(yī)療事故后遭受誤解與危機的故事引起了廣泛討論。...
02-22
《我們的浪漫電影》播出后,在抖音、微博和B站等平臺上引起了廣泛討論,尤其是第2集的劇情介紹成為了觀眾們熱議的話題。今天我們就來聊聊這一集的內(nèi)容。高謙沒...
02-22
  進入冬季,全國多地甲流病例數(shù)量明顯增加。網(wǎng)絡相關詞條搜索量不斷上升,不少網(wǎng)友表示已不幸“中招”。近日,山東省相關部門聯(lián)合發(fā)布《冬春季呼吸道傳染病防治健康提示...
01-21
21世紀經(jīng)濟報道記者林昀肖 北京報道 近日,全國中成藥聯(lián)合采購辦公室發(fā)布第三批全國中成藥采購聯(lián)盟集中采購中選結果。此次中成藥集采由湖...
02-13
  大眾網(wǎng)記者 王一剛 報道  冬日風雅,大雪知寒。一年歲暮風雪始,寒冬用最純潔的底色醞釀世間最精彩的頌歌。  一、童言話大雪  孩子們對即將到來的“大雪”節(jié)氣充...
01-21
  大眾網(wǎng)記者 司心鵬 通訊員 邱文風 王琴 報道  12月5日,山東商業(yè)職業(yè)技術學院云計算技術與應用產(chǎn)業(yè)學院黨總支與浪潮軟件股份有限公司黨委開展了“黨建引領聚合力,雙...
01-21
  《科創(chuàng)板日報》1月14日訊(記者 余詩琪)時隔3年,微醫(yī)再次出現(xiàn)在港交所的IPO申請列表中。  這...
01-21
  即便是在周末前往新奧爾良觀看超級碗的路上,也不耽誤美國總統(tǒng)特朗普舞起新的關稅大棒,對鋼鐵...
02-13
雙魚座的男生通常都是浪漫而敏感的,當他們想念某個人時,會有一系列特別的行為和反應。下...
01-22
冷戰(zhàn)是一種常見的情感處理方式,但對于獅子男他們往往更難以忍受這種冷漠的態(tài)度。如果你...
01-22
花色襯衫如何搭配? 橘色襯衫怎么搭配?一、花色襯衫如何搭配?1、搭配一:深綠色花襯衫+灰藍色九分雪紡褲深綠色是比較顯氣質的顏色,這件深綠色花襯衫事復古的風格,下身搭配一條灰藍...
02-07
貴牛服飾品牌怎么樣? uc品牌女裝貴嗎?貴牛服飾品牌怎么樣?上海貴牛貿(mào)易有限公司成立于2013年, 總部設在廣東省經(jīng)濟、 文化、貿(mào)易中心城市---廣州市。是一家集生產(chǎn)、批發(fā)、銷售...
02-12
一場劉強東和王興的巔峰對決。美團將為騎手繳納社保新的一年,美團要為騎手創(chuàng)造更多的安全感。2月19日下午,美團宣布將為全職及穩(wěn)定兼職騎手繳納社保。目前,公司正在搭建騎手社...
02-20
2月20日消息,展辰集團董事、工業(yè)漆事業(yè)部總經(jīng)理張君一行近日到訪涂多多。國聯(lián)股份高級副總裁、涂多多CEO劉齋,涂多多高級副總裁、跨境產(chǎn)發(fā)部總經(jīng)理邵春生代表公司熱情接待來訪...
02-20
2月25日消息,京東集團宣布,鑒于目前外賣騎手的平均薪酬遠低于京東快遞小哥,為了薪酬公平性,未來一段時期簽約的外賣全職騎手繳納五險一金的所有成本,包含個人所需繳納部分,全部由...
02-25
2月24日消息,飛豬數(shù)據(jù)顯示,春運期間(1月14日-2月22日)出行的租車訂單量再創(chuàng)新高,同比去年增長超40%,其中90后和00后占比約六成。三亞、海口、成都、昆明、廣州等是春運期間租車消...
02-25
1月21日,藍思科技與智元機器人公司在長沙舉行了靈犀X1人形機器人套餐交付儀式,成功批量交付靈犀X1人形機器人相關產(chǎn)品。藍思科技深度參與了靈犀X1機器人的關節(jié)模組、DCU控...
01-23
2024年末,一位科技創(chuàng)業(yè)者火了。作者 | 王思琪來源 | 投資家(ID:touzijias)2024年末,一位科技創(chuàng)業(yè)者火了。2025年初,這位創(chuàng)業(yè)者再度爆火。近日,中國科技行業(yè)因一位85后年輕人現(xiàn)身《...
01-24
今日(1月26日),女性向視覺小說《Thesis of Love 心動論證》Steam頁面開放,2026年發(fā)售,游戲支持簡體中文,感興趣的玩家可以點擊此處進入商店頁面。 游戲介紹: 在千...
01-28
2月11日,開發(fā)商Tlon Industries發(fā)布了2D建造冒險游戲《Kentum》的Steam試玩Demo,該Demo允許玩家體驗游戲開始部分內(nèi)容,包括第一個區(qū)域、制作機器、裝飾基地等。 S...
02-11
據(jù)央視新聞報道,當?shù)貢r間2月1日,美國聯(lián)邦選舉委員會年底的備案文件顯示,埃隆·馬斯克在2024年美國大選中的花費超過了2.9億美元。馬斯克 資料圖(來源:環(huán)球網(wǎng))文件表明,馬斯克在年末...
02-02
“杯子快補貨”,“盲盒快補貨”……《哪吒之魔童鬧海》上映5天的票房已破27億,成為這個春節(jié)檔“一超多強”中的超級頭部影片,多個平臺的票房預測不斷上調(diào),最終票房有望在65億以...
02-02
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕

主站蜘蛛池模板: 亚洲午夜精品在线 | 欧美19禁| 四虎影视国产精品 | 视色4se在线视频播放 | 久久青青草原精品老司机 | 夜夜爱夜夜做夜夜爽 | www.99色| 爽好舒服老师快点 | 久久网站免费观看 | h视频欧美 | 亚洲免费色视频 | 在线观看你懂得 | 日本一本在线视频 | 天天爱天天做天天爽夜夜揉 | 六月婷婷在线视频 | 宅男666在线永久免费观看 | 久久全国免费久久青青小草 | 中文字幕欧美成人免费 | 波多野结衣在线视频观看 | 欧美大片一区 | 成人午夜亚洲影视在线观看 | 好吊日在线 | 国产一区二区高清在线 | 天天干天天操天天碰 | 老师下面好湿好紧好滑好想要 | 亚洲国产日韩女人aaaaaa毛片在线 | 美女扒开尿囗给男人玩的动图 | 免费特黄一区二区三区视频一 | 久久久xxx| 国产男人女人做性全过程视频 | 久久涩精品 | 成人爽a毛片在线视频 | 人与性www | 2021最新国产成人精品视频 | 你懂的手机在线视频 | 美女视频黄a全部免费看小说 | 可以免费播放的在线视频 | 黄色网址中文字幕 | 天天干夜夜拍 | 国内精品久久影视 | 一区二区三区四区视频在线 |