2025年全國兩會期間,“人工智能”成為被頻繁提及和討論的熱門話題。全國人大代表、中國工程院院士、鵬城實驗室主任高文今年也提出了關于加快打造“人工智能先鋒城市”等建議。2025年年初,杭州深度求索公司發布的DeepSeek-R1大語言模型引發全球轟動,它的性能比肩國際頂尖模型,但開發成本僅為同類產品的三十分之一。鵬城實驗室已在開源社區上線DeepSeek系列模型,供國內開發者測試驗證。
記者:DeepSeek的出現給你帶來什么影響?
高文:我覺得會把整個領域的應用提早很多年,原來像ChatGPT、LLaMA、谷歌或者Facebook的大模型,要頭部企業有足夠的資源、算力、人才、數據,才能把這個東西做出來。現在國外人工智能的應用,主要都是在幾個大廠手里,像微軟、谷歌等。DeepSeek出來就不一樣了,一下就把這個應用平民化了,不是說只有少數頭部企業,或者頂級玩家才玩得動,所有的初創企業都玩得動,這是它最大的貢獻。
DeepSeek的出現,引發一系列連鎖反應,應用門檻的降低,刺激更多的需求被釋放,導致全社會對算力的需求出現激增。如果把人工智能比作“智能汽車”,那么“算力”就是驅動它奔跑的“汽油”。唯有算力供給充足,人工智能才能得到充分的發展。
記者:如果從對算力的需求是增加的這個角度來看,你這個實驗室接下來的計劃和以前相比會有什么變化?
高文:開始沒有預料到會有這么快的需求,但現在我們要快速調整了。有很多工作要提前了。
高文領導的鵬城實驗室是中央批準成立的網絡通信領域新型科研機構,主要任務之一就是圍繞“東數西算”“數字中國”“全國一體化算力網”等國家重大戰略,牽頭推進“中國算力網”的研發與建設。
記者:你做的中國算力網的建設,要解決的是什么問題?
高文:希望能夠實現讓用戶像用電一樣使用算力,需要的話你就可以去購買,而且哪里的算力最便宜,你就購買哪里的算力。
這里所說的算力特指專門為AI訓練設計的智能算力,不同于普通電腦的算力,它需要成千上萬顆專用芯片協同工作,同時也需要基礎設施的投入和能源的支持。
“東數西算”工程希望把東部需要計算的數據送到西部數據中心處理、結算和存儲,中國算力網建設的初衷,就是將散布在全國各地的計算資源進行整合,包括超級計算中心、數據中心、云計算平臺等,形成一個統一的算力資源池,構建資源方便接入、任務統一調度且具有可持續發展運營模式和機制的數字經濟基礎設施,從而推動國內自主算力資源邁入“全民共享”的時代。
記者:千行百業都在應用,對算力會有影響嗎?
高文:應該是比以前的需求更大了。
記者:需求很大,你能不能跟得上人家的需求呢?
高文:社會對算力的投入還是蠻大的,那當然可能就不太平衡,有的算力投完了以后,使用效率比較高,有的可能使用效率比較低,水平參差不齊。我們希望通過算力網,能夠把整個投入的資源利用率提高上來,其實這個也和當初的電力網思路非常相近。當時電力開始都是自己一個工廠給自己生產用,后來發現居民也需要用電,其他的事業單位也需要用電,所以到處在建電廠。有的地方可能建了也不夠用,有的可能建了就多了,那多了怎么辦呢,通過網絡把多余的電賣出去,算力網其實也是希望走類似的這條路。
我們現在就是要給這些算力建國家高速公路,首先用新的技術把它建起來,同時希望引入一些新的管理模式,不是常規那種通信的管理模式,用一些比如數據關聯,現在我們也正在和國家數據局在一起溝通,用一種新的模式。
算力網的建設包含三個核心要素:大規模核心算力、超級光網絡和算力調度系統。它的理想圖景是當我們需要用算力時,只需插上插頭,不用關心算力來自哪里,也無需自己比價,系統會自動匹配性價比最高的算力中心。這種模式不僅能提升現有算力資源利用率,還能避免各地重復建設造成的浪費。
記者:如果我們各方面哪怕有一點跟不上的話,可能在AI的競爭上面就會落后,現在是這種局面嗎?
高文:是,因為這是一個系統性的。
記者:你現在會焦急嗎?
高文:應該不會,技術上其實我們還是蠻自信的,按部就班地往前走,還是非常自信的,當然我們也希望拿到最好的東西,比如最好工藝的東西,最好軟件的東西,包括機器也是最快的,世界上最領先的。但是現在卡了以后,我們就只能比如用集成的技術去做出最好的設備來。
由于算力網中的計算任務可能涉及科學研究、國防、金融等關鍵領域,防止數據泄露和網絡攻擊成為算力網建設和運營中的重要任務。鵬城實驗室有專門的團隊致力于網絡安全技術的科研與應用。不久前剛結束的第九屆亞洲冬季運動會,鵬城實驗室參與了亞冬會的網絡安全保障。
記者:要保護什么?
高文:很多的管理都是在網上管的。一旦這個系統被攻擊,癱瘓了,整個就全部癱瘓了。
記者:這種被攻擊的風險是想象出來的,還是現實世界中真實存在的?
高文:現實世界中存在的,有的是屬于惡意的,就是要讓你難堪。還有很多黑客,是為了顯示我厲害,就是我能攻進去,我能把你搞癱瘓了。這兩類性質都有。
記者:在網絡上保障安全,一些商業化的公司,甚至都可以去做,那為什么你要去做?
高文:遇到很難的問題,需要團隊實力非常強,有一些商業公司,它不見得解決得了。
記者:它的難點是在哪兒?
高文:常規的那些公司用的一般方法,比如上一個工具程序,從頭到尾把數據掃一遍,看看里面有沒有異常。但是通常高手不會讓你找到,所以可能就需要技術更專業一點,我們這個團隊有很多工具,看響應是什么,根據這個再來分析,可能會有蛛絲馬跡,最后把東西挖出來。
2022年,“中國算力網”一期工程“智算網絡”正式上線。它連接并管理了20多個不同地域、不同類型的算力中心,匯聚算力規模逐步增加到5E Flops,相當于每秒完成5萬億億次計算。其算力樞紐節點之一,就是鵬程實驗室的人工智能算力平臺“鵬城云腦Ⅱ”。
高文:你從這看過去,這是八行,八行其實就相當于是四臺機器,每兩行是一臺機器。
記者:你那它的耗電量大不大?
高文:不小,每個月可能都要一兩百萬的電費。
“鵬城云腦Ⅱ”是鵬城實驗室與相關企業聯合研發的超級智能計算機,峰值算力達到每秒完成100億億次計算,于2020年啟動運行。它比每秒能完成100千萬億次計算的“鵬城云腦Ⅰ”,計算能力強了10倍,而完成這次升級,僅用了一年時間。
記者:只用了一年提高了10倍?發生了什么?
高文:我們做“鵬城云腦I”的時候,那時候還是做判別式人工智能,通常它需要的算力沒有那么大,100P其實已經可以滿足需要了。通常我們會預判,對語言模型需要的計算和存儲的能力,會比圖像的應該要求更高一些,因為語言的語料更容易獲得,可能語言處理需要的處理能力更強,所以要比做圖像大10倍。
目前,“鵬城云腦Ⅱ”已在衡量全球高性能平臺數據吞吐能力的IO500總榜單上連續9次取得冠軍,同時在國際人工智能算力性能AIPerf500排行榜上連續4屆排名第一。基于“鵬城云腦Ⅱ”,鵬城實驗室搭建了一個AI訓練平臺,能夠同時處理包含上千億參數的超大規模AI模型。“鵬城·腦海”就是鵬城實驗室在“鵬城云腦Ⅱ”上訓練和運行的一個超大規模自然語言處理模型。
記者:為什么腦海沒跑出來,DeepSeek跑出來了?
高文:倒不是說我們腦海不行,其實這個就是DeepSeek很聰明的地方,腦海和ChatGPT完全是同樣的技術,它里面有一個模型叫注意力機制,像以前比如一篇文章,進到計算機里面,你讓它處理,等處理到最后,前面的已經忘了。但是GPT就是Transformer,發明了一種方式,叫注意力機制,或者叫注意力模型,就是我只注意相關的,其他東西我就不管了,抓大放小。
原來的GPT是一個大包,所有的功能都在里面,所以用的時候就很累。DeepSeek就做了這樣一件事,他把特定領域用特定的表述去訓練它,這樣訓練的時候,開銷就沒那么大。它一共有256個專家,使用的時候不需要256個都裝,最多裝8個就夠了,這樣用的時候,需要的成本很低,訓練的時間可以節省。DeepSeek我認為它不是理論上的創新,它更多是工程上。
目前,“鵬城·腦海”大模型的兩個版本已向社會開源。高文和團隊希望通過模型訓練全流程開源開放的方式,將“鵬城·腦海”培育為中國算力網上的一個種子應用。
記者:你是最底層的這個源代碼開源還是參數開源?
高文:其實兩層都有,我們是把所有參數,我們叫切片,就是它在訓練過程中,我每隔多長時間,我就開一個切片,研究者可以通過這個切片,去研究它在訓練的過程中,它是怎么受訓練的,中間有什么變化。另外我們源代碼也開源,源代碼開源以后,基本上用戶其實拿著這個源代碼,用他自己的數據就可以重新再去訓練。
記者:那你付出所有的人、精力、資金,等于是你做了別人得益,可以這樣理解嗎?
高文:但是開源不僅僅是別人得益的問題。我開源了以后,別人在我這開源的東西,他也要開源,他開源以后,會使原來我的系統做得更好,然后我們會在所有開源的東西之上,再往上迭代,眾人拾柴火焰高,所有參與的人都在添柴,都在加火。
培育出“鵬城·腦海”的算力平臺“鵬城云腦Ⅱ”同樣秉持開放理念。“鵬城云腦Ⅱ”算力的50%是鵬城實驗室自研使用,40%開放提供給國內的合作伙伴、科研機構和高校,10%則釋放給深圳市工業和信息化局,供社會開發者申請使用。在人工智能浪潮中,開源與開放精神正在成為業界共識。
記者:開源就意味著共享,對吧?共享和競爭矛盾不矛盾?
高文:其實從開源的角度,技術是不是自己的沒關系,因為你就在那上面迭代。為什么現在OpenAI比較難受,因為它是閉源的,閉源就是別人只能求他,要和他簽協議,他同意才行,他不同意就不行。
高文:這是整個生態的兩條技術路線,這個生態早期都是閉源的,因為有版權,實際上是保護你這個軟件的權利的。但是后來Linux(操作系統)是第一個把軟件開源的,他的理念是這個東西是人類的資產,我把它放出來,但是我要求所有用這個軟件的人,在上面做開發的人,你要給我一個承諾,就是我開源了,你要新做的東西你也要開源。
我個人理解就是開源可能更符合人類社會發展的方向,這和知識是一樣的,以前那些手藝人、工匠,很多東西是代代相傳的,萬一哪一輩沒傳好就失傳了,那后來為什么我們現在學的知識,每個人都可以學,因為這個東西開源了,知識就是開源的。
其實軟件也一樣,如果軟件也變成知識,那你就應該開源,開源以后才能迭代。
“鵬城云腦Ⅱ”平穩運行的同時,高文已經開始著眼新的問題。目前,他正帶領團隊聯合相關企業研發下一代超級智能計算機“鵬城云腦Ⅲ”,智能算力規模目標為每秒完成1600億億次計算,能力比“鵬城云腦Ⅱ”提升16倍。
記者:這個云腦Ⅲ未來可以做什么事?
高文:可以做多模態大模型的訓練和使用,現在大語言模型的智能只是語言智能,其他智能還比較弱一點。所謂多模態模型,就是除了語言之外,我要把聲音、視覺和語言都摻雜在一起,然后去訓練,這樣整個智能的水平,就和人慢慢比較接近了。我們也希望通過我們這臺機器的建設,對國內的生態有所幫助。
整個機器還沒出來,但是我們的原型機已經出來了。我們整個機器是157個機柜,但是我們現在已經做了3個機柜了,這些模型已經在這3個機柜上的原型機上面做訓練,國家給我們的使命,是要去攻一個山頭,就是要爬一個高峰,這個高峰肯定是別人都沒有上去過的,所以你要先上去。
本文鏈接:http://www.020gz.com.cn/news-4-3988-0.html從“西電東送”到“東數西算” 他們為AI發展打造“高速公路”
聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕