日本高清中文字幕一区二区三区a-日本高清专区一区二无线-日本高新1区2区3区-日本国产亚洲-操操操综合网-操操久久

昆侖萬維開源R1V視覺思維鏈推理模型,開啟多模態思考新時代

1個月前 來源:財經網 觀看:7

3月18日,昆侖萬維正式開源首款工業界多模態思維鏈推理模型Skywork R1V,即日起開源模型權重和技術報告。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

1k0w即熱新聞——關注每天科技社會生活新變化gihot.com

開啟多模態思考新時代k0w即熱新聞——關注每天科技社會生活新變化gihot.com

繼OpenAI o1和DeepSeek-R1在全球掀起長思考模型熱潮后,大模型進入新技術范式。昆侖萬維秉持實現 AGI 的初心,積極貢獻開源社區,正式開源Skywork R1V多模態視覺推理模型,成為中國第一個開源「多模態推理模型」的企業。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

什么是視覺推理模型?k0w即熱新聞——關注每天科技社會生活新變化gihot.com

視覺推理模型是一類能夠解決需要思維鏈(Chain-of-Thought)的視覺任務的模型,通過對視覺信息進行多步邏輯推理與分析,逐步推導出最終結果。這種模型不僅關注圖像內容的識別與理解,更強調通過層層遞進的推理路徑,實現復雜視覺問題的精準求解,例如視覺邏輯推理、視覺數學問題、圖像中的科學現象分析、醫學影像的診斷推理等,從而有效拓展了視覺大模型的應用邊界。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

無論是日常繁瑣的工作任務、復雜的數據分析、難以解答的學術問題,還是前所未見的陌生場景,都可以交給Skywork R1V進行高效處理。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

快速體驗下來,R1V的視覺理解和推理能力雙雙在線。這樣的模型能力是如何煉成的呢?k0w即熱新聞——關注每天科技社會生活新變化gihot.com

強大推理能力,刷新跨模態任務新高度k0w即熱新聞——關注每天科技社會生活新變化gihot.com

在Reasoning推理能力方面,Skywork R1V實現了模型的頂尖邏輯推理與數學分析能力。在權威的MATH500和AIME基準測試中,Skywork R1V分別取得了94.0和72.0的高分,明顯領先于行業內眾多主流模型。Skywork R1V在純文本復雜推理任務中展現出卓越性能,使其在邏輯推理和數學問題求解領域展現出人類專家級別的水準。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

在Vision視覺理解能力方面,Skywork R1V成功地將其強大的文本推理與思維鏈推導能力高效遷移到視覺任務中。憑借創新的跨模態遷移技術與推理優化框架,Skywork R1V能夠高效解決需要多步視覺推理的問題,在MMMU與MathVista等視覺推理基準中分別取得了69和67.5的優異成績。這些結果不僅明顯超越了多個近似大小的開源競爭模型,更達到與規模更大的閉源模型媲美的水準,充分證實了Skywork R1V在需要視覺思維鏈推理的跨模態任務中的領先優勢。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

Skywork R1V通過視覺與文本能力的深度融合和視覺思維鏈推理能力的突破,推動了多模態推理模型的進一步發展,標志著人工智能領域的又一重大進步。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

目前,Skywork R1V已全面開源,期望助力全球范圍內更多視覺推理任務的學術研究與產業應用探索。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

和開源同規模或更大規模模型的對比,Skywork R1V 38B體現出行業顯著優異的推理能力,以及領先的多模態視覺理解能力。如下圖,與開源同規模或更大規模模型的對比:k0w即熱新聞——關注每天科技社會生活新變化gihot.com

2k0w即熱新聞——關注每天科技社會生活新變化gihot.com

與閉源頭部模型性能對比,R1V 38B模型性能媲美甚至超越更大開源模型以及主流閉源模型。如下圖,與開源大尺寸模型與閉源專有模型的對比:k0w即熱新聞——關注每天科技社會生活新變化gihot.com

3k0w即熱新聞——關注每天科技社會生活新變化gihot.com

三大核心技術創新,引領視覺推理新突破k0w即熱新聞——關注每天科技社會生活新變化gihot.com

Skywork R1V能夠達到當前的性能高度,依賴于以下三項關鍵技術創新:k0w即熱新聞——關注每天科技社會生活新變化gihot.com

1、文本推理能力的多模態高效遷移k0w即熱新聞——關注每天科技社會生活新變化gihot.com

昆侖萬維團隊首次提出利用Skywork-VL的視覺投影器,無需重新訓練語言模型和視覺編碼器,即可實現文本推理能力的高效遷移到視覺任務,同時保留了優秀的原本推理文本能力(AIME 72.0,MATH500 94.0)。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

2、多模態混合式訓練(IterativeSFT+GRPO)k0w即熱新聞——關注每天科技社會生活新變化gihot.com

通過結合迭代監督微調(Iterative SFT)和GRPO強化學習,分階段對齊視覺-文本表征,實現跨模態任務的高效融合,極大提升跨模態任務的表現。推動模型在MMMU基準達到69分的能力,同時在MathVista達到67.5分,與更大規模的閉源模型基本持平。通過反復迭代地利用高質量數據與高難度數據的組合,實現模型持續的知識鞏固與錯誤糾正,顯著提升了多模態推理的精度與泛化性能。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

圖丨多模態混合式訓練(來源:Skywork R1V技術報告)k0w即熱新聞——關注每天科技社會生活新變化gihot.com

圖丨多模態混合式訓練(來源:Skywork R1V技術報告)k0w即熱新聞——關注每天科技社會生活新變化gihot.com

3、自適應長度思維鏈蒸餾k0w即熱新聞——關注每天科技社會生活新變化gihot.com

團隊提出了一種基于視覺-文本復雜度的自適應推理鏈長度控制機制,動態優化模型推理過程,避免模型“過度思考”,提升推理效率。結合多階段自蒸餾策略,進一步提升了數據生成與推理過程的質量,促進了模型在復雜多模態任務中的表現。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

圖丨自適應長度思維鏈蒸餾(來源:Skywork R1V技術報告)k0w即熱新聞——關注每天科技社會生活新變化gihot.com

圖丨自適應長度思維鏈蒸餾(來源:Skywork R1V技術報告)k0w即熱新聞——關注每天科技社會生活新變化gihot.com

Skywork R1V在訓練過程中創新性地采用了三階段方法,使得文本端強大的推理能力得以高效遷移至視覺任務上,具體訓練流程如下:k0w即熱新聞——關注每天科技社會生活新變化gihot.com

1、STEP1 視覺語言表征的初始對齊k0w即熱新聞——關注每天科技社會生活新變化gihot.com

訓練時首先使用輕量級的視覺適配器(MLP)連接視覺編碼器(ViT)與語言模型,在已有的200萬條常規多模態數據上進行訓練,使得MLP初步學習如何將圖像特征映射至語言空間。這一階段僅訓練MLP適配器,視覺編碼器和語言模型參數保持凍結不變,快速、高效地實現視覺與語言表征的初步對齊。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

2、STEP2 推理能力遷移k0w即熱新聞——關注每天科技社會生活新變化gihot.com

利用第一階段訓練好的MLP適配器,直接將視覺編碼器與原始的強推理語言模型(R1-distilled-Qwen-32B)連接,形成Skywork-R1V視覺推理模型。雖然此時語言模型的參數發生了改變,但得益于語言模型架構的高度相似性和MLP的泛化能力,重新組裝后的模型已能表現出一定的視覺推理能力,初始性能即達到業內同等規模的先進水平。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

3、STEP3 視覺與文本模態精準對齊k0w即熱新聞——關注每天科技社會生活新變化gihot.com

最后,采用創新的“混合優化框架”,進一步精準對齊視覺和語言模態的表征。這一階段分為兩大步驟:迭代監督微調(Iterative SFT)和群組相對策略優化(GRPO)強化學習。在整個訓練過程中,Skywork-R1V還創新性地引入了“自適應長度思維鏈蒸餾技術”,動態優化推理鏈長度,防止模型過度思考,從而提升了推理效率和質量。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

通過以上的訓練策略,Skywork R1V在視覺推理任務上取得突破性進展,并在多個公開評測基準中達到或超過了現有領先模型的性能。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

此外,Skywork團隊多模態理解模型也在進行"全面貫通"的進化,將視覺多模態擴展為全模態模型,引入語音理解能力。當前,全模態模型往往受限于特定領域不僅需要獨立訓練多個專業模型,更面臨跨模態協同的算力挑戰。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

基于R1V模型,Skywork團隊設計了一種靈活在R1V中擴展語音理解模態的方式,從而實現一個全模態思考大模型,該在單個模型中同時實現圖像、視頻、語音的全模態理解能力,并在語音和視覺理解評測中斬獲多項SOTA成績。我們將陸續公布測評成績、開源全模態思考大模型。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

持續開源回饋社區,堅定邁向AGIk0w即熱新聞——關注每天科技社會生活新變化gihot.com

2023年10月以來,昆侖萬維陸續開源了百億級大語言模型「天工」Skywork-13B系列、數字智能體全流程研發工具包AgentStudio、4000億參數MoE超級模型、2千億稀疏大模型Skywork-MoE、推理模型Skywork-o1-Open等。2025年2月18日,昆侖萬維同時將SOTA級別的SkyReels-V1和SkyReels-A1進行開源。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

在語言生成模型、AI Agent、推理模型、視頻生成模型等相繼開源、多點開花之后,我們正式開源Skywork R1V多模態推理模型,在文本-視覺多模態推理方向再下一城,成為中國第一家開源多模態思考模型的企業。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

中國企業過去一年在AI領域的開源貢獻,讓全世界AI從業者和開發者享受到了技術共享帶來的普惠發展。DeepSeek的開源為AI行業提供了新的發展范本,多項開源成果顯著降低了AI技術的應用門檻、促進全球AI技術的民主化。昆侖萬維作為中國AI領軍企業,我們將持續開源優秀的模型、數據集等,共建開發者生態、加速技術創新、降低應用門檻、推動技術平權和AI行業發展。k0w即熱新聞——關注每天科技社會生活新變化gihot.com

此文內容為企業供稿,僅供參考。k0w即熱新聞——關注每天科技社會生活新變化gihot.com


k0w即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://www.020gz.com.cn/news-14-7857-0.html昆侖萬維開源R1V視覺思維鏈推理模型,開啟多模態思考新時代

聲明:本網頁內容由互聯網博主自發貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。

上一篇:甜啦啦獲評2025年度特色茶飲十大品牌

下一篇:百利好:國際金價持續大漲后續走勢會怎樣?

為你推薦
彌助是《刺客信條:影》雙主角之一,他違背了系列的一個重要傳統——他不是刺客,也沒有刺客通常擁有的能力,比如潛行或暗殺。 近日《刺客信條:影》副總監Simon Lemay...
01-27
RTX 50系列顯卡極度缺貨,但第一批搶到的也不完全是幸運兒,網上已經有多起RTX 5090D/5090變磚的反饋,普遍和最新驅動有關,但目前尚無權威說法和官方回應,還得等后續...
02-06
極目新聞通訊員 李璐“太感謝你們了!這么短的時間,就幫我找回了背包,為我解決了大麻煩!”1月31日上午,張先生來到湖北棗陽市公安局北城派出所領回自己失而復得的背包,緊緊握住民警...
02-02
當地時間2月6日,美國華盛頓州聯邦法官約翰·考根諾爾作出裁決,阻止美國總統特朗普此前發布的廢除“出生公民權”行政令生效。這是兩天內,美國聯邦法官第二次對該行政令采取禁令...
02-07
荷蘭特文特大學科學家開發出一種新工藝,能在室溫下制造出晶體結構高度有序的半導體材料。他們表示,通過精準控制這種半導體材料的晶體結構,大幅降低了...
01-21
1月20日有消息稱,據榮耀內部公告,榮耀中國區CMO姜海榮將辭去相關職務。據悉,姜海榮曾在華為與榮耀工作超過20年,歷任研發、市場等工作...
01-21
  遼寧省氣象臺2月10日16時發布大風藍色預警:  預計11日白天,沈陽、大連、鞍山北部、撫順、錦州、阜...
02-11
今年省(中)直部門涉企行政檢查內容較去年壓縮11%同時推行“掃碼入企”機制,確保檢查過程透明可追溯  日...
02-14
  中新經緯1月20日電 “最高人民檢察院”微信號20日消息,中國電子科技集團有限公司原黨組成員、副總經理何文忠涉嫌受賄一案,由國家監察委員會調查終結,經最高人民檢察院指定...
01-21
  中新經緯1月18日電 近日,博通分析(咨詢分析機構)發布了《非銀支付行業企業數字化服務專題分析2024》(下稱“報告”),中新經緯研究院受權發布。  ↓↓報告摘編如下↓↓ ...
01-21
剛過去的2024年,吉利銀河以驚人的銷量增速引起業界廣泛關注,全年銷量突破49.4萬輛,同比增長約80%,幾乎達到2023年的兩倍。2025年剛開年,在1月第二周的銷量排行榜上,吉利銀河已在多...
01-21
2 月 4 日消息,賽力斯集團剛剛發布了最新的 2025 年 1 月份產銷快報。匯總主要數據如下:賽力斯汽車 1 月產量 17513 輛,同比減少 44.88%;1 月銷量 16432 輛,同比減少 47....
02-04
  作者:陳亦水  2025年春節檔,注定要在中國影史上留下濃墨重彩的一筆,不僅創下多項票房歷史紀...
02-20
  1、《難哄》向朗喜歡溫以凡,他對溫以凡不僅僅是青梅竹馬之誼,還有漫長的暗戀。  2、當年向朗出國之前本想送溫以凡貴重的手鏈跟她表明心意的,但恰好當時是喬喬的生日,手...
02-22
  即將告別春節假期,你有沒有不想上班、不想上學、不想起床?從“假期模式”切換到“工作模式”還不太適應?如何調整?指南請收好↓↓↓  01  什么是“節后綜合征”? ...
02-07
21世紀經濟報道記者 韓利明 上海報道2025年作為“十四五”規劃收官之年,正風肅紀反腐走向縱深。醫藥行業因資金鏈長、權力集中、利潤空間大...
02-09
  大眾網記者 張明明 報道  11月11日至14日,由教育部高等教育司指導、中國高等教育學會主辦的第四屆全國高校教師教學創新大賽產教融合賽道全國賽在重慶郵電大學舉行...
01-21
2025年1月18日至19日,由東北新聞網主辦的“名班主任工作室對標對表結項書撰寫指導與成果孵化”培訓會在...
01-21
  中央經濟工作會議提出,要穩妥處置地方中小金融機構風險。近期金融監管總局召開的年度監管工...
01-23
  進入2025年以來,省聯社改革駛向“快車道”。  1月20日,國家金融監督管理總局披露的批復顯示...
01-23
金牛座的男生通常被認為是穩重、務實和可靠的人。他們對于過日子非常重視,因此選擇伴侶...
01-22
獅子座是十二星座中最具有領導力和自信心的一個星座。當他們愛上一個人時,會展現出一系...
01-22
布魯克鳥男士服飾品牌?布魯克鳥男士服飾品牌?作為一名有品位的中年男性,一定聽說過布魯克鳥男裝。相比外國品牌,布魯克鳥作為中國本體時裝品牌,旗下的服裝以中國人體型為標準打造...
02-07
170偏瘦男生穿搭? 170斤的男生穿搭?一、170偏瘦男生穿搭?建議以合身的休閑套裝為主。大家都知道,男生身高170厘米,是屬于中等身材,標準體重在120斤左右。如果這個男生偏瘦,則建議日...
02-17
2月15日消息,年宵花銷售熱潮剛過,春節后的鮮花市場又迎來消費高峰。在盒馬各大門店,2月熱門的玫瑰花以及各種時令鮮花早早陳列到位,桃花、櫻花、玉蘭等鮮切枝含苞待放。延續了春...
02-15
1.阿里開放數百AI招聘崗位阿里的野心徹底暴露了,其正以前所未有的力度搶占人才高地,全面加速在AI To C領域的布局步伐。近期,阿里AI To C業務開啟大規模人員招聘,開放招聘崗位達...
02-20
算法透明化,騎手跑的明明白白。1、美團成立算法顧問委員會,保障騎手權益近幾年,美團的騎手大軍數量增勢訊猛。美團研究院數據披露,2023年美團騎手已經攀升至745萬人,比2022年多了...
02-08
3月3日,美的發布了DeepSeek智能空調——美的鮮凈感空氣機T6,宣稱“邁入空氣思考時代”。據現場體驗視頻,當廚房TVOC超標時,系統會快速...
03-05
近年來,智能門鎖已然成為智能家居領域的熱門單品。然而,隨著智能鎖技術的快速迭代,老款產品逐漸難以滿足人們日益增長的生活需求。眾多用戶雖有強烈的換新意愿,卻在這一過程中遭...
01-21
全球性金融券商集團英國EBC Group平臺始終致力于以領先生態,與全球交易者共塑交易的未來。 自第一屆交易大賽起,為赤忱的熱愛和卓越的才華提供舞臺,在全球內尋找交易好手以賦能...
01-24
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕

主站蜘蛛池模板: 曰本女人一级毛片看一级毛 | 天天爱天天做天天爽夜夜揉 | 亚洲网站一区 | 国产在线一区二区三区四区 | 久久一卡二卡 | 中国成人免费视频 | 国产伦精品一区二区三区 | 成人影院免费观看 | 免费一级毛片无毒不卡 | 97视频免费上传播放 | 一级一片免费播放 | 天天操天天干天天透 | 黄色高清视频网站 | 天堂bt资源新版在线 | 日本卡一卡2卡3卡4精品卡无人区 | 奇米影视四色7777久久精品 | 欧美三级日韩三级 | 欧美黑人性受xxxx精品 | 日本一区二区三区在线观看视频 | 婷婷久久精品 | 天天操伊人 | 国产大片免费观看资源 | 男人性天堂 | 久草资源在线播放 | 午夜免费视频观看在线播放 | 黄网站色在线视频免费观看 | 欧美另类videos | 黄色精品视频 | 成年大片免费播放视频人 | 91精品日本久久久久久牛牛 | 成人亚洲欧美综合 | 亚洲免费网站 | 在线另类 | 欧美成人免费大片888 | 日本高清黄色 | 中国成熟xxx视频 | 直接黄91麻豆网站 | 狠狠色狠狠色综合日日不卡 | 天堂在线中文 | 天天干天天夜 | 日本免费黄色小视频 |