|
查看: 185|回复: 5
|
DeepSeek又有重磅消息?梁文鋒論文曝新技術「突破GPU記憶體限制」
[复制链接]
|
|
|
1月12日晚間,中國人工智慧(AI)初創公司DeepSeek創始人梁文鋒與北京大學研究人員共同署名發表了一篇技術論文,提出了一種新的模型訓練技術。他們表示,該技術可以通過繞過圖形處理單元(GPU)記憶體限制,實現「參數的積極擴展」。觀察者網報導了前述訊息,隨後引發關注。
香港《南華早報》1月13日報導指出,此舉凸顯了DeepSeek在算力相對美國行業領先企業存在差距的情況下,持續專注於最大限度地提高成本效率。與此同時,外界猜測該公司將在今年春節之前發佈一款重要的新模型。
報導稱,這篇技術含量極高的論文將受到中國和美國業內人士的廣泛關注,他們希望從中瞭解DeepSeek所取得的最新進展。在過去一年中,DeepSeek一直是中國AI領域創新的典範。
|
|
|
|
|
|
|
|
|
|
|
发表于 15-1-2026 09:54 AM
|
显示全部楼层
|
DEEPSEEK一炮而红后现在已经被晒在一旁,评价也越来越低 |
|
|
|
|
|
|
|
|
|
|
发表于 15-1-2026 10:01 AM
|
显示全部楼层
本帖最后由 lcw9988 于 15-1-2026 10:03 AM 编辑
一年吹一次都没人屌它 DEEPSHIT了 ! 
和 GEMINI, CHATGPT, GROK, Anthropic . . . 差距太大了
|
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 15-1-2026 01:18 PM
|
显示全部楼层
DeepSeek一周年 陸美AI跑出兩條非常不同的主航道
大陸《環球時報》15日報導,路透近日報導稱,大陸人工智慧(AI)初創公司深度求索(DeepSeek)預計2月中旬推出下一代人工智慧模型V4,該模型具有強大編碼能力,表現可能優於美國人工智慧公司Anthropic旗下大模型Claude和美國初創公司OpenAI的GPT系列等競爭對手。一年前,DeepSeek發布大模型R1,英國廣播公司(BBC)形容「DeepSeek向世界展示了大陸人工智慧領域的競爭力」,當時距離OpenAI推出ChatGPT也已兩年。大陸專家學者表示,2025一年時間,大陸縮小與美國在人工智慧領域差距,將一歲的DeepSeek和三歲的ChatGPT作為「時代切片」,能清晰看到陸美站在不同航道。
《環時》報導,「過去一年,中美大模型跑出了兩條非常不同的主航道。」北京清華大學新聞與傳播學院、人工智慧學院雙聘教授沈陽稱,美國走的是「前沿能力持續拉高+閉源模型+平台化產品」路線,把最強模型不斷封裝成ChatGPT這樣的超級入口,再向企業、行業和合規體系外溢,目標不是單點智慧,而是把智慧變成一種可控、可收費、可治理的基礎設施。
而大陸走的則是另一條路,「開源權重+極致工程效率+快速產業擴散」。大陸不追求長期壟斷最強模型,而是把「足夠強的能力」盡快做成可複製、可落地的工程資產,讓智慧迅速進入真實業務系統。
「如果用兩個產品來做時代切片,三歲的ChatGPT代表的是『把AI變成全球統一工作介面』的能力躍遷。」沈陽認為,美國企業追求的突破不只是模型更聰明,而是把模型嵌入到工具、流程、組織和商業結構中。而一歲的DeepSeek代表的是大陸AI路徑的成熟樣本:通過開源和工程體系,把強推理能力迅速擴散到產業側,讓「用得起、改得動、跑得快」成為核心競爭力。
瀋陽分析,如果只看「最強模型的前沿能力」,美國仍領先,但已經不是代際差,更多是數月到一年級別;如果看「工程效率、成本和落地速度」,大陸幾乎沒有時間差,局部甚至更快;如果看「產品平台、生態與規則制定」,美國依然領先一到兩年。
《環時》報導,剛赴美國拉斯維加斯參加國際消費類電子產品展(CES)的AI博主李尚龍形容,美國生活像兩條河,一條已進入AI時代,另一條還在慢慢被滲透,「我在矽谷的體感非常強:幾乎你在咖啡廳隨便看一圈,很多人打開的就是AI、ChatGPT,討論的也是模型、產品、創業和效率。但同時,你走出矽谷,很多普通人的生活又沒那麼AI化。」從矽谷回國創業的李尚龍稱,「我的判斷是,AI不會一夜改變美國,但會每天悄悄改變一部分人的生活方式」。
長期關注中美AI發展情況的美國東北大學教授李向明描述,美國民眾生活中AI含量非常大,但主要是在「軟處」,從演算法驅動的流媒體推薦、保險定價、導航預測到ChatGPT等大模型辦公滲透,AI已是基礎設施。但在「硬處」(物理硬體)的普及方面尚在爆發前夜。
而在上述CES上,李向明發現,大陸產品「工程落地速度」和「供應鏈完整度」令人震撼。大陸企業在雷射雷達、高能量密度電池和高性價比電機組件上幾乎占半壁江山。大陸機器人不僅反覆運算快,而且具備大規模量產的潛力和極強的成本優勢,這是推動機器人進入全球家庭的關鍵。在美國,AGI(通用人工智慧,指AI能夠理解或學習人類能夠執行的任何智力任務)賦予機器人大腦,而大陸製造正在為它鍛造最強壯且普惠的AI身體,尤其是人形機器人廣泛應用。
「追求模型性能的提升,是所有做基礎模型公司的目標。」阿里方面指出,在大陸,模型應用落地豐富,發展迅速,是大陸AI的獨到優勢之一。
一家大模型初創企業負責人告訴《環球時報》記者,團隊仍在發力研究“長思考、代碼能力、多模態”的大模型。“2025年,AI改變最大的地方就是寫代碼,未來資訊接收創造和處理會更多地被AI替代。”該負責人告訴記者,目前團隊正在花大量時間訓練寫代碼的AI,“你需要把AI當成一個剛到公司的實習生,什麼都不知道。不要覺得AI在犯錯,要多反思自己的需求有沒有說清楚。”換句話說,要把想做的事情轉化成更細細微性的prompt(提示詞),上述負責人表示,寫得足夠詳細基本上都沒問題。
阿里方面則告訴《環球時報》記者,他們把AI發展歸納為學習人、輔助人、超越人的三大階段,並認為當前仍處於第二階段“輔助人”的早期,終點可能不是AGI,而是真正的“超級人工智慧ASI(超人工智慧,指遠超人類智慧的假想AI——編者注)”,“當然,這是一個宏大、遙遠的目標,還需要非常長的時間”。
美國特斯拉CEO馬斯克近期在近3小時的播客節目中透露,“AGI最快可能於2026年出現,2030年前,AI能力將超越人類總和。”上述言論引發大量討論。
瀋陽認為,如果只從技術角度看,馬斯克的判斷並不激進,但AGI並不是一個隻由工程師宣布的事件。中美“誰最先達到AGI”,首先取決於技術,最先逼近的,大概率還是美國頭部實驗室體系,其算力、工程與前沿探索優勢明顯。但大陸更容易在真實社會中快速規模化部署AI,把它嵌入產業、政務和公共服務,讓AI在現實系統裡長時間跑、反復糾錯、積累優勢。
如果必須用一句話總結,瀋陽稱,AGI很可能首先在美國被技術實現,但是否真正成立,要看它能否在社會中被大規模信任並被制度接納。
各領域期待下一個“DeepSeek時刻”
美國東北大學教授李向明:下一個“DeepSeek時刻”很可能不會發生在“純通用聊天模型”領域,而更可能出現在以下幾個方向:第一,人形機器人 +大模型,當大模型真正進入人形機器人控制、感知、規劃閉環,大陸的工程與製造優勢會被指數級放大;第二,工業/能源/供應鏈大模型,面向複雜流程、規則密集、資料高度結構化的領域,大陸企業有天然優勢;第三,低成本推理與端側模型突破,類似DeepSeek的“效率革命”,將發生在端側推理、邊緣計算、國產晶片適配上。一句話總結:美國在“智慧上限”,大陸在“智慧落地”。
AI潮玩品牌珞博智能(Robopoet)首席行銷官朱亮:2026年AI硬體將有機會迎來“DeepSeek時刻”,因為三大條件都已經具備:大模型技術成熟、供應鏈成本可控、消費者認知提升。這三個要素結合起來,就可以實現很大的規模化落地,所以我們今年的目標就定在銷售100萬台AI玩具。
“100萬台”是AI玩具行業一個里程碑,當啟動設備達到百萬台時,每日的對話將產生以“兆”為單位的Token(詞元)消耗。巨大的用戶基數帶來的海量、高品質的交互資料,將極大加速模型“資料飛輪”的運轉,使產品AI“大腦”的理解力、個性化和情感陪伴能力以指數級速度進化,形成“越多人用越好用,越好用越多人用”的良性迴圈。
“100萬台”更意味著市場對行業整體認知的教育完成。它向行業和消費者證明,AI玩具不再是小眾的玩具或潮流單品,而是能夠真正融入日常生活、提供情感價值的“生活必需品”。
|
|
|
|
|
|
|
|
|
|
|
发表于 15-1-2026 11:02 PM
|
显示全部楼层
弯道超车.gif) |
|
|
|
|
|
|
|
|
|
|

楼主 |
发表于 16-1-2026 12:45 AM
|
显示全部楼层
蟾蜍又要破防了
|
|
|
|
|
|
|
|
|
| |
本周最热论坛帖子
|