DeepSeek又有重磅消息？梁文鋒論文曝新技術「突破GPU記憶體限制」

dalap · 发表于 15-1-2026 09:45 AM

1月12日晚間，中國人工智慧（AI）初創公司DeepSeek創始人梁文鋒與北京大學研究人員共同署名發表了一篇技術論文，提出了一種新的模型訓練技術。他們表示，該技術可以通過繞過圖形處理單元（GPU）記憶體限制，實現「參數的積極擴展」。觀察者網報導了前述訊息，隨後引發關注。

香港《南華早報》1月13日報導指出，此舉凸顯了DeepSeek在算力相對美國行業領先企業存在差距的情況下，持續專注於最大限度地提高成本效率。與此同時，外界猜測該公司將在今年春節之前發佈一款重要的新模型。

報導稱，這篇技術含量極高的論文將受到中國和美國業內人士的廣泛關注，他們希望從中瞭解DeepSeek所取得的最新進展。在過去一年中，DeepSeek一直是中國AI領域創新的典範。

Engineer · 发表于 15-1-2026 09:54 AM

DEEPSEEK一炮而红后现在已经被晒在一旁，评价也越来越低

lcw9988 · 发表于 15-1-2026 10:01 AM

本帖最后由 lcw9988 于 15-1-2026 10:03 AM 编辑

一年吹一次都没人屌它 DEEPSHIT了 !

和 GEMINI, CHATGPT, GROK, Anthropic . . . 差距太大了

dalap · 发表于 15-1-2026 01:18 PM

DeepSeek一周年陸美AI跑出兩條非常不同的主航道

大陸《環球時報》15日報導，路透近日報導稱，大陸人工智慧（AI）初創公司深度求索（DeepSeek）預計2月中旬推出下一代人工智慧模型V4，該模型具有強大編碼能力，表現可能優於美國人工智慧公司Anthropic旗下大模型Claude和美國初創公司OpenAI的GPT系列等競爭對手。一年前，DeepSeek發布大模型R1，英國廣播公司（BBC）形容「DeepSeek向世界展示了大陸人工智慧領域的競爭力」，當時距離OpenAI推出ChatGPT也已兩年。大陸專家學者表示，2025一年時間，大陸縮小與美國在人工智慧領域差距，將一歲的DeepSeek和三歲的ChatGPT作為「時代切片」，能清晰看到陸美站在不同航道。

《環時》報導，「過去一年，中美大模型跑出了兩條非常不同的主航道。」北京清華大學新聞與傳播學院、人工智慧學院雙聘教授沈陽稱，美國走的是「前沿能力持續拉高＋閉源模型＋平台化產品」路線，把最強模型不斷封裝成ChatGPT這樣的超級入口，再向企業、行業和合規體系外溢，目標不是單點智慧，而是把智慧變成一種可控、可收費、可治理的基礎設施。

而大陸走的則是另一條路，「開源權重＋極致工程效率＋快速產業擴散」。大陸不追求長期壟斷最強模型，而是把「足夠強的能力」盡快做成可複製、可落地的工程資產，讓智慧迅速進入真實業務系統。

「如果用兩個產品來做時代切片，三歲的ChatGPT代表的是『把AI變成全球統一工作介面』的能力躍遷。」沈陽認為，美國企業追求的突破不只是模型更聰明，而是把模型嵌入到工具、流程、組織和商業結構中。而一歲的DeepSeek代表的是大陸AI路徑的成熟樣本：通過開源和工程體系，把強推理能力迅速擴散到產業側，讓「用得起、改得動、跑得快」成為核心競爭力。

瀋陽分析，如果只看「最強模型的前沿能力」，美國仍領先，但已經不是代際差，更多是數月到一年級別；如果看「工程效率、成本和落地速度」，大陸幾乎沒有時間差，局部甚至更快；如果看「產品平台、生態與規則制定」，美國依然領先一到兩年。

《環時》報導，剛赴美國拉斯維加斯參加國際消費類電子產品展（CES）的AI博主李尚龍形容，美國生活像兩條河，一條已進入AI時代，另一條還在慢慢被滲透，「我在矽谷的體感非常強：幾乎你在咖啡廳隨便看一圈，很多人打開的就是AI、ChatGPT，討論的也是模型、產品、創業和效率。但同時，你走出矽谷，很多普通人的生活又沒那麼AI化。」從矽谷回國創業的李尚龍稱，「我的判斷是，AI不會一夜改變美國，但會每天悄悄改變一部分人的生活方式」。

長期關注中美AI發展情況的美國東北大學教授李向明描述，美國民眾生活中AI含量非常大，但主要是在「軟處」，從演算法驅動的流媒體推薦、保險定價、導航預測到ChatGPT等大模型辦公滲透，AI已是基礎設施。但在「硬處」（物理硬體）的普及方面尚在爆發前夜。

而在上述CES上，李向明發現，大陸產品「工程落地速度」和「供應鏈完整度」令人震撼。大陸企業在雷射雷達、高能量密度電池和高性價比電機組件上幾乎占半壁江山。大陸機器人不僅反覆運算快，而且具備大規模量產的潛力和極強的成本優勢，這是推動機器人進入全球家庭的關鍵。在美國，AGI（通用人工智慧，指AI能夠理解或學習人類能夠執行的任何智力任務）賦予機器人大腦，而大陸製造正在為它鍛造最強壯且普惠的AI身體，尤其是人形機器人廣泛應用。

「追求模型性能的提升，是所有做基礎模型公司的目標。」阿里方面指出，在大陸，模型應用落地豐富，發展迅速，是大陸AI的獨到優勢之一。

一家大模型初創企業負責人告訴《環球時報》記者，團隊仍在發力研究“長思考、代碼能力、多模態”的大模型。“2025年，AI改變最大的地方就是寫代碼，未來資訊接收創造和處理會更多地被AI替代。”該負責人告訴記者，目前團隊正在花大量時間訓練寫代碼的AI，“你需要把AI當成一個剛到公司的實習生，什麼都不知道。不要覺得AI在犯錯，要多反思自己的需求有沒有說清楚。”換句話說，要把想做的事情轉化成更細細微性的prompt（提示詞），上述負責人表示，寫得足夠詳細基本上都沒問題。

阿里方面則告訴《環球時報》記者，他們把AI發展歸納為學習人、輔助人、超越人的三大階段，並認為當前仍處於第二階段“輔助人”的早期，終點可能不是AGI，而是真正的“超級人工智慧ASI（超人工智慧，指遠超人類智慧的假想AI——編者注）”，“當然，這是一個宏大、遙遠的目標，還需要非常長的時間”。

美國特斯拉CEO馬斯克近期在近3小時的播客節目中透露，“AGI最快可能於2026年出現，2030年前，AI能力將超越人類總和。”上述言論引發大量討論。

瀋陽認為，如果只從技術角度看，馬斯克的判斷並不激進，但AGI並不是一個隻由工程師宣布的事件。中美“誰最先達到AGI”，首先取決於技術，最先逼近的，大概率還是美國頭部實驗室體系，其算力、工程與前沿探索優勢明顯。但大陸更容易在真實社會中快速規模化部署AI，把它嵌入產業、政務和公共服務，讓AI在現實系統裡長時間跑、反復糾錯、積累優勢。

如果必須用一句話總結，瀋陽稱，AGI很可能首先在美國被技術實現，但是否真正成立，要看它能否在社會中被大規模信任並被制度接納。

各領域期待下一個“DeepSeek時刻”

美國東北大學教授李向明：下一個“DeepSeek時刻”很可能不會發生在“純通用聊天模型”領域，而更可能出現在以下幾個方向：第一，人形機器人＋大模型，當大模型真正進入人形機器人控制、感知、規劃閉環，大陸的工程與製造優勢會被指數級放大；第二，工業／能源／供應鏈大模型，面向複雜流程、規則密集、資料高度結構化的領域，大陸企業有天然優勢；第三，低成本推理與端側模型突破，類似DeepSeek的“效率革命”，將發生在端側推理、邊緣計算、國產晶片適配上。一句話總結：美國在“智慧上限”，大陸在“智慧落地”。

AI潮玩品牌珞博智能（Robopoet）首席行銷官朱亮：2026年AI硬體將有機會迎來“DeepSeek時刻”，因為三大條件都已經具備：大模型技術成熟、供應鏈成本可控、消費者認知提升。這三個要素結合起來，就可以實現很大的規模化落地，所以我們今年的目標就定在銷售100萬台AI玩具。

“100萬台”是AI玩具行業一個里程碑，當啟動設備達到百萬台時，每日的對話將產生以“兆”為單位的Token（詞元）消耗。巨大的用戶基數帶來的海量、高品質的交互資料，將極大加速模型“資料飛輪”的運轉，使產品AI“大腦”的理解力、個性化和情感陪伴能力以指數級速度進化，形成“越多人用越好用，越好用越多人用”的良性迴圈。

“100萬台”更意味著市場對行業整體認知的教育完成。它向行業和消費者證明，AI玩具不再是小眾的玩具或潮流單品，而是能夠真正融入日常生活、提供情感價值的“生活必需品”。

开卷有益 · 发表于 15-1-2026 11:02 PM

弯道超车

dalap · 发表于 16-1-2026 12:45 AM

蟾蜍又要破防了

		自动登录	找回密码
密码			注册

DeepSeek又有重磅消息？梁文鋒論文曝新技術「突破GPU記憶體限制」

所属分类: 政经文教

浏览过的版块