
體育資訊3月14日稱?據(jù)《白鯨實驗室》爆料,DeepSeek V4 和姚順雨領(lǐng)銜操刀的混元新模型,均預(yù)計將于下個月(2026 年 4 月)發(fā)布。
值得一提的是,回顧今年以來的多次爆料,無論是春節(jié)還是3月首周,DeepSeek V4的發(fā)布日期傳聞均一一落空。
3 月 11 日,OpenRouter 新上線了兩個神秘模型——Healer Alpha 與 Hunter Alpha。OpenRouter 頁面顯示,Healer Alpha 被描述為具備視覺、聽覺、推理與行動能力的前沿全模態(tài)模型;社區(qū)因此迅速將其與尚未發(fā)布的新一代國產(chǎn)模型聯(lián)系起來,據(jù)稱捕捉到了「系統(tǒng)提示詞中要求嚴(yán)格遵守中國法律法規(guī)」。
據(jù)悉,DeepSeek V4 將于 4 月正式上線。作為梁文鋒打磨已久的多模態(tài)大模型,DeepSeek V4 除了代碼能力躍升,還會在長期記憶上取得突破。這一方向與 DeepSeek 團隊近幾個月的公開研究脈絡(luò)基本一致。
2026 年 1 月,梁文鋒署名論文《Conditional Memory via Scalable Lookup》提出「條件記憶」機制;2025 年 12 月的《mHC: Manifold-Constrained Hyper-Connections》則繼續(xù)指向底層架構(gòu)優(yōu)化。
兩篇論文都在嘗試處理 Transformer 在記憶、訓(xùn)練穩(wěn)定性和長上下文上的瓶頸。梁文鋒過去半年的主要工作,是補齊 DeepSeek 在視覺內(nèi)容處理和 AI 搜索上的短板。為強化 AI 搜索能力,DeepSeek 早在去年就已與百度展開合作。
梁文鋒這次為 DeepSeek V4 設(shè)定的關(guān)鍵迭代方向,正是長期記憶能力。DeepSeek V4 還將深度適配國產(chǎn)芯片,并有望成為首個完全跑在國產(chǎn)算力生態(tài)上的大模型。
JKL看JDG零封LOUD20分鐘直接速通:已經(jīng)不當(dāng)人了!
體育資訊3月20日稱 全球先鋒賽JDG對陣LOUD,JackeyLove直播看比賽;JKL看JDG零封L...
2026-03-20
Uzi看烏茲杯:Ale紅了Ale:打啊菜成這樣晚上睡得著覺嗎
體育資訊3月20日稱 烏茲杯比賽期間,Uzi直播看各隊比賽;Uzi:Ale紅了Ale現(xiàn)在只有打...
2026-03-20
Ruler:當(dāng)初擔(dān)心過能否回歸GEN現(xiàn)在希望未來也能一直并肩同行
體育資訊3月20日稱 全球先鋒賽戰(zhàn)勝LYON后,GEN下路選手Ruler接受了媒體的采訪;...
2026-03-20
巴西FUR打野:我們訓(xùn)練賽碾壓1把JDG第2把領(lǐng)先1W2被GALA翻了
體育資訊3月20日稱 在今晨先鋒賽的比賽中JDG以3-0橫掃巴西LOUD挺進小組敗者組...
2026-03-20
先鋒賽KDA排名:Chovy第一前四均為GEN選手xun第五
體育資訊3月20日稱 英雄聯(lián)盟賽事發(fā)布目前先鋒賽KDA排名:1.Chovy2.Canyon3.Duro...
2026-03-20