您現在的位置是:t? l? kèo cá c??c bóng ?á olympic >>正文
t? l? kèo cá c??c bóng ?á olympic
t? l? cá c??c bóng ?á indo668人已圍觀
簡介文 丨 《BUG》欄目 周文猛DeepSeek又更新了,可惜仍不是萬眾期待的R2模型。此次DeepSeek線上模型版本已升級至V3.1。《BUG》欄目實測發現,升級后的DeepSeek在上下文長度和交...

文 丨 《BUG》欄目 周文猛
DeepSeek又更新了,可惜仍不是萬眾期待的R2模型。
此次DeepSeek線上模型版本已升級至V3.1。《BUG》欄目實測發現,升級后的DeepSeek在上下文長度和交互友好度上有明顯改進,編程能力受到推崇。在使用經濟性上,也有開發人員指出,“DeepSeek或將V3與R1模型進行了合并,這有利于降低模型部署成本。”
DeepSeek方面在回應《BUG》欄目時,直言“都以官方公布為準”。
巧合的是,今天是R1官方發布后的整7個月。在這期間,OpenAI、Google、阿里巴巴、月之暗面、智譜等紛紛發布了新模型,他們都以R1作為參照物。
而R2作為R1的后續產品,一直都是行業關注的焦點。大廠需要新的參照物,萬眾也在期待梁文鋒。

實測:上下文更長,性價比更高
在DeepSeek網頁端及最新版本App上,目前能夠支持的上下文長度已經擴展至最新的128K長度。
有開發者在深度體驗后發現,此次更新后,增加上下文相關內容,“穩定性更強了,推理能力也有了進步”。

《BUG》欄目對比發現,相較于此前發布的DeepSeek V3(參數量671B),此次更新V3.1(參數量685B),在模型尺寸上并未有過于明顯的變化。不過,在交互體驗感上,V3.1有了更明顯的提升。
除支持更大的長文本輸入外,在回答問題時,涉及信息收集的環節,DeepSeek會更多地使用表格進行信息匯總呈現,交互更友好,且回答內容更加符合人類表達習慣,語氣更加自然。

此外,在編程能力上,據網友曝出內容,DeepSeek V3.1在Aider Polyglot多語言編程測試中,以71.6%分舉擊敗了Claude 4 Opus,較DeepSeek R1也有進一步的提升。

《BUG》欄目實測發現,當以指令要求V3.1設計一個宮崎駿風格的五子棋游戲界面,并設有“人人對戰”和“人機對戰”兩個模擬按鈕,最終用2D插畫風格html呈現時,V3.1不僅能夠給出完整的設計過程和代碼結果,同時還支持在線運行演示,給出的結果也已具備交互模式,且編碼結果也基本接近可實用程度。

模型能力外,《BUG》欄目注意到,在最新的Deet? l? kèo cá c??c bóng ?á olympicpSeek App和官網上,更新后的DeepSeek,輸入框中的“深度思考(R1)”按鈕,直接變成了“深度思考”。
這意味著——在開啟深度思考模式后,DeepSeek調用的推理模型或已不再只局限于R1模型,也有可能是其他的新模型,或者是V3/R1合并后的新模型。

有開發者也注意到了這一變化,并且在研究測試后指出,“此次更新將V3和R1進行了合并部署,使得部署DeepSeek的簡易程度和算力效率得到了極大提升。”
該開發人員對《BUG》欄目解釋道:“之前V3、R1是分開部署的,各需要60張卡,現在是R1、V3合一,只需部署一個。原來要用120張卡現在60張卡就行,部署的成本大幅度下降了。”他進一步解釋道,“如果用120張卡部署V3.1,由于緩存增大,性能預估可提升3-4倍。”
在該開發人員看來,“此次更新,V 3.1更多的是一個技術前沿模型,主要針對降本。”
目前,在Huggingface(知名AI開源社區)上,最新更新的DeepSeek-V3.1-Base版本已經開放源代碼。不過,此次官方并未給出具體信息,只簡單提及該模型尺寸為685B,支持BF16、F8_E4M3、F32數據類型。
國內廠商期待新“參照物”
遺憾的是,此次V3.1更新,雖然在用戶體驗和經濟性上帶來了一些驚喜,但業界備受關注的新一代R2模型并未出現。
今年1月,伴隨DeepSeek R1發布并迅速引發各界關注,業界對DeepSeek的推崇與好感度迅速提升。在DeepSeek R1發布當月,DeepSeek網頁及App用戶增長達1.25億(含網站和應用累加),其中80%以上用戶來自1月最后一周。至今年1月28日,DeepSeek日活躍用戶數(DAU)首次超越豆包,成為全球增速最快的AI應用之一。
很快,其主動開放源代碼的做法,也讓業界開始借鑒或直接將DeepSeek滿血版集成到自己應用上,騰訊元寶、百度、360等新產品應運而生。
緊接著,各大廠商上演了“車輪戰”,眾人將R1作為是否成功的參照物。
國內方面,阿里巴巴旗下Qwen基本保持了每月一大發布,兩周一小發布的頻率,高頻發布全尺寸、多模態模型。t? l? kèo cá c??c bóng ?á olympic阿里上個月發布的千問3旗艦模型Qwen3-235B-A22B,聲稱在核心能力測評中,比肩Gemini-2.5 pro、o4-mini等頂尖閉源模型,并超越了DeepSeek R1。

此外,月之暗面7月發布的Kimi K2 模型,以及智譜最新發布的新一代旗艦模型GLM-4.5,也先后宣布超越DeepSeek R1,且在使用經濟性上帶來新的突破,API調用價格低至輸入0.8元/百萬tokens。
梁文鋒,正在忙什么?
在與《BUG》欄目溝通中,DeepSeek方面并未透露更多后續發布的消息,對于R2何時發布等問題也僅回復稱:“詳細內容以官方公布為準”。
不過,接近DeepSeek人士曾透露,“DeepSeek-R2在8月內并無發布計劃。”這或許意味著,V3.1模型更新后,8月或將不會有更大版本的DeepSeek新模型發布。
此前,聯想創投集團高級合伙人宋春雨曾與梁文鋒有過深度交流,兩人關系熟絡。
近期,宋春雨在與《BUG》欄目溝通中感慨道:“他(梁文鋒)對商業化不感興趣,對留住用戶可能也不太感興趣”。在他看來,“梁文鋒是堅信AGI的人,是技術極客背景出身,他給自己的使命是要摸AGI的上限在哪里?甚至人類能達到硅基智能的上限究竟是什么?他專注的是打磨基礎模型,確保每一代模型都保持領先。”
但越是這樣,市場對于DeepSeek的期待值也愈發強烈。
在業內人士看來,“時至今日,各大AI模型的能力上限都已經很強了,需要做的是下限不要太低,能夠穩定輸出就是好模型。”
回想OpenAI旗下的GPT-5,同樣經歷了延遲發布,可惜最終發布的產品飽受詬病。主要原因就是數據、算力等方面的局限,AI大模型的能力上限或許已經不會有太多提升。
下一步,如何在經濟性、可用性等方面作出更多的創新,或許將成為檢驗大模型能力強弱的關鍵。
“此次V3、R1做了合并部署,或許是為DeepSeek多模態模型的發布作出準備,因為多模態分開部署推理和非推理負擔會很重。”在業內人士看來,V3.1發布后,“DeepSeek多模態模型發布的時間已經不遠了。”
熱鬧非凡的國內AI大模型市場,已許久不見DeepSeek和梁文鋒的“爆炸性”新聞,但市場對于它們的期待仍在不斷積蓄。

責任編輯:楊賜
Tags:
相關文章
京東全球科技探索者大會定檔9月25日
t? l? kèo cá c??c bóng ?á olympic新浪科技訊 8月21日晚間消息,京東集團宣布,JDD 2025京東全球科技探索者大會 將于9月25日在北京·中關村國際創新中心召開。大會以 “Enjoy AI” 為主題,設置主論壇、專題論壇及Supe...
閱讀更多
Moodi All in One Bag超大容量百搭旅行通勤英文字母單肩包帆布袋
t? l? kèo cá c??c bóng ?á olympic產品來自福建 廈門,屬于通用款女包,箱包皮具/熱銷女包/男包,Moodi,原價:188.00,優惠價:188.00產品來自福建 廈門,屬于通用款女包,箱包皮具/熱銷女包/男包,Moodi,原價:188...
閱讀更多
花間公主LOOK2022新斜挎女包女旅行帆布休閑花朵輕便尼龍布女士包
t? l? kèo cá c??c bóng ?á olympic產品來自上海,屬于通用款女包,箱包皮具/熱銷女包/男包,花間公主原創品牌,原價:198.00,優惠價:149.00產品來自上海,屬于通用款女包,箱包皮具/熱銷女包/男包,花間公主原創品牌,原價:198...
閱讀更多