您現(xiàn)在的位置是:top 1 nhà cái >>正文
top 1 nhà cái
t? l? cá c??c bóng ?á indo3人已圍觀
簡介文 丨 《BUG》欄目 周文猛DeepSeek又更新了,可惜仍不是萬眾期待的R2模型。此次DeepSeek線上模型版本已升級(jí)至V3.1。《BUG》欄目實(shí)測發(fā)現(xiàn),升級(jí)后的DeepSeek在上下文長度和交...

文 丨 《BUG》欄目 周文猛
DeepSeek又更新了,可惜仍不是萬眾期待的R2模型。
此次DeepSeek線上模型版本已升級(jí)至V3.1。《BUG》欄目實(shí)測發(fā)現(xiàn),升級(jí)后的DeepSeek在上下文長度和交互友好度上有明顯改進(jìn),編程能力受到推崇。在使用經(jīng)濟(jì)性上,也有開發(fā)人員指出,“DeepSeek或?qū)3與R1模型進(jìn)行了合并,這有利于降低模型部署成本。”
DeepSeek方面在回應(yīng)《BUG》欄目時(shí),直言“都以官方公布為準(zhǔn)”。
巧合的是,今天是R1官方發(fā)布后的整7個(gè)月。在這期間,OpenAI、Google、阿里巴巴、月之暗面、智譜等紛紛發(fā)布了新模型,他們都以R1作為參照物。
而R2作為R1的后續(xù)產(chǎn)品,一直都是行業(yè)關(guān)注的焦點(diǎn)。大廠需要新的參照物,萬眾也在期待梁文鋒。

實(shí)測:上下文更長,性價(jià)比更高
在DeepSeek網(wǎng)頁端及最新版本App上,目前能夠支持的上下文長度已經(jīng)擴(kuò)展至最新的128K長度。
有開發(fā)者在深度體驗(yàn)后發(fā)現(xiàn),此次更新后,增加上下文相關(guān)內(nèi)容,“穩(wěn)定性更強(qiáng)了,推理能力也有了進(jìn)步”。

《BUG》欄目對(duì)比發(fā)現(xiàn),相較于此前發(fā)布的DeepSeek V3(參數(shù)量671B),此次更新V3.1(參數(shù)量685B),在模型尺寸上并未有過于明顯的變化。不過,在交互體驗(yàn)感上,V3.1有了更明顯的提升。
除支持更大的長文本輸入外,在回答問題時(shí),涉及信息收集的環(huán)節(jié),DeepSeek會(huì)更多地使用表格進(jìn)行信息匯總呈現(xiàn),交互更友好,且回答內(nèi)容更加符合人類表達(dá)習(xí)慣,語氣更加自然。

此外,在編程能力上,據(jù)網(wǎng)友曝出內(nèi)容,DeepSeek V3.1在Aider Polyglot多語言編程測試中,以71.6%分舉擊敗了Claude 4 Opus,較DeepSeek R1也有進(jìn)一步的提升。

《BUG》欄目實(shí)測發(fā)現(xiàn),當(dāng)以指令要求V3.1設(shè)計(jì)一個(gè)宮崎駿風(fēng)格的五子棋游戲界面,并設(shè)有“人人對(duì)戰(zhàn)”和“人機(jī)對(duì)戰(zhàn)”兩個(gè)模擬按鈕,最終用2D插畫風(fēng)格html呈現(xiàn)時(shí),V3.1不僅能夠給出完整的設(shè)計(jì)過程和代碼結(jié)果,同時(shí)還支持在線運(yùn)行演示,給出的結(jié)果也已具備交互模式,且編碼結(jié)果也基本接近可實(shí)用程度。

模型能力外,《BUG》欄目注意到,在最新的Deetop 1 nhà cáipSeek App和官網(wǎng)上,更新后的DeepSeek,輸入框中的“深度思考(R1)”按鈕,直接變成了“深度思考”。
這意味著——在開啟深度思考模式后,DeepSeek調(diào)用的推理模型或已不再只局限于R1模型,也有可能是其他的新模型,或者是V3/R1合并后的新模型。

有開發(fā)者也注意到了這一變化,并且在研究測試后指出,“此次更新將V3和R1進(jìn)行了合并部署,使得部署DeepSeek的簡易程度和算力效率得到了極大提升。”
該開發(fā)人員對(duì)《BUG》欄目解釋道:“之前V3、R1是分開部署的,各需要60張卡,現(xiàn)在是R1、V3合一,只需部署一個(gè)。原來要用120張卡現(xiàn)在60張卡就行,部署的成本大幅度下降了。”他進(jìn)一步解釋道,“如果用120張卡部署V3.1,由于緩存增大,性能預(yù)估可提升3-4倍。”
在該開發(fā)人員看來,“此次更新,V 3.1更多的是一個(gè)技術(shù)前沿模型,主要針對(duì)降本。”
目前,在Huggingface(知名AI開源社區(qū))上,最新更新的DeepSeek-V3.1-Base版本已經(jīng)開放源代碼。不過,此次官方并未給出具體信息,只簡單提及該模型尺寸為685B,支持BF16、F8_E4M3、F32數(shù)據(jù)類型。
國內(nèi)廠商期待新“參照物”
遺憾的是,此次V3.1更新,雖然在用戶體驗(yàn)和經(jīng)濟(jì)性上帶來了一些驚喜,但業(yè)界備受關(guān)注的新一代R2模型并未出現(xiàn)。
今年1月,伴隨DeepSeek R1發(fā)布并迅速引發(fā)各界關(guān)注,業(yè)界對(duì)DeepSeek的推崇與好感度迅速提升。在DeepSeek R1發(fā)布當(dāng)月,DeepSeek網(wǎng)頁及App用戶增長達(dá)1.25億(含網(wǎng)站和應(yīng)用累加),其中80%以上用戶來自1月最后一周。至今年1月28日,DeepSeek日活躍用戶數(shù)(DAU)首次超越豆包,成為全球增速最快的AI應(yīng)用之一。
很快,其主動(dòng)開放源代碼的做法,也讓業(yè)界開始借鑒或直接將DeepSeek滿血版集成到自己應(yīng)用上,騰訊元寶、百度、360等新產(chǎn)品應(yīng)運(yùn)而生。
緊接著,各大廠商上演了“車輪戰(zhàn)”,眾人將R1作為是否成功的參照物。
國內(nèi)方面,阿里巴巴旗下Qwen基本保持了每月一大發(fā)布,兩周一小發(fā)布的頻率,高頻發(fā)布全尺寸、多模態(tài)模型。top 1 nhà cái阿里上個(gè)月發(fā)布的千問3旗艦?zāi)P蚎wen3-235B-A22B,聲稱在核心能力測評(píng)中,比肩Gemini-2.5 pro、o4-mini等頂尖閉源模型,并超越了DeepSeek R1。

此外,月之暗面7月發(fā)布的Kimi K2 模型,以及智譜最新發(fā)布的新一代旗艦?zāi)P虶LM-4.5,也先后宣布超越DeepSeek R1,且在使用經(jīng)濟(jì)性上帶來新的突破,API調(diào)用價(jià)格低至輸入0.8元/百萬tokens。
梁文鋒,正在忙什么?
在與《BUG》欄目溝通中,DeepSeek方面并未透露更多后續(xù)發(fā)布的消息,對(duì)于R2何時(shí)發(fā)布等問題也僅回復(fù)稱:“詳細(xì)內(nèi)容以官方公布為準(zhǔn)”。
不過,接近DeepSeek人士曾透露,“DeepSeek-R2在8月內(nèi)并無發(fā)布計(jì)劃。”這或許意味著,V3.1模型更新后,8月或?qū)⒉粫?huì)有更大版本的DeepSeek新模型發(fā)布。
此前,聯(lián)想創(chuàng)投集團(tuán)高級(jí)合伙人宋春雨曾與梁文鋒有過深度交流,兩人關(guān)系熟絡(luò)。
近期,宋春雨在與《BUG》欄目溝通中感慨道:“他(梁文鋒)對(duì)商業(yè)化不感興趣,對(duì)留住用戶可能也不太感興趣”。在他看來,“梁文鋒是堅(jiān)信AGI的人,是技術(shù)極客背景出身,他給自己的使命是要摸AGI的上限在哪里?甚至人類能達(dá)到硅基智能的上限究竟是什么?他專注的是打磨基礎(chǔ)模型,確保每一代模型都保持領(lǐng)先。”
但越是這樣,市場對(duì)于DeepSeek的期待值也愈發(fā)強(qiáng)烈。
在業(yè)內(nèi)人士看來,“時(shí)至今日,各大AI模型的能力上限都已經(jīng)很強(qiáng)了,需要做的是下限不要太低,能夠穩(wěn)定輸出就是好模型。”
回想OpenAI旗下的GPT-5,同樣經(jīng)歷了延遲發(fā)布,可惜最終發(fā)布的產(chǎn)品飽受詬病。主要原因就是數(shù)據(jù)、算力等方面的局限,AI大模型的能力上限或許已經(jīng)不會(huì)有太多提升。
下一步,如何在經(jīng)濟(jì)性、可用性等方面作出更多的創(chuàng)新,或許將成為檢驗(yàn)大模型能力強(qiáng)弱的關(guān)鍵。
“此次V3、R1做了合并部署,或許是為DeepSeek多模態(tài)模型的發(fā)布作出準(zhǔn)備,因?yàn)槎嗄B(tài)分開部署推理和非推理負(fù)擔(dān)會(huì)很重。”在業(yè)內(nèi)人士看來,V3.1發(fā)布后,“DeepSeek多模態(tài)模型發(fā)布的時(shí)間已經(jīng)不遠(yuǎn)了。”
熱鬧非凡的國內(nèi)AI大模型市場,已許久不見DeepSeek和梁文鋒的“爆炸性”新聞,但市場對(duì)于它們的期待仍在不斷積蓄。

責(zé)任編輯:楊賜
Tags:
相關(guān)文章
軟皮牛皮水桶包2022新款大容量單肩包時(shí)尚百搭通勤女包真皮斜跨包
top 1 nhà cái產(chǎn)品來自廣東 廣州,屬于通用款女包,箱包皮具/熱銷女包/男包,JM外貿(mào)女包,原價(jià):99.00,優(yōu)惠價(jià):99.00產(chǎn)品來自廣東 廣州,屬于通用款女包,箱包皮具/熱銷女包/男包,JM外貿(mào)女包,原價(jià):99....
閱讀更多
聯(lián)合華為共建“騎手補(bǔ)給站”!美團(tuán)閃購:已在北京超百家華為門店落地
top 1 nhà cái新浪科技訊 8月14日下午消息,美團(tuán)閃購和華為合作,借助華為廣布全市的門店網(wǎng)絡(luò),落地“騎手補(bǔ)給站”,暑期向騎手伙伴提供免費(fèi)水飲、咖啡、冰涼貼、創(chuàng)可貼、巧克力、雨衣等,及充電等服務(wù),進(jìn)一步提升騎手伙伴們...
閱讀更多
拼多多陳磊:電商行業(yè)競爭不斷加劇,拼多多不以短期利益為目標(biāo)
top 1 nhà cái新浪科技訊 8月25日晚間消息,拼多多發(fā)布二季度財(cái)報(bào)。在電話會(huì)上,拼多多集團(tuán)董事長、聯(lián)席CEO陳磊表示,過去這個(gè)季度,外部環(huán)境持續(xù)變化,電商行業(yè)的競爭不斷加劇,拼多多將堅(jiān)持一貫秉承的長期主義理念,不以...
閱讀更多
熱門文章
- 小零錢包女迷你可愛硬幣包小眾設(shè)計(jì)ins風(fēng)潮千鳥格帆布短款小錢包
- 高級(jí)感雙肩包女2022新款時(shí)尚百搭洋氣背包小背包爆款女包斜挎包潮
- 圓通、申通安徽滁州網(wǎng)點(diǎn)無法寄快遞!官方回應(yīng):網(wǎng)點(diǎn)出現(xiàn)異常,恢復(fù)時(shí)間暫時(shí)無法確定
- 身著格斗服賽場熱身!宇樹科技G1機(jī)器人亮相世界人形機(jī)器人運(yùn)動(dòng)會(huì)
- GOTO球鞋運(yùn)動(dòng)旅行收納包大容量鞋包健身便攜手提鞋袋鞋子收納神器
- 萬達(dá)、京東合資成立北京泓睿潘達(dá)管理咨詢企業(yè) 出資額高達(dá)80億元