您現(xiàn)在的位置是：tie l? bóng ?á >>正文

tie l? bóng ?á

t? l? cá c??c bóng ?á indo51213人已圍觀

簡(jiǎn)介文丨《BUG》欄目周文猛DeepSeek又更新了，可惜仍不是萬(wàn)眾期待的R2模型。此次DeepSeek線上模型版本已升級(jí)至V3.1。《BUG》欄目實(shí)測(cè)發(fā)現(xiàn)，升級(jí)后的DeepSeek在上下文長(zhǎng)度和交...

　　文丨《BUG》欄目周文猛

　　DeepSeek又更新了，可惜仍不是萬(wàn)眾期待的R2模型。

　　此次DeepSeek線上模型版本已升級(jí)至V3.1。《BUG》欄目實(shí)測(cè)發(fā)現(xiàn)，升級(jí)后的DeepSeek在上下文長(zhǎng)度和交互友好度上有明顯改進(jìn)，編程能力受到推崇。在使用經(jīng)濟(jì)性上，也有開(kāi)發(fā)人員指出，“DeepSeek或?qū)3與R1模型進(jìn)行了合并，這有利于降低模型部署成本。”

　　DeepSeek方面在回應(yīng)《BUG》欄目時(shí)，直言“都以官方公布為準(zhǔn)”。

　　巧合的是，今天是R1官方發(fā)布后的整7個(gè)月。在這期間，OpenAI、Google、阿里巴巴、月之暗面、智譜等紛紛發(fā)布了新模型，他們都以R1作為參照物。

　　而R2作為R1的后續(xù)產(chǎn)品，一直都是行業(yè)關(guān)注的焦點(diǎn)。大廠需要新的參照物，萬(wàn)眾也在期待梁文鋒。

　　實(shí)測(cè)：上下文更長(zhǎng)，性價(jià)比更高

　　在DeepSeek網(wǎng)頁(yè)端及最新版本App上，目前能夠支持的上下文長(zhǎng)度已經(jīng)擴(kuò)展至最新的128K長(zhǎng)度。

　　有開(kāi)發(fā)者在深度體驗(yàn)后發(fā)現(xiàn)，此次更新后，增加上下文相關(guān)內(nèi)容，“穩(wěn)定性更強(qiáng)了，推理能力也有了進(jìn)步”。

　　《BUG》欄目對(duì)比發(fā)現(xiàn)，相較于此前發(fā)布的DeepSeek V3（參數(shù)量671B），此次更新V3.1（參數(shù)量685B），在模型尺寸上并未有過(guò)于明顯的變化。不過(guò)，在交互體驗(yàn)感上，V3.1有了更明顯的提升。

　　除支持更大的長(zhǎng)文本輸入外，在回答問(wèn)題時(shí)，涉及信息收集的環(huán)節(jié)，DeepSeek會(huì)更多地使用表格進(jìn)行信息匯總呈現(xiàn)，交互更友好，且回答內(nèi)容更加符合人類表達(dá)習(xí)慣，語(yǔ)氣更加自然。

　　此外，在編程能力上，據(jù)網(wǎng)友曝出內(nèi)容，DeepSeek V3.1在Aider Polyglot多語(yǔ)言編程測(cè)試中，以71.6%分舉擊敗了Claude 4 Opus，較DeepSeek R1也有進(jìn)一步的提升。

　　《BUG》欄目實(shí)測(cè)發(fā)現(xiàn)，當(dāng)以指令要求V3.1設(shè)計(jì)一個(gè)宮崎駿風(fēng)格的五子棋游戲界面，并設(shè)有“人人對(duì)戰(zhàn)”和“人機(jī)對(duì)戰(zhàn)”兩個(gè)模擬按鈕，最終用2D插畫(huà)風(fēng)格html呈現(xiàn)時(shí)，V3.1不僅能夠給出完整的設(shè)計(jì)過(guò)程和代碼結(jié)果，同時(shí)還支持在線運(yùn)行演示，給出的結(jié)果也已具備交互模式，且編碼結(jié)果也基本接近可實(shí)用程度。

　　模型能力外，《BUG》欄目注意到，在最新的Deetie l? bóng ?ápSeek App和官網(wǎng)上，更新后的DeepSeek，輸入框中的“深度思考（R1）”按鈕，直接變成了“深度思考”。

　　這意味著——在開(kāi)啟深度思考模式后，DeepSeek調(diào)用的推理模型或已不再只局限于R1模型，也有可能是其他的新模型，或者是V3/R1合并后的新模型。

　　有開(kāi)發(fā)者也注意到了這一變化，并且在研究測(cè)試后指出，“此次更新將V3和R1進(jìn)行了合并部署，使得部署DeepSeek的簡(jiǎn)易程度和算力效率得到了極大提升。”

　　該開(kāi)發(fā)人員對(duì)《BUG》欄目解釋道：“之前V3、R1是分開(kāi)部署的，各需要60張卡，現(xiàn)在是R1、V3合一，只需部署一個(gè)。原來(lái)要用120張卡現(xiàn)在60張卡就行，部署的成本大幅度下降了。”他進(jìn)一步解釋道，“如果用120張卡部署V3.1，由于緩存增大，性能預(yù)估可提升3-4倍。”

　　在該開(kāi)發(fā)人員看來(lái)，“此次更新，V 3.1更多的是一個(gè)技術(shù)前沿模型，主要針對(duì)降本。”

　　目前，在Huggingface（知名AI開(kāi)源社區(qū)）上，最新更新的DeepSeek-V3.1-Base版本已經(jīng)開(kāi)放源代碼。不過(guò)，此次官方并未給出具體信息，只簡(jiǎn)單提及該模型尺寸為685B，支持BF16、F8_E4M3、F32數(shù)據(jù)類型。

　　國(guó)內(nèi)廠商期待新“參照物”

　　遺憾的是，此次V3.1更新，雖然在用戶體驗(yàn)和經(jīng)濟(jì)性上帶來(lái)了一些驚喜，但業(yè)界備受關(guān)注的新一代R2模型并未出現(xiàn)。

　　今年1月，伴隨DeepSeek R1發(fā)布并迅速引發(fā)各界關(guān)注，業(yè)界對(duì)DeepSeek的推崇與好感度迅速提升。在DeepSeek R1發(fā)布當(dāng)月，DeepSeek網(wǎng)頁(yè)及App用戶增長(zhǎng)達(dá)1.25億（含網(wǎng)站和應(yīng)用累加），其中80%以上用戶來(lái)自1月最后一周。至今年1月28日，DeepSeek日活躍用戶數(shù)（DAU）首次超越豆包，成為全球增速最快的AI應(yīng)用之一。

　　很快，其主動(dòng)開(kāi)放源代碼的做法，也讓業(yè)界開(kāi)始借鑒或直接將DeepSeek滿血版集成到自己應(yīng)用上，騰訊元寶、百度、360等新產(chǎn)品應(yīng)運(yùn)而生。

　　緊接著，各大廠商上演了“車輪戰(zhàn)”，眾人將R1作為是否成功的參照物。

　　國(guó)內(nèi)方面，阿里巴巴旗下Qwen基本保持了每月一大發(fā)布，兩周一小發(fā)布的頻率，高頻發(fā)布全尺寸、多模態(tài)模型。tie l? bóng ?á阿里上個(gè)月發(fā)布的千問(wèn)3旗艦?zāi)Ｐ蚎wen3-235B-A22B，聲稱在核心能力測(cè)評(píng)中，比肩Gemini-2.5 pro、o4-mini等頂尖閉源模型，并超越了DeepSeek R1。

　　此外，月之暗面7月發(fā)布的Kimi K2 模型，以及智譜最新發(fā)布的新一代旗艦?zāi)Ｐ虶LM-4.5，也先后宣布超越DeepSeek R1，且在使用經(jīng)濟(jì)性上帶來(lái)新的突破，API調(diào)用價(jià)格低至輸入0.8元/百萬(wàn)tokens。

　　梁文鋒，正在忙什么？

　　在與《BUG》欄目溝通中，DeepSeek方面并未透露更多后續(xù)發(fā)布的消息，對(duì)于R2何時(shí)發(fā)布等問(wèn)題也僅回復(fù)稱：“詳細(xì)內(nèi)容以官方公布為準(zhǔn)”。

　　不過(guò)，接近DeepSeek人士曾透露，“DeepSeek-R2在8月內(nèi)并無(wú)發(fā)布計(jì)劃。”這或許意味著，V3.1模型更新后，8月或?qū)⒉粫?huì)有更大版本的DeepSeek新模型發(fā)布。

　　此前，聯(lián)想創(chuàng)投集團(tuán)高級(jí)合伙人宋春雨曾與梁文鋒有過(guò)深度交流，兩人關(guān)系熟絡(luò)。

　　近期，宋春雨在與《BUG》欄目溝通中感慨道：“他（梁文鋒）對(duì)商業(yè)化不感興趣，對(duì)留住用戶可能也不太感興趣”。在他看來(lái)，“梁文鋒是堅(jiān)信AGI的人，是技術(shù)極客背景出身，他給自己的使命是要摸AGI的上限在哪里？甚至人類能達(dá)到硅基智能的上限究竟是什么？他專注的是打磨基礎(chǔ)模型，確保每一代模型都保持領(lǐng)先。”

　　但越是這樣，市場(chǎng)對(duì)于DeepSeek的期待值也愈發(fā)強(qiáng)烈。

　　在業(yè)內(nèi)人士看來(lái)，“時(shí)至今日，各大AI模型的能力上限都已經(jīng)很強(qiáng)了，需要做的是下限不要太低，能夠穩(wěn)定輸出就是好模型。”

　　回想OpenAI旗下的GPT-5，同樣經(jīng)歷了延遲發(fā)布，可惜最終發(fā)布的產(chǎn)品飽受詬病。主要原因就是數(shù)據(jù)、算力等方面的局限，AI大模型的能力上限或許已經(jīng)不會(huì)有太多提升。

　　下一步，如何在經(jīng)濟(jì)性、可用性等方面作出更多的創(chuàng)新，或許將成為檢驗(yàn)大模型能力強(qiáng)弱的關(guān)鍵。

　　“此次V3、R1做了合并部署，或許是為DeepSeek多模態(tài)模型的發(fā)布作出準(zhǔn)備，因?yàn)槎嗄B(tài)分開(kāi)部署推理和非推理負(fù)擔(dān)會(huì)很重。”在業(yè)內(nèi)人士看來(lái)，V3.1發(fā)布后，“DeepSeek多模態(tài)模型發(fā)布的時(shí)間已經(jīng)不遠(yuǎn)了。”

　　熱鬧非凡的國(guó)內(nèi)AI大模型市場(chǎng)，已許久不見(jiàn)DeepSeek和梁文鋒的“爆炸性”新聞，但市場(chǎng)對(duì)于它們的期待仍在不斷積蓄。

海量資訊、精準(zhǔn)解讀，盡在新浪財(cái)經(jīng)APP

責(zé)任編輯：楊賜

Tags：

上一篇：REDMI Note 15 Pro+發(fā)布：首次搭載小米龍晶玻璃，首銷1899元起

下一篇：廣汽昊鉑HL增程版上市：首發(fā)搭載星源增程技術(shù)，售價(jià)26.98萬(wàn)元起

狠狠干夜夜躁-狠狠干影院-狠狠狠肏-狠狠狠狠狠肏-狠狠狠狠综合激情-狠狠激情-狠狠久久中文字幕-狠狠撸、日日操-狠狠撸91-狠狠撸www

您現(xiàn)在的位置是：tie l? bóng ?á >>正文

tie l? bóng ?á

相關(guān)文章

韓國(guó)ithinkso簡(jiǎn)約男女大容量尼龍雙肩包大學(xué)生書(shū)包15寸電腦包背包

李斌現(xiàn)場(chǎng)大秀全新ES8可裝12個(gè)行李箱，觀眾直呼“太能裝”

微博發(fā)布Q2財(cái)報(bào) 運(yùn)營(yíng)利潤(rùn)超預(yù)期

熱門(mén)文章

最新文章

友情鏈接