智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 云鵬

智東西9月6日報道,昨夜,阿里上線Qwen3系列最強模型Qwen3-Max的Preview版本,這也是阿里迄今為止最大的模型,參數量超1萬億。該模型目(mu)前已(yi)登陸阿里(li)百煉平臺,且在通義千問應用(yong)及Qwen Chat上免費可用(yong)。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

據百煉平臺介紹,Qwen3-Max-Preview相較2.5系列整體通用能力有大幅度提升中英文通用文本理解能力、復雜指令遵循能力、主觀開放任務能力、多語言能力、工具調用能力均顯著增強;模型知識幻覺更少。? ?超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

就在前日,Qwen官方X賬號預告了即將推出Qwen3家族中最強大、最聰明的一員。一天(tian)后,這一模型(xing)正式(shi)上線(xian),其測評結果也隨之公布。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

據(ju)悉(xi),Qwen3-Max-Preview在通(tong)用知識(SuperGPQA)、數學推理(li)(AIME25)、編程(cheng)(LiveCodeBench v6)、人(ren)類(lei)偏好對齊(Arena-Hard v2)以(yi)及(ji)綜(zong)合性能(neng)力評(ping)估(LiveBench)評(ping)測中,超越(yue)了Claude-Opus 4(Non-Thinking),以(yi)及(ji)Kimi-K2、DeepSeek-V3.1和阿里此前的開(kai)源最(zui)佳(jia)Qwen3-235B-A22B-Instruct-2507。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

在AI模型聚合平臺OpenRoute上,Qwen3-Max的介紹提及:其在推理、指令執行、多語言支持長尾知識覆蓋方面均有顯著改進;同時在數學、編程、邏輯科學任務中提供了更高的準確率。該模型支持超過100種語言,具有更強大的翻譯和常識推理能力,并針對檢索增強生成 (RAG)工具調用進行了優化,但并未包含專門的“思考”模式

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

智東西第一時間在通義千問網頁端上對Qwen3-Max-Preview進行了體驗,發現模型在文本理解以及數學、編程能力上效果出色,且響應速度很快。

首先讓Qwen3-Max-Preview生成一個小球碰撞模擬器,我們輸入提示詞:

“一個(ge)(ge)圓里面有(you)兩個(ge)(ge)小球(qiu)(qiu)(qiu)(qiu),一個(ge)(ge)黑(hei)(hei)色(se)(se),一個(ge)(ge)白色(se)(se),白色(se)(se)的球(qiu)(qiu)(qiu)(qiu)隨即位(wei)置(zhi)自由下落(luo),碰(peng)到邊(bian)界會(hui)反彈,同時再生成一個(ge)(ge)隨機位(wei)置(zhi)的白色(se)(se)小球(qiu)(qiu)(qiu)(qiu),黑(hei)(hei)色(se)(se)小球(qiu)(qiu)(qiu)(qiu)碰(peng)到邊(bian)界會(hui)反彈,碰(peng)到白色(se)(se)的球(qiu)(qiu)(qiu)(qiu)會(hui)變大(da)一點,請(qing)模擬一下。”

只見(jian)Qwen3-Max-Preview很快輸出(chu)了這個程序,模擬(ni)出(chu)了兩(liang)類球(qiu)(qiu)的(de)運動過(guo)程,最終黑色球(qiu)(qiu)膨脹至(zhi)把白球(qiu)(qiu)吞噬。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

當我們把難度提升,讓Qwen3-Max-Preview進行一個力量與速度種群模擬,并通過連續提問不斷優化這個模擬器,發現Qwen3-Max-Preview能夠通過簡單的提示詞實現快速而準確的模擬,能在幾秒鐘之內完成一個成熟程序員可能需要大半天才能完成的工作

我們輸入提示詞:“有兩個種群,種群a注重力量的發展,種群b注重速度的發展,請模擬一下兩個種群之間的相互作用并給出說明。

如下圖所示,即便我給出的提示詞非常模(mo)糊(hu),Qwen3-Max-Preview依然理解(jie)到我的意思,并(bing)給出了較(jiao)準確的模(mo)擬。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

在上述模擬中,我發現速度型種群被干(gan)掉的太快了,于是進一步希望它們能夠具備“逃跑”能力。我輸入提示詞:“注重速度的種群被干掉的太快了,他們每個個體都應該具備一定的躲避危險的能力。

而(er)后,Qwen3-Max-Preview輸(shu)出(chu)了(le)以下“力量與速度種群(qun)模(mo)(mo)擬(增強版)”,準確模(mo)(mo)擬出(chu)了(le)具(ju)有躲避危險能力的小球,出(chu)現“誰(shui)也干不掉(diao)誰(shui)”的狀況。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

只會逃跑不會反擊,早晚還是被(bei)干掉。然后我(wo)要求速(su)度型(xing)種(zhong)群具有(you)協作進(jin)攻能力,輸(shu)入提示詞:

當速度型種群團結起來的時候,可以可以干掉單個的力量型個體,請加上這個能力再模擬一下。

Qwen3-Max-Preview依然能夠很好的實現,輸出了“力量與速度種群模擬(協作版)”,模擬出小綠球有了協作能力后能抵御紅球的能力,但雙方態勢依然很僵持。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

隨著模擬的進(jin)行,兩邊種(zhong)群(qun)越來越少,于(yu)是我們進(jin)一步(bu)要求Qwen3-Max-Preview給它們繁衍的能力,輸(shu)入提示詞:

當它們雙方干掉對方個體后,可以積累養分,繁衍自己,繼續模擬。

這次,Qwen3-Max-Preview輸出了“力(li)量與速度種(zhong)群模擬(資源與繁衍版)”,從模擬可以(yi)看到(dao),兩類球(qiu)(qiu)都(dou)自行開始裂變,在(zai)這種(zhong)情況下,紅球(qiu)(qiu)已(yi)經(jing)干不過綠球(qiu)(qiu)了。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

接著,我又輸入:

“發現力量型種群太弱了,它們根本抓不到對面,請給它們也提供團隊協作的能力,可以圍捕速度型選手。”

Qwen3-Max-Preview輸出了“力量與速度種群模擬(雙向(xiang)協(xie)作版)”,小綠球和小紅球分別形(xing)成(cheng)抱團(tuan)趨勢,從而形(xing)成(cheng)了兩邊“群毆圍(wei)攻”的態勢。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

通過這個有趣的小實驗我們發現,Qwen3-Max-Preview在提示詞表意很模糊的情況下,也能夠順利理解到用戶意圖

尤其是“躲避危險”、“團結”、“協作”、“繁衍”等表述是比較抽象的,且對應的實際含義很復雜,實現起來涉及調節的參數很多,但Qwen3-Max-Preview都在幾秒鐘之內準確理解語義及背后的邏輯,并完成模擬實驗的編程,體現其在復雜推理、指令執行、數學、編程等能力方面的出色能力

由百煉(lian)平(ping)臺可知,在定價方面,Qwen3-Max-Preview支持256k上下文,根據輸入token數采取階梯計費

輸入0-32k token價格:0.006元/千token輸入,0.024元/千token輸出。

輸入32k-128k token價格:0.01元/千token輸(shu)入,0.04元/千輸(shu)出。

輸入128k-252k token價格:0.015元/千token輸(shu)入,0.06元/token輸(shu)出。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

對比Qwen-Max-0919的0.02元/千token輸入、0.06元/千token輸出的價格,Qwen3-Max-Preview的定價更有層(ceng)次,性能更高但價格更加實(shi)惠。

超1萬億參數!阿里史上最大最強模型免費上線,實測幾秒完成程序員半天工作

體驗地址:
//chat.qwen.ai
阿里云百煉API服務:
//bailian.console.aliyun.com/?tab=model#/model-market

結語:超大Qwen3模型,證明規模化擴展效果

模型層(ceng)的(de)(de)突(tu)破正成為阿里AI轉型的(de)(de)第一張(zhang)王(wang)牌。在內部測試和早期(qi)用戶測評(ping)中,Qwen3-Max-Preview表現出更(geng)廣的(de)(de)知識(shi)面,更(geng)優秀(xiu)的(de)(de)對話能力,在Agent任務(wu)與指令(ling)遵循等方面擁有更(geng)強勁的(de)(de)性(xing)能。

通義(yi)千問大(da)(da)模(mo)(mo)型(xing)開源閉源兩手抓,已代表了中國大(da)(da)模(mo)(mo)型(xing)的技術新(xin)高度。Qwen3-Max-Preview刷新(xin)了阿(a)里大(da)(da)模(mo)(mo)型(xing)參數新(xin)紀(ji)錄,其試圖用更加強悍的性能(neng),證明規模(mo)(mo)化擴展的效果——更大(da)(da)的模(mo)(mo)型(xing)擁有更強的性能(neng)。

來(lai)源:百煉平臺(tai)、X平臺(tai)