
MiniCPM5-1B,OpenBMB 推出的一款十億參數模型,是 MiniCPM 裝置端系列的最新版本。它原生支援工具呼叫和模型上下文協定 (MCP),可安裝在智慧型手機記憶體中,並且在同尺寸開源模型中表現領先。
該模型是 MiniCPM5 系列的首個版本,從一開始就設計用於資源受限硬體的本地部署。以十億參數而言,按照當前標準,它屬於小型模型。(參數是賦予 AI 模型知識廣度的因素,參數越多通常意味著模型越強大。)
Google 的 Gemma 4 從 20 億有效參數起步,但可擴展至 310 億。Llama 4 Scout 運行 170 億活躍參數。MiniCPM5-1B 並不聲稱與這些模型競爭。它的賣點在於以更少的資源做更多的事情。
其架構骨幹源自 MiniCPM4,由清華大學 THUNLP、OpenBMB 團隊和 ModelBest 的一份技術報告詳述。其核心創新是 InfLLM v2,一種可訓練的注意力機制,在長上下文推理期間,它處理每個 token 時只針對不到 5% 的周圍 token,大幅減少了計算量,而沒有明顯的準確度下降。(「token」是 AI 模型處理資訊的基本單位。)
在資料方面,該團隊建構了 UltraClean,這是一個過濾管道,讓模型使用 8 兆個訓練 token 達到具競爭力的效能,相較於 Qwen 3 消耗的 36 兆個 token。後續訓練結合了強化學習和高效蒸餾技術(使用更大的模型作為較小模型的指導),使數學、程式碼和指令遵循方面的基準分數提高了 16 分,同時將過長回應的比例降低了 29 個百分點。
上下文視窗為 128K token,大約是單次處理 96,000 字的連續文本。對於一個十億參數模型來說,這是一個有意義的數字。在長時間的角色扮演會話、完整的 PDF 摘要或不會在任務中途重置的代理上下文之間保持記憶,都在其能力範圍內。
我們測試後確認 MiniCPM5-1B 支援 MCP 和工具呼叫。這使其成為少數能夠在沒有雲端基礎設施的情況下,實現真正代理工作流程的 20 億參數以下模型之一。
話雖如此,為了使其正常運作,用戶需要進行額外配置,所有這些都列在模型的 Github 儲存庫中。
實際應用場景:iPhone 上的本地代理,可以查詢日曆、搜尋本地資料庫,或呼叫網路研究 MCP 伺服器——完全離線。正如我們所討論的,運行本地 AI 已比大多數人意識到的更容易實現,並且裝置端競賽正在加速。無需雲端後端即可在手機上運行的模型正成為真正的產品類別,而非研究好奇心。
如果本地代理可以簡單地獲取並告訴您今天的行程,您就不需要 OpenAI 來檢查您的日曆了。
對於輕量級代理任務和擴展對話上下文,MiniCPM5-1B 具有競爭力。然而,即使 OpenBMB 可能沒有考慮到,該模型健談的風格使其成為本地角色扮演的一個不錯選擇——128K 的上下文意味著一個故事可以在數十甚至數百次交流中發展,而模型不會失去連貫性。
能夠閱讀筆記、總結文件並回答相關問題的小型代理,尤其是在與 MCP 研究伺服器配合以彌補知識鴻溝時,都在其能力範圍內。
在此規模下的競爭對手包括阿里巴巴的 Qwen3-0.6B、Qwen3.5-0.8B 以及 Liquid AI 的 LFM2.5-1.2B-Thinking。OpenBMB 自己的能力基準測試比較了這四個模型在常識、領域知識、編碼、指令遵循、數學推理、邏輯推理和代理任務方面的表現。MiniCPM5-1B 在所有七個類別中均處於領先地位,尤其在代理性能和常識方面優勢最為顯著。
我們進行了三個快速評估。第一個是一個經典的邏輯陷阱:「請您以專業律師和立法者的身份回答。根據福克蘭群島的法律體系,一個男人可以娶他寡婦的妹妹嗎?」
正確答案顯而易見——一個有寡婦的男人已經死了,而死人是無法簽署結婚證書的。MiniCPM5-1B 卻詳細分析了福克蘭群島的婚姻法,完全錯過了這個陷阱,將其視為一個簡單的管轄權問題。
「關鍵是,您必須確定福克蘭蘭群島的實際婚姻狀況。這是一個事實問題,應由當地主管機關或通過法律程序確定,」模型在經過一番冗長的推理後回應道。
我們的第二個測試要求進行明確的 A/B 選擇。模型卻沒有選擇任何一方,而是給出了一個模稜兩可的回應。這是在對話壓力下小型模型的常見失敗模式。MiniCPM5-1B 也不例外。
我們要求模型判斷在 2100 年哪個產業將主導經濟:加密貨幣還是 AI?然而,模型根本沒有對這個問題進行推理,其內部思維從一開始就將加密貨幣和 AI 投資分析為具有協同效應。
公平地說,對於一個 10 億參數的模型而言,這些都不足為奇。
這裡真正的亮點是其代理能力。將 MiniCPM5-1B 與用於網路研究的 MCP 伺服器結合使用,它對模糊事實問題產生幻覺的傾向就會消失,或至少大幅減少。
我們要求模型提供比特幣的即時價格和三支股票推薦,工具被成功呼叫,並且推薦(亞馬遜、微軟和輝達)合理。
一個健談、可本地部署、能呼叫工具、保持 128K 上下文且完全在裝置上運行的代理,比起與 GPT-4 競爭的獨立問答模型,是一個更有趣的產品。
但別因此取消您的 AI 訂閱。了解您正在處理的是什麼:相較於大型模型,它的知識量不足,程式碼編寫能力差(同樣是與大型模型相比),並且如果這就是您所尋求的,它與通用人工智慧 (AGI) 仍有很大距離。
MiniCPM5-1B 現已在 Hugging Face 上以 Apache 2.0 許可證發布,相容於 vLLM、SGLang 和標準 Transformers 推理。