加密新聞標籤聚合與專題資訊

openbmb-minicpm5-half-gigabyte-ai-model-local-agents-phone

這個半GB AI模型在手機上運行本機代理

OpenBMB 的 10 億參數模型將 MCP 支援和智能體工具使用帶到了裝置端 AI，但它在應對邏輯陷阱時仍有困難。

2026-05-26 來源:decrypt.co

BTC

AI 代理

裝置端 AI

重點摘要

MiniCPM5-1B 在代理和推理基準測試中平均得分 42.57，擊敗了次優的 1B 級競爭對手 35.61。
該模型原生支援 MCP 和工具呼叫，無需雲端連線即可在消費級硬體上實現本地代理工作流程。
在我們的測試中，該模型展現了強大的對話流暢度，但卻產生了幻覺式的思維鏈回應，並未能通過一個基本的邏輯陷阱。

MiniCPM5-1B，OpenBMB 推出的一款十億參數模型，是 MiniCPM 裝置端系列的最新版本。它原生支援工具呼叫和模型上下文協定 (MCP)，可安裝在智慧型手機記憶體中，並且在同尺寸開源模型中表現領先。

該模型是 MiniCPM5 系列的首個版本，從一開始就設計用於資源受限硬體的本地部署。以十億參數而言，按照當前標準，它屬於小型模型。（參數是賦予 AI 模型知識廣度的因素，參數越多通常意味著模型越強大。）

Google 的 Gemma 4 從 20 億有效參數起步，但可擴展至 310 億。Llama 4 Scout 運行 170 億活躍參數。MiniCPM5-1B 並不聲稱與這些模型競爭。它的賣點在於以更少的資源做更多的事情。

建構方式

其架構骨幹源自 MiniCPM4，由清華大學 THUNLP、OpenBMB 團隊和 ModelBest 的一份技術報告詳述。其核心創新是 InfLLM v2，一種可訓練的注意力機制，在長上下文推理期間，它處理每個 token 時只針對不到 5% 的周圍 token，大幅減少了計算量，而沒有明顯的準確度下降。（「token」是 AI 模型處理資訊的基本單位。）

在資料方面，該團隊建構了 UltraClean，這是一個過濾管道，讓模型使用 8 兆個訓練 token 達到具競爭力的效能，相較於 Qwen 3 消耗的 36 兆個 token。後續訓練結合了強化學習和高效蒸餾技術（使用更大的模型作為較小模型的指導），使數學、程式碼和指令遵循方面的基準分數提高了 16 分，同時將過長回應的比例降低了 29 個百分點。

上下文視窗為 128K token，大約是單次處理 96,000 字的連續文本。對於一個十億參數模型來說，這是一個有意義的數字。在長時間的角色扮演會話、完整的 PDF 摘要或不會在任務中途重置的代理上下文之間保持記憶，都在其能力範圍內。

為何一個「能力有限」的代理也可能足夠

我們測試後確認 MiniCPM5-1B 支援 MCP 和工具呼叫。這使其成為少數能夠在沒有雲端基礎設施的情況下，實現真正代理工作流程的 20 億參數以下模型之一。

話雖如此，為了使其正常運作，用戶需要進行額外配置，所有這些都列在模型的 Github 儲存庫中。

實際應用場景：iPhone 上的本地代理，可以查詢日曆、搜尋本地資料庫，或呼叫網路研究 MCP 伺服器——完全離線。正如我們所討論的，運行本地 AI 已比大多數人意識到的更容易實現，並且裝置端競賽正在加速。無需雲端後端即可在手機上運行的模型正成為真正的產品類別，而非研究好奇心。

如果本地代理可以簡單地獲取並告訴您今天的行程，您就不需要 OpenAI 來檢查您的日曆了。

對於輕量級代理任務和擴展對話上下文，MiniCPM5-1B 具有競爭力。然而，即使 OpenBMB 可能沒有考慮到，該模型健談的風格使其成為本地角色扮演的一個不錯選擇——128K 的上下文意味著一個故事可以在數十甚至數百次交流中發展，而模型不會失去連貫性。

能夠閱讀筆記、總結文件並回答相關問題的小型代理，尤其是在與 MCP 研究伺服器配合以彌補知識鴻溝時，都在其能力範圍內。

在此規模下的競爭對手包括阿里巴巴的 Qwen3-0.6B、Qwen3.5-0.8B 以及 Liquid AI 的 LFM2.5-1.2B-Thinking。OpenBMB 自己的能力基準測試比較了這四個模型在常識、領域知識、編碼、指令遵循、數學推理、邏輯推理和代理任務方面的表現。MiniCPM5-1B 在所有七個類別中均處於領先地位，尤其在代理性能和常識方面優勢最為顯著。