
Anthropic 正透過 Project Glasswing 擴大其 Claude Mythos AI 模型的存取權限。此計畫旨在讓科技和安全公司以及政府在強大模型公開發布之前,發現並修復錯誤和潛在的漏洞。
Anthropic 在週二的一篇部落格文章中表示,隨著該公司準備更廣泛發布這個備受爭議的模型,它將約 150 個組織納入其受控計畫中。
此次擴大是在 Anthropic 表示預計在完成額外安全措施後,「未來幾週內」向客戶提供 Mythos 級模型之後進行的。這項消息也伴隨著 Anthropic 在週一向美國證券交易委員會秘密提交首次公開募股(IPO)申請後,準備上市的消息。
「在與我們的 Project Glasswing 合作夥伴、安全產業、開源軟體維護者和美國政府密切合作數週後,我們將合作夥伴關係擴展到大約 150 個新組織,」Anthropic 寫道。「每個組織在獲得存取權限之前都需要符合我們的安全要求。」
最新一輪的 Project Glasswing 擴展納入了來自關鍵基礎設施領域的組織,包括電力、水務、醫療保健、通訊和硬體。Anthropic 表示,許多新組織維護著政府和數億人使用的軟體。
「每個合作夥伴的共同點是,如果他們的程式碼庫受到成功攻擊,後果可能是災難性的,」Anthropic 寫道。「對於大多數合作夥伴而言,我們估計一次重大攻擊可能會影響超過 1 億人,對全球和國家安全產生重要影響。」
Claude Mythos 於三月公開曝光,此前 Anthropic 的草稿資料在網路上洩露。根據 Anthropic 的說法,此前獲得存取權限的組織已利用 Mythos 預覽版識別了超過 10,000 個高或關鍵嚴重性的軟體漏洞。合作夥伴還利用該模型編寫補丁、進行安全審查並在發布前測試軟體。
該模型的能力引發了研究人員和政府機構的擔憂,他們擔心功能日益強大的 AI 系統可能會讓網路攻擊更容易執行。
英國 AI 安全研究所報告稱,Mythos 在測試期間自主完成了 32 步模擬企業網路攻擊。Mozilla 表示,該模型識別了 Firefox 網路瀏覽器中 271 個已修復的漏洞,而安全新創公司 Calif 聲稱,預覽版本幫助研究人員開發了針對蘋果 M5 電腦晶片的漏洞鏈。
Anthropic 表示,擴大 Mythos 的存取權限是因為它相信防禦者需要越來越強大的 AI 工具,才能在攻擊者獲得類似能力之前做好準備。該公司表示,預計其他開發者將在六到十二個月內發布 Mythos 級模型,這些模型可能沒有類似的安全防護措施,這增加了網路攻擊頻率更高、更難以預測的可能性。
「未來,前沿模型(frontier model)的發布將變得風險越來越高。各個領域的能力將持續提升,包括許多像網路安全一樣,能同時賦予攻擊者和防禦者能力的領域,」Anthropic 寫道。「如果我們成功,我們希望為防禦者帶來永久的優勢。」
Anthropic 未立即回應 Decrypt 的置評請求。
隨著私人存取權的擴大,Myriad(一個由 Decrypt 的母公司 Dastan 營運的預測市場平台)上的用戶對 Claude Mythos 能否在六月底前公開發布的信心正在下降。截至撰寫本文時,他們預計的可能性僅為 26.5%,低於上週 58.5% 的峰值。 。