
آیپلنریو (IplanRIO) شهر ریو دو ژانیرو، Rio 3.5 را در ۱۳ ژوئن منتشر کرد. سازمان فناوری اطلاعات این شهر آن را به عنوان یک مدل پیشرفته معرفی کرد: ۳۹۷ میلیارد پارامتر، با مجوز متنباز آزاد، که توسط دولت شهری در یکی از شهرهای جنوب جهانی ساخته شده است.
زمان عرضه Rio 3.5 عالی بود: برزیل در حال انجام بازی افتتاحیه جام جهانی بود و شبکههای اجتماعی از قبل پرشور بودند. نظرات درباره آن به سرعت از برزیل به فراتر از آن گسترش یافت.
اما به همان سرعتی که مورد توجه قرار گرفت، اختلافی بر سر اینکه دقیقاً چه کسی این مدل را ایجاد کرده است، به وجود آمد.
کارت مدل اصلی، Rio 3.5 را به عنوان یک مدل پسآموزش یافته از Qwen 3.5 397B، مدل پایه باز علیبابا، با یک لایه استدلال جدید به نام SwiReasoning در بالای آن توصیف کرده بود. هزینه توسعه ۵۰۰,۰۰۰ رئال (حدود ۱۰۰,۰۰۰ دلار آمریکا) گزارش شده بود (که ریو آن را تأیید نکرد) - تقریباً ۳۰ برابر ارزانتر از سیستمهای هوش مصنوعی مشابه آماده.
معماری آن "ترکیب متخصصان" (Mixture-of-Experts) است، به این معنی که تنها حدود ۱۷ میلیارد از ۳۹۷ میلیارد پارامتر برای هر توکن فعال میشوند. این باعث میشود استنتاج ارزانتر از آنچه اندازه عنوان نشان میدهد باشد. این مدل همچنین از بینایی و متن پشتیبانی میکند، بیش از دهها زبان را مدیریت میکند و تحت مجوز کاملاً آزاد MIT منتشر شده است.
SwiReasoning مرکز توجه فنی است. این یک چارچوب استنتاج بدون آموزش است که به صورت پویا بین دو حالت جابجا میشود. زمانی که مدل درباره کلمه بعدی مطمئن است - آنتروپی پایین در توزیع احتمال - به زبان ساده استدلال میکند. هنگامی که نامطمئن است، به استدلال نهفته میرود و در حالتهای داخلی پنهان فکر میکند بدون اینکه توکن منتشر کند. آیپلنریو گفت Rio 3.5 به طور خاص برای بهرهبرداری از این ویژگی آموزش دیده است و پیشرفتها در اعداد بنچمارک نشان داده میشوند.
اعداد گزارش شده چشمگیر بودند. Terminal-Bench 2.1 - که اجرای مستقل دستورات ترمینال را بر حسب درصد وظایف انجام شده اندازهگیری میکند - برای Rio 3.5 به ۷۰.۸% رسید و از Qwen 3.7 Plus با ۷۰.۳% و DeepSeek v4 Pro قدرتمند با ۶۷.۹% پیشی گرفت.
در IMOAnswerBench، یک بنچمارک المپیاد ریاضی که بر حسب درصد پاسخهای صحیح امتیازدهی میشود، Rio 3.5 به ۸۹.۵% رسید. در HLE - آخرین امتحان بشریت، یک مجموعه چندحوزهای متخصص تقریباً غیرقابل حل که بر حسب درصد امتیازدهی میشود - Rio 3.5 با ۳۶.۵%، بالاتر از Qwen 3.7 Plus با ۳۴.۷% قرار گرفت.
اینکه یک دولت شهری مهمترین مدلهای برجسته را در معنادارترین بنچمارکهای کیفیت شکست دهد: این عنوانی بود که گسترش یافت، به ویژه پس از اینکه شهردار ریو دو ژانیرو در توییتر درباره آن نوشت.
ادواردو کاوالیره نوشت: "یک مدل هوش مصنوعی باز که در ریو آموزش دیده و در طول سال گذشته توسط [شهرداری ریو] با بودجه عمومی تأمین شده است، به تازگی از تمام مدلهای دیگر پیشی گرفته است." "امروز، دنیا درباره یک مدل هوش مصنوعی باز که در ریو آموزش دیده صحبت میکند."
🇧🇷 Modelo de IA aberta treinada no Rio com financiamento público ao longo do último ano pela @Prefeitura_Rio superando todos os outros modelos. Inteligência artificial não é uma coisa distante, estrangeira, de laboratório bilionário…não existe só pra fazer texto, imagens… https://t.co/GK1ThytVV9
— Eduardo Cavaliere (@CavaliereRio) June 14, 2026
"آموزش دیده در ریو" آنقدر هم دقیق از آب در نیامد.
Nex-AGI، یک اتحاد هوش مصنوعی متنباز مستقر در شانگهای، روزها پس از انتشار در X (توییتر سابق) پستی منتشر کرد. آغازین آن: "مدل Rio 3.5 این هفته اینترنت را منفجر کرد. چرخش داستانی؟ این اساساً مدل متنباز ما، Nex N2 Pro، با ظاهری متفاوت است."
آنها وزنها را تحلیل کرده بودند. محاسبات دقیق بود: Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5. یک اسکریپت تأیید و یک گزارش کامل گیتهاب نیز به دنبال آن آمد.
The Rio 3.5 model broke the internet this week. The plot twist? It’s essentially our open-source model, Nex N2 Pro, wearing a different hat.
🤯 We analyzed the weights, and the recipe is exact: Rio 3.5 ≈ 0.6 * Nex N2 Pro + 0.4 * Qwen 3.5
It even literally introduces itself… pic.twitter.com/yHRRu37aut
— Nex (@NexEcosystem) June 14, 2026
شواهد در دو بخش ارائه شد.
اول، رفتاری. Nex پرامپت سیستمی "شما ریو هستید" که به صورت سخت کدگذاری شده بود را از مدل مستقر شده حذف کرد و ۱۲۰ سوال هویتی به آن فرستاد. Nex گزارش میدهد که بدون این پوشش، مدل در ۷۹.۲% مواقع خود را "Nex، از Nex-AGI" نامید. این مدل در هیچ موردی خود را "ریو" ننامید. Nex گفت که مدل همچنین داستان پسزمینه خاص شرکت را کلمه به کلمه بازگو کرد و به "موسسه نوآوری شانگهای" و "اتحاد اکوسیستم مدلهای بزرگ" اشاره کرد. اینها دادههای آموزشی خود Nex هستند که در مدل شخص دیگری ظاهر شدهاند.
دوم، ریاضی. در یک ادغام وزنهای واقعی، هر پارامتر در مدل جدید روی یک خط مستقیم بین دو مدل منبع قرار میگیرد. Nex این همخطی را در تمام ۶۰ لایه اندازهگیری کرد. نتیجه ۰.۹۹۳ بود. دو مدل نامرتبط در یک فضای پارامتر به طور تصادفی امتیاز نزدیک به صفر کسب میکردند. رسیدن به ۰.۹۹۳ در هر لایه یک تصادف نیست. نسبت ترکیب در α ≈ ۰.۵۷۱، با پایداری تا سه رقم اعشار، ثابت ماند.
اساساً، تقریباً ۶۰٪ آن Nex بود و بقیه مدل پایه Qwen.
Nex نوشت: "هر تانسور وزن در ریو، با هزاران انحراف معیار، همان ترکیب 0.6/0.4 از Nex و Qwen است - در تمام ۶۰ لایه و هر جزء از شبکه." "هیچ توضیح بیگناهانهای وجود ندارد."
اعداد نیز داستانی آرامتر را روایت میکردند. Nex N2 Pro، که تنها چند روز قبل از Rio 3.5 منتشر شد، در Terminal-Bench 2.1 امتیاز ۷۵.۳% را کسب کرد - بالاتر از ۷۰.۸% Rio. در GDPval، یک بنچمارک پیشبینی اقتصادی که با رتبهبندی سبک اِلو امتیازدهی میشود، Nex با ۱۵۸۵ در مقابل ۱۵۳۳ Rio قرار دارد. اگر Rio 60% Nex باشد، انتظار دارید که در بنچمارکهای خود Nex، امتیازش کمتر از Nex باشد. که همینطور است.
آیپلنریو کارت مدل Hugging Face را بهروزرسانی کرد - جدول بنچمارک حذف شد و انتساب تغییر کرد.
در "Readme" بهروزرسانی شده آمده است: "این مدل از طریق ادغام nex-agi/Nex-N2-Pro و Qwen/Qwen3.5-397B-A17B ساخته شده است، که با "تقطیر مبتنی بر سیاست" (On-Policy Distillation) از یک مدل قویتر همراه بوده است. ما یک آپلود نادرست را در نسخه قبلی تشخیص دادیم، جایی که نسخه پایه ادغام شده به جای مدل نهایی تقطیر شده آپلود شده بود. ما برای این سردرگمی متأسفیم و عمیقاً عذرخواهی میکنیم."
هیچ بیانیه عمومی دیگری از آیپلنریو منتشر نشده است. Nex اکنون به عنوان منبع ذکر شده است.
توضیح "آپلود نادرست" ادعای کلیدی است. آیپلنریو میگوید که نسخه در نظر گرفته شده یک نسخه تقطیر شده از پایه ادغام شده بود - نه خود ادغام خام. تقطیر مبتنی بر سیاست به این معنی است که یک مدل معلم قویتر خروجی تولید میکند و مدل دانشآموز بر اساس آن آموزش میبیند در حالی که خروجیهای خود را نیز تولید میکند. این گرانتر از یک ادغام خام است، اما هنوز هم ارزانتر از آموزش از صفر است. اگر آن مرحله واقعی بود، آنگاه حداقل برخی کارهای اصیل را علاوه بر ادغام نشان میداد.
آنچه در واقع عرضه شد، طبق گفته آیپلنریو، پایه ادغام شده بدون هیچ افزودهای بود.
ناظران جامعه درباره معنای این موضوع اختلاف نظر دارند. رافائل کینتانیلها، مفسر فناوری، تفسیر خیرخواهانهای ارائه داد: از آنجا که Nex N2 Pro خود بر اساس Qwen ساخته شده است، تیم ممکن است معماری زیربنایی را ذکر کرده و به همان اکتفا کرده باشد. او همچنین اشاره کرد که این مدل در طول مسابقه جام جهانی فراگیر شد، "که لزوماً آماده 'مصرف عمومی' نبود."
about the Rio 3.5 situation
merging two ~400B-class models and then applying policy distillation isn’t trivial
that said, they made two mistakes:
- a technical error (probably caused by a lack of attention to detail)
- and a communication one (we can debate the integrity of…
— montano (@lucas_montano) June 15, 2026
لوکاس مونتانو، توسعهدهنده و یوتیوبر هوش مصنوعی، خاطرنشان کرد که "ادغام دو مدل کلاس ۴۰۰ میلیارد و سپس اعمال تقطیر مبتنی بر سیاست کار آسانی نیست" - در حالی که هم یک خطای فنی و هم یک شکست ارتباطی را تأیید کرد.
دیگو آمبروسیو، محقق هوش مصنوعی، کمتر سخاوتمند بود. عرضه اولیه، Rio 3.5 را نتیجه "پسآموزش مستقل و تنظیم دقیق اختصاصی" توصیف کرده بود - چارچوبی که به تحقیق اصیل اشاره داشت، نه یک ادغام ساده.
ادغام مدلها کاملاً قانونی است. Nex N2 Pro تحت مجوز Apache 2.0 است - شما میتوانید از آن استفاده کنید، آن را تغییر دهید و بازنشر کنید، به شرطی که به آن اعتبار دهید. Qwen 3.5 نیز دارای مجوز آزاد است. هیچ کس به دادگاه نمیرود.
مشکل این بود که خروجی به عنوان کار مستقل توسعه یافته بدون ذکر نام تمام مدلهای منبع ارائه شد. جامعه متنباز قبلاً این را دیده است. اوایل امسال، Composer 2 کرسر (Cursor) بدون افشاگری بر اساس Kimi K2.5 مونشات (Moonshot) ساخته شده بود. واکنش شدید و شهرتی بود - بدون وکیل، فقط اسکرینشات.
was messing with the OpenAI base URL in Cursor and caught this
accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast
so composer 2 is just Kimi K2.5 with RL
at least rename the model ID https://t.co/MQOuEuF3Pd pic.twitter.com/fyUWbo1InF— fynn (@fynnso) March 19, 2026
ساختن بر اساس مدلهای باز موجود طبیعی است. همانطور که Decrypt پوشش داده است، انباشت و ادغام وزنهای باز عملاً یک خردهفرهنگ خاص است. هنجار این نیست که "بر روی کار دیگران بنا نکنید." هنجار این است: بگویید از چه چیزی استفاده کردهاید.
آنچه این موضوع را پرسروصداتر از یک اشتباه معمولی در انتساب کرد، پوشش نهادی بود. یک توسعهدهنده ناشناس که یک ادغام نامتعارف را تحت نام خود منتشر میکند یک چیز است. یک دولت شهری که از آن برای ادعای حاکمیت هوش مصنوعی بخش عمومی - در طول جام جهانی - استفاده میکند، چیز دیگری. یک مفسر برزیلی نوشت: "این هدر دادن منابع بود."
Nex این موضوع را به یک جنگ تبدیل نکرد. این شرکت در X نوشت: "ما خوشحالیم که شهر ریو از کار ما برای دستیابی به عملکرد SOTA (پیشرفتهترین) استفاده کرده است. اما در دنیای متنباز، انتساب اهمیت دارد."
آیپلنریو در حال کار بر روی آپلود مدل اصلاح شده و تقطیر شده با انتساب کامل است. زمانی که این مدل منتشر شود، همان بررسیها دوباره انجام خواهد شد - و جامعه متوجه خواهد شد که آیا تقطیر واقعاً چیزی را تغییر داده است یا اینکه هنوز عمدتاً Nex با یک پرامپت سیستمی متفاوت است.