تجمیع برچسب اخبار کریپتو و اخبار اختصاصی

rio-ai-model-beat-deepseek-ownership-dispute-nex

ریودوژانیرو یک مدل هوش مصنوعی ساخت که دیپ‌سیک را شکست داد — اما بر اساس کار شخص دیگری بود

ریودوژانیرو یک مدل هوش مصنوعی پیشرو معرفی کرد که مدعی بود از بهترین مدل علی‌بابا پیشی می‌گیرد. سپس نکس با اسناد و مدارک حاضر شد.

2026-06-15 منبع:decrypt.co

هوش مصنوعی متن‌باز

به طور خلاصه

آی‌پلن‌ریو (IplanRIO) در ۱۳ ژوئن مدل Rio 3.5 Open 397B را منتشر کرد و آن را به عنوان یک مدل هوش مصنوعی پیشرفته ساخته شده توسط دولت معرفی کرد که امتیازات بنچمارک آن از Qwen 3.7 Plus پیشی گرفته است.
شرکت هوش مصنوعی Nex اثبات ریاضی منتشر کرد که نشان می‌دهد این مدل یک ادغام مستقیم وزن 0.6 Nex / 0.4 Qwen است.
آی‌پلن‌ریو کارت مدل را به‌روزرسانی کرد، به Nex اعتبار داد، ادعاهای بنچمارک را حذف کرد و دلیل آن را "آپلود نادرست" دانست.

آی‌پلن‌ریو (IplanRIO) شهر ریو دو ژانیرو، Rio 3.5 را در ۱۳ ژوئن منتشر کرد. سازمان فناوری اطلاعات این شهر آن را به عنوان یک مدل پیشرفته معرفی کرد: ۳۹۷ میلیارد پارامتر، با مجوز متن‌باز آزاد، که توسط دولت شهری در یکی از شهرهای جنوب جهانی ساخته شده است.

زمان عرضه Rio 3.5 عالی بود: برزیل در حال انجام بازی افتتاحیه جام جهانی بود و شبکه‌های اجتماعی از قبل پرشور بودند. نظرات درباره آن به سرعت از برزیل به فراتر از آن گسترش یافت.

اما به همان سرعتی که مورد توجه قرار گرفت، اختلافی بر سر اینکه دقیقاً چه کسی این مدل را ایجاد کرده است، به وجود آمد.

کارت مدل اصلی، Rio 3.5 را به عنوان یک مدل پس‌آموزش یافته از Qwen 3.5 397B، مدل پایه باز علی‌بابا، با یک لایه استدلال جدید به نام SwiReasoning در بالای آن توصیف کرده بود. هزینه توسعه ۵۰۰,۰۰۰ رئال (حدود ۱۰۰,۰۰۰ دلار آمریکا) گزارش شده بود (که ریو آن را تأیید نکرد) - تقریباً ۳۰ برابر ارزان‌تر از سیستم‌های هوش مصنوعی مشابه آماده.

معماری آن "ترکیب متخصصان" (Mixture-of-Experts) است، به این معنی که تنها حدود ۱۷ میلیارد از ۳۹۷ میلیارد پارامتر برای هر توکن فعال می‌شوند. این باعث می‌شود استنتاج ارزان‌تر از آنچه اندازه عنوان نشان می‌دهد باشد. این مدل همچنین از بینایی و متن پشتیبانی می‌کند، بیش از ده‌ها زبان را مدیریت می‌کند و تحت مجوز کاملاً آزاد MIT منتشر شده است.

SwiReasoning مرکز توجه فنی است. این یک چارچوب استنتاج بدون آموزش است که به صورت پویا بین دو حالت جابجا می‌شود. زمانی که مدل درباره کلمه بعدی مطمئن است - آنتروپی پایین در توزیع احتمال - به زبان ساده استدلال می‌کند. هنگامی که نامطمئن است، به استدلال نهفته می‌رود و در حالت‌های داخلی پنهان فکر می‌کند بدون اینکه توکن منتشر کند. آی‌پلن‌ریو گفت Rio 3.5 به طور خاص برای بهره‌برداری از این ویژگی آموزش دیده است و پیشرفت‌ها در اعداد بنچمارک نشان داده می‌شوند.

اعداد گزارش شده چشمگیر بودند. Terminal-Bench 2.1 - که اجرای مستقل دستورات ترمینال را بر حسب درصد وظایف انجام شده اندازه‌گیری می‌کند - برای Rio 3.5 به ۷۰.۸% رسید و از Qwen 3.7 Plus با ۷۰.۳% و DeepSeek v4 Pro قدرتمند با ۶۷.۹% پیشی گرفت.

در IMOAnswerBench، یک بنچمارک المپیاد ریاضی که بر حسب درصد پاسخ‌های صحیح امتیازدهی می‌شود، Rio 3.5 به ۸۹.۵% رسید. در HLE - آخرین امتحان بشریت، یک مجموعه چندحوزه‌ای متخصص تقریباً غیرقابل حل که بر حسب درصد امتیازدهی می‌شود - Rio 3.5 با ۳۶.۵%، بالاتر از Qwen 3.7 Plus با ۳۴.۷% قرار گرفت.

اینکه یک دولت شهری مهم‌ترین مدل‌های برجسته را در معنادارترین بنچمارک‌های کیفیت شکست دهد: این عنوانی بود که گسترش یافت، به ویژه پس از اینکه شهردار ریو دو ژانیرو در توییتر درباره آن نوشت.

ادواردو کاوالیره نوشت: "یک مدل هوش مصنوعی باز که در ریو آموزش دیده و در طول سال گذشته توسط [شهرداری ریو] با بودجه عمومی تأمین شده است، به تازگی از تمام مدل‌های دیگر پیشی گرفته است." "امروز، دنیا درباره یک مدل هوش مصنوعی باز که در ریو آموزش دیده صحبت می‌کند."

🇧🇷 Modelo de IA aberta treinada no Rio com financiamento público ao longo do último ano pela @Prefeitura_Rio superando todos os outros modelos. Inteligência artificial não é uma coisa distante, estrangeira, de laboratório bilionário…não existe só pra fazer texto, imagens… https://t.co/GK1ThytVV9

— Eduardo Cavaliere (@CavaliereRio) June 14, 2026

سپس Nex وارد صحنه شد

"آموزش دیده در ریو" آنقدر هم دقیق از آب در نیامد.

Nex-AGI، یک اتحاد هوش مصنوعی متن‌باز مستقر در شانگهای، روزها پس از انتشار در X (توییتر سابق) پستی منتشر کرد. آغازین آن: "مدل Rio 3.5 این هفته اینترنت را منفجر کرد. چرخش داستانی؟ این اساساً مدل متن‌باز ما، Nex N2 Pro، با ظاهری متفاوت است."

آنها وزن‌ها را تحلیل کرده بودند. محاسبات دقیق بود: Rio 3.5 ≈ 0.6 × Nex N2 Pro + 0.4 × Qwen 3.5. یک اسکریپت تأیید و یک گزارش کامل گیت‌هاب نیز به دنبال آن آمد.

The Rio 3.5 model broke the internet this week. The plot twist? It’s essentially our open-source model, Nex N2 Pro, wearing a different hat.

🤯 We analyzed the weights, and the recipe is exact: Rio 3.5 ≈ 0.6 * Nex N2 Pro + 0.4 * Qwen 3.5

It even literally introduces itself… pic.twitter.com/yHRRu37aut

— Nex (@NexEcosystem) June 14, 2026

شواهد در دو بخش ارائه شد.

اول، رفتاری. Nex پرامپت سیستمی "شما ریو هستید" که به صورت سخت کدگذاری شده بود را از مدل مستقر شده حذف کرد و ۱۲۰ سوال هویتی به آن فرستاد. Nex گزارش می‌دهد که بدون این پوشش، مدل در ۷۹.۲% مواقع خود را "Nex، از Nex-AGI" نامید. این مدل در هیچ موردی خود را "ریو" ننامید. Nex گفت که مدل همچنین داستان پس‌زمینه خاص شرکت را کلمه به کلمه بازگو کرد و به "موسسه نوآوری شانگهای" و "اتحاد اکوسیستم مدل‌های بزرگ" اشاره کرد. اینها داده‌های آموزشی خود Nex هستند که در مدل شخص دیگری ظاهر شده‌اند.

دوم، ریاضی. در یک ادغام وزن‌های واقعی، هر پارامتر در مدل جدید روی یک خط مستقیم بین دو مدل منبع قرار می‌گیرد. Nex این هم‌خطی را در تمام ۶۰ لایه اندازه‌گیری کرد. نتیجه ۰.۹۹۳ بود. دو مدل نامرتبط در یک فضای پارامتر به طور تصادفی امتیاز نزدیک به صفر کسب می‌کردند. رسیدن به ۰.۹۹۳ در هر لایه یک تصادف نیست. نسبت ترکیب در α ≈ ۰.۵۷۱، با پایداری تا سه رقم اعشار، ثابت ماند.

اساساً، تقریباً ۶۰٪ آن Nex بود و بقیه مدل پایه Qwen.

Nex نوشت: "هر تانسور وزن در ریو، با هزاران انحراف معیار، همان ترکیب 0.6/0.4 از Nex و Qwen است - در تمام ۶۰ لایه و هر جزء از شبکه." "هیچ توضیح بی‌گناهانه‌ای وجود ندارد."

Source: Nex Ecosystem — منبع: اکوسیستم Nex

اعداد نیز داستانی آرام‌تر را روایت می‌کردند. Nex N2 Pro، که تنها چند روز قبل از Rio 3.5 منتشر شد، در Terminal-Bench 2.1 امتیاز ۷۵.۳% را کسب کرد - بالاتر از ۷۰.۸% Rio. در GDPval، یک بنچمارک پیش‌بینی اقتصادی که با رتبه‌بندی سبک اِلو امتیازدهی می‌شود، Nex با ۱۵۸۵ در مقابل ۱۵۳۳ Rio قرار دارد. اگر Rio 60% Nex باشد، انتظار دارید که در بنچمارک‌های خود Nex، امتیازش کمتر از Nex باشد. که همینطور است.

پاسخ IplanRIO

آی‌پلن‌ریو کارت مدل Hugging Face را به‌روزرسانی کرد - جدول بنچمارک حذف شد و انتساب تغییر کرد.

در "Readme" به‌روزرسانی شده آمده است: "این مدل از طریق ادغام nex-agi/Nex-N2-Pro و Qwen/Qwen3.5-397B-A17B ساخته شده است، که با "تقطیر مبتنی بر سیاست" (On-Policy Distillation) از یک مدل قوی‌تر همراه بوده است. ما یک آپلود نادرست را در نسخه قبلی تشخیص دادیم، جایی که نسخه پایه ادغام شده به جای مدل نهایی تقطیر شده آپلود شده بود. ما برای این سردرگمی متأسفیم و عمیقاً عذرخواهی می‌کنیم."

هیچ بیانیه عمومی دیگری از آی‌پلن‌ریو منتشر نشده است. Nex اکنون به عنوان منبع ذکر شده است.

توضیح "آپلود نادرست" ادعای کلیدی است. آی‌پلن‌ریو می‌گوید که نسخه در نظر گرفته شده یک نسخه تقطیر شده از پایه ادغام شده بود - نه خود ادغام خام. تقطیر مبتنی بر سیاست به این معنی است که یک مدل معلم قوی‌تر خروجی تولید می‌کند و مدل دانش‌آموز بر اساس آن آموزش می‌بیند در حالی که خروجی‌های خود را نیز تولید می‌کند. این گران‌تر از یک ادغام خام است، اما هنوز هم ارزان‌تر از آموزش از صفر است. اگر آن مرحله واقعی بود، آنگاه حداقل برخی کارهای اصیل را علاوه بر ادغام نشان می‌داد.

آنچه در واقع عرضه شد، طبق گفته آی‌پلن‌ریو، پایه ادغام شده بدون هیچ افزوده‌ای بود.

ناظران جامعه درباره معنای این موضوع اختلاف نظر دارند. رافائل کینتانیلها، مفسر فناوری، تفسیر خیرخواهانه‌ای ارائه داد: از آنجا که Nex N2 Pro خود بر اساس Qwen ساخته شده است، تیم ممکن است معماری زیربنایی را ذکر کرده و به همان اکتفا کرده باشد. او همچنین اشاره کرد که این مدل در طول مسابقه جام جهانی فراگیر شد، "که لزوماً آماده 'مصرف عمومی' نبود."

about the Rio 3.5 situation

merging two ~400B-class models and then applying policy distillation isn’t trivial

that said, they made two mistakes:

- a technical error (probably caused by a lack of attention to detail)

- and a communication one (we can debate the integrity of…

— montano (@lucas_montano) June 15, 2026

لوکاس مونتانو، توسعه‌دهنده و یوتیوبر هوش مصنوعی، خاطرنشان کرد که "ادغام دو مدل کلاس ۴۰۰ میلیارد و سپس اعمال تقطیر مبتنی بر سیاست کار آسانی نیست" - در حالی که هم یک خطای فنی و هم یک شکست ارتباطی را تأیید کرد.

دیگو آمبروسیو، محقق هوش مصنوعی، کمتر سخاوتمند بود. عرضه اولیه، Rio 3.5 را نتیجه "پس‌آموزش مستقل و تنظیم دقیق اختصاصی" توصیف کرده بود - چارچوبی که به تحقیق اصیل اشاره داشت، نه یک ادغام ساده.

قانونی؟ بله. اخلاقی؟ خب...

ادغام مدل‌ها کاملاً قانونی است. Nex N2 Pro تحت مجوز Apache 2.0 است - شما می‌توانید از آن استفاده کنید، آن را تغییر دهید و بازنشر کنید، به شرطی که به آن اعتبار دهید. Qwen 3.5 نیز دارای مجوز آزاد است. هیچ کس به دادگاه نمی‌رود.

مشکل این بود که خروجی به عنوان کار مستقل توسعه یافته بدون ذکر نام تمام مدل‌های منبع ارائه شد. جامعه متن‌باز قبلاً این را دیده است. اوایل امسال، Composer 2 کرسر (Cursor) بدون افشاگری بر اساس Kimi K2.5 مون‌شات (Moonshot) ساخته شده بود. واکنش شدید و شهرتی بود - بدون وکیل، فقط اسکرین‌شات.

was messing with the OpenAI base URL in Cursor and caught this

accounts/anysphere/models/kimi-k2p5-rl-0317-s515-fast

so composer 2 is just Kimi K2.5 with RL
at least rename the model ID https://t.co/MQOuEuF3Pd pic.twitter.com/fyUWbo1InF

— fynn (@fynnso) March 19, 2026

ساختن بر اساس مدل‌های باز موجود طبیعی است. همانطور که Decrypt پوشش داده است، انباشت و ادغام وزن‌های باز عملاً یک خرده‌فرهنگ خاص است. هنجار این نیست که "بر روی کار دیگران بنا نکنید." هنجار این است: بگویید از چه چیزی استفاده کرده‌اید.

آنچه این موضوع را پرسروصداتر از یک اشتباه معمولی در انتساب کرد، پوشش نهادی بود. یک توسعه‌دهنده ناشناس که یک ادغام نامتعارف را تحت نام خود منتشر می‌کند یک چیز است. یک دولت شهری که از آن برای ادعای حاکمیت هوش مصنوعی بخش عمومی - در طول جام جهانی - استفاده می‌کند، چیز دیگری. یک مفسر برزیلی نوشت: "این هدر دادن منابع بود."

Nex این موضوع را به یک جنگ تبدیل نکرد. این شرکت در X نوشت: "ما خوشحالیم که شهر ریو از کار ما برای دستیابی به عملکرد SOTA (پیشرفته‌ترین) استفاده کرده است. اما در دنیای متن‌باز، انتساب اهمیت دارد."

آی‌پلن‌ریو در حال کار بر روی آپلود مدل اصلاح شده و تقطیر شده با انتساب کامل است. زمانی که این مدل منتشر شود، همان بررسی‌ها دوباره انجام خواهد شد - و جامعه متوجه خواهد شد که آیا تقطیر واقعاً چیزی را تغییر داده است یا اینکه هنوز عمدتاً Nex با یک پرامپت سیستمی متفاوت است.

مطالب پربازدید

گروه‌های صنعت بازی آمریکا از سنا خواستند تا بازارهای پیش‌بینی ورزشی را در لایحه رمزارزی ممنوع کند: گزارش

7 ساعت قبل

بیت‌گو زیرساخت منطبق با MiCA را به شرکت‌های رمزارز در آستانه ضرب‌الاجل اتحادیه اروپا ارائه می‌دهد

12 ساعت قبل

حجم معاملات پرپس کالشی از ۵.۵ میلیارد دلار عبور کرد؛ با نگاهی به بازارهای فراتر از کریپتو

14 ساعت قبل

سایر مقالات

توافق سنا و مجلس نمایندگان بر سر لایحه مسکن جهت ممنوعیت CBDC تا سال ۲۰۳۰

4 ساعت قبل

گروه‌های صنعت بازی آمریکا از سنا خواستند تا بازارهای پیش‌بینی ورزشی را در لایحه رمزارزی ممنوع کند: گزارش

7 ساعت قبل