
به گزارش فایننشال تایمز در روز پنجشنبه، Anthropic حدود شش مهندس را در آژانس امنیت ملی (NSA) مستقر کرده است تا به استقرار Mythos—قویترین مدل هوش مصنوعی این شرکت—برای عملیات سایبری تهاجمی کمک کنند.
این مهندسان، کارکنان مستقر در محل هستند که مدل را برای کاربردهای خاص شخصیسازی میکنند. یک منبع به فایننشال تایمز گفت که این مدل میتواند برای نفوذ به شبکهها در کشورهایی مانند چین و ایران مفید باشد.
اینکه آیا این مهندسان در عملیات فعال مشارکت دارند، تأیید نشده است. اما آنچه تأیید شده: Mythos همان مدلی است که Anthropic به دلیل خطر سوءاستفاده از انتشار عمومی آن خودداری کرده است. این شرکت آن را از طریق پروژه گلسوینگ—یک ائتلاف محدود که شامل مایکروسافت، اپل و آمازون میشود—به شرکای معتبر خود محدود کرده است.
Anthropic همچنین در حال شکایت از پنتاگون است. در اواخر فوریه، پیت هگست، وزیر دفاع، این شرکت را به عنوان یک "ریسک زنجیره تأمین" معرفی کرد—برچسبی که به طور تاریخی برای دشمنان خارجی مانند هواوی محفوظ بوده است—پس از اینکه یک قرارداد ۲۰۰ میلیون دلاری فروپاشید. نکته اختلاف: Anthropic از اجازه دادن به وزارت دفاع (DoD) برای استفاده از Claude در تسلیحات کاملا خودکار یا نظارت گسترده داخلی خودداری کرد. قرارداد NSA از این ممنوعیت مستثنی بود.
یک قاضی کالیفرنیا این سیاه نمایی را به عنوان تلافی آشکار بر اساس متمم اول قانون اساسی متوقف کرد. یک دادگاه تجدیدنظر در واشنگتن دیسی درخواست Anthropic برای توقف آن را در حین پیگیری پرونده قضایی رد کرد. بر اساس گزارش فایننشال تایمز، NSA در تمام این مدت به استفاده از Mythos ادامه داد.
چگونه هوش مصنوعیای که خودش، هوش مصنوعی میسازد را متوقف کنیم
در همان روزی که داستان NSA منتشر شد، موسسه تحقیقات داخلی Anthropic مقالهای با عنوان "وقتی هوش مصنوعی خودش را میسازد" منتشر کرد که به بررسی میزان پیشرفت Claude در خودکارسازی توسعه خود میپردازد. در این مقاله، این شرکت اساساً خواستار یک توقف جهانی در مسابقه تسلیحات هوش مصنوعی شده و حتی آن را با معاهدات هستهای دوران جنگ سرد بین ایالات متحده و روسیه مقایسه کرده است.
برای درک دلیل، این شرکت این نکته را ارائه کرده است:
Claude اکنون بیش از ۸۰% کد ادغام شده در پایگاه کد تولید Anthropic را مینویسد—این میزان قبل از راهاندازی Claude Code در اوایل سال ۲۰۲۵، تنها چند درصد بود. مهندسان در حال حاضر حدود هشت برابر بیشتر از سال ۲۰۲۴، کد در روز ارائه میدهند.
نویسندگان این گزارش—مارینا فاوارو، رئیس موسسه Anthropic و جک کلارک، همبنیانگذار—استدلال میکنند که این مسیر به سمت چیزی که آنها "خودبهبودی بازگشتی" مینامند، پیش میرود: سیستمهای هوش مصنوعی که به طور مستقل جانشینان خود را طراحی، میسازند و آموزش میدهند، با نقش کاهنده انسانها در هر مرحله.
در یک نمایش بصری، محققان یک جدول زمانی را نشان میدهند که در آن اولین روش استفاده از هوش مصنوعی در کار، انسانها بودند که به کامپیوتر فرمان میدادند تا نتیجهای بگیرد، با افزایش خودکارسازیها که به عاملهای هوش مصنوعی فرمان میدهند تا زیرعاملها را فرمان دهند تا نتیجه به دست آید، بدون دخالت انسان.
نکته دقیق دادهای که آنها به آن اشاره میکنند: در ماه آوریل، عاملهای Claude با یک مشکل باز ایمنی هوش مصنوعی—اینکه آیا یک مدل ضعیفتر میتواند با اطمینان بر یک مدل قویتر نظارت کند—روبهرو شدند و اجازه داده شد آن را اجرا کنند. دو محقق انسانی طی حدود یک هفته، ۲۳ درصد از شکاف عملکرد بین مدلها را جبران کردند. عاملها ۹۷ درصد را، طی بیش از ۸۰۰ ساعت محاسباتی تجمعی، جبران کردند. انسانها سوال را مطرح کردند. عاملها هر آزمایش را طراحی کردند. این اولین مورد منتشر شده از اعمال قضاوت تحقیقاتی توسط Claude است، نه فقط اجرای وظایف مشخص شده توسط شخص دیگر.
این همان خطی است که Anthropic نگران عبور از آن است. زمانی که هوش مصنوعی انتخاب کند کدام آزمایشها ارزش اجرا دارند—نه فقط آنها را اجرا کند—انسانها آخرین نقش معنادار خود را در چرخه توسعه از دست میدهند. عدم همسوییهای کوچک قابل مشاهده در مدلهای امروزی میتوانند در طول نسلهای خودبهبودکننده تشدید شوند تا زمانی که هیچکس نتواند آنها را اصلاح کند.
راه حل پیشنهادی آنها یک توقف جهانی قابل تأیید است—چندین آزمایشگاه پیشرو به طور همزمان متوقف شوند، با تأیید مستقل که همه واقعاً متوقف شدهاند. Anthropic گفت که به آن ملحق خواهد شد. آنها اعتراف میکنند که کند کردن یکجانبه، تنها رهبری را به کسی میدهد که به کار ادامه داده است.
این فیلم را قبلاً دیدهایم. آزمایشگاههایی که هوش مصنوعی میسازند، همانهایی هستند که درباره خطر هوش مصنوعی هشدار میدهند. با این حال، هوش مصنوعی سودآورترین کسبوکار دهه است، بنابراین هیچکس نمیخواهد متوقف شود—حتی آنهایی که درباره هوش مصنوعی هشدار میدهند.
در سال ۲۰۲۳، بیش از صد نام بزرگ در جامعه تحقیقات هوش مصنوعی نامهای سرگشاده امضا کردند و خواستار تلاشی جهانی برای کاهش خطر انقراضی شدند که توسعه هوش مصنوعی ذاتاً با خود دارد. چند ماه قبل از آن، نامه سرگشاده دیگری خواستار توقف پیشرفتهای OpenAI در ChatGPT به دلیل ماهیت خطرناک آن شد.
پس از نامه سرگشاده سال ۲۰۲۳، هیچکس متوقف نشد. OpenAI متوقف نشد. Anthropic هم متوقف نشد. مهلت پنتاگون برای حذف Claude از سیستمهایش در ماه اوت به پایان میرسد، تقریباً در همان زمانی که انتظار میرود عرضه اولیه سهام Anthropic وضعیت مالی آن را عمومی کند.