در ماه مه، Anthropic از دو سیستم هوش مصنوعی جدید به نامهای Opus 4 و Sonnet 4 رونمایی کرد. اکنون، کمتر از شش ماه بعد، این شرکت Sonnet 4.5 را معرفی میکند و آن را بهترین مدل کدنویسی در جهان تا به امروز مینامد. مبنای ادعای Anthropic مجموعهای از معیارها است که در آن هوش مصنوعی جدید نه تنها از مدل قبلی خود، بلکه از Opus 4.1 گرانتر و سیستمهای رقیب، از جمله Gemini 2.5 Pro و GPT-5 from OpenAI پیشی میگیرد. به عنوان مثال، در OSWorld، مجموعهای که مدلهای هوش مصنوعی را در وظایف کامپیوتری دنیای واقعی آزمایش میکند، Sonnet 4.5 رکورد امتیاز 61.4 درصد را به ثبت رساند و آن را 17 درصد بالاتر از Opus 4.1 قرار داد.
در عین حال، مدل جدید قادر است به طور مستقل روی پروژههای چند مرحلهای برای بیش از 30 ساعت کار کند، که پیشرفت چشمگیری نسبت به هفت یا هشت ساعتی است که Opus 4 در زمان عرضه میتوانست حفظ کند. این یک نقطه عطف مهم برای نوع سیستمهای مبتنی بر عامل است که Anthropic میخواهد بسازد.
شاید مهمتر از آن، این شرکت ادعا میکند که Sonnet 4.5 امنترین سیستم هوش مصنوعی آن تا به امروز است و این مدل تحت آموزش ایمنی "گسترده" قرار گرفته است. این آموزش به یک چتبات تبدیل میشود که Anthropic میگوید "به طور قابل توجهی" کمتر مستعد "تملق، فریب، قدرتطلبی و تمایل به تشویق تفکر توهمی" است - همه ویژگیهای بالقوه مدل که landed OpenAI in hot water in recent months. در عین حال، Anthropic حفاظت Sonnet 4.5 را در برابر حملات تزریق اعلان تقویت کرده است. با توجه به پیچیدگی مدل جدید، Anthropic Sonnet 4.5 را تحت چارچوب سطح ایمنی هوش مصنوعی 3 خود منتشر میکند، به این معنی که دارای فیلترهایی است که برای جلوگیری از خروجیهای بالقوه خطرناک مربوط به اعلانهای مربوط به سلاحهای شیمیایی، بیولوژیکی و هستهای طراحی شدهاند.
با اعلامیه امروز، Anthropic همچنین در حال ارائه بهبودهایی در کیفیت زندگی در سراسر پشته محصول Claude است. برای شروع، Claude Code، عامل کدنویسی محبوب این شرکت، یک رابط ترمینال تازه دارد و یک ویژگی جدید به نام checkpoints در آن گنجانده شده است. همانطور که احتمالاً میتوانید از نام آن حدس بزنید، آنها به شما این امکان را میدهند که پیشرفت خود را ذخیره کنید و اگر Claude کد عجیبی نوشت که دقیقاً همانطور که تصور میکردید کار نمیکند، به حالت قبلی برگردید. ایجاد فایل، که Anthropic began rolling out at the start of the month، اکنون برای همه کاربران Pro در دسترس است و اگر به لیست انتظار Claude for Chrome پیوستهاید، میتوانید از امروز شروع به استفاده از این افزونه کنید.
قیمت API برای Sonnet 4.5 همچنان 3 دلار برای یک میلیون توکن ورودی و 15 دلار برای همان مقدار توکن خروجی است. انتشار Sonnet 4.5 یک سپتامبر قوی را برای Anthropic رقم میزند. تنها یک روز پس از اینکه مایکروسافت added Claude models to Copilot 365 هفته گذشته، OpenAI admitted اذعان کرد که رقیبش بهترین هوش مصنوعی را برای کارهای مرتبط با کار ارائه میدهد.