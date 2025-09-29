Claude Sonnet 4.5 امن‌ترین مدل هوش مصنوعی Anthropic تا به امروز است

در ماه مه، Anthropic از دو سیستم هوش مصنوعی جدید به نام‌های Opus 4 و Sonnet 4 رونمایی کرد. اکنون، کمتر از شش ماه بعد، این شرکت Sonnet 4.5 را معرفی می‌کند و آن را بهترین مدل کدنویسی در جهان تا به امروز می‌نامد. مبنای ادعای Anthropic مجموعه‌ای از معیارها است که در آن هوش مصنوعی جدید نه تنها از مدل قبلی خود، بلکه از Opus 4.1 گران‌تر و سیستم‌های رقیب، از جمله Gemini 2.5 Pro و GPT-5 from OpenAI پیشی می‌گیرد. به عنوان مثال، در OSWorld، مجموعه‌ای که مدل‌های هوش مصنوعی را در وظایف کامپیوتری دنیای واقعی آزمایش می‌کند، Sonnet 4.5 رکورد امتیاز 61.4 درصد را به ثبت رساند و آن را 17 درصد بالاتر از Opus 4.1 قرار داد.

در عین حال، مدل جدید قادر است به طور مستقل روی پروژه‌های چند مرحله‌ای برای بیش از 30 ساعت کار کند، که پیشرفت چشمگیری نسبت به هفت یا هشت ساعتی است که Opus 4 در زمان عرضه می‌توانست حفظ کند. این یک نقطه عطف مهم برای نوع سیستم‌های مبتنی بر عامل است که Anthropic می‌خواهد بسازد.

Sonnet 4.5 در کدنویسی و وظایف مبتنی بر عامل از مدل‌های قدیمی‌تر Anthropic بهتر عمل می‌کند. Anthropic

شاید مهم‌تر از آن، این شرکت ادعا می‌کند که Sonnet 4.5 امن‌ترین سیستم هوش مصنوعی آن تا به امروز است و این مدل تحت آموزش ایمنی "گسترده" قرار گرفته است. این آموزش به یک چت‌بات تبدیل می‌شود که Anthropic می‌گوید "به طور قابل توجهی" کمتر مستعد "تملق، فریب، قدرت‌طلبی و تمایل به تشویق تفکر توهمی" است - همه ویژگی‌های بالقوه مدل که landed OpenAI in hot water in recent months. در عین حال، Anthropic حفاظت Sonnet 4.5 را در برابر حملات تزریق اعلان تقویت کرده است. با توجه به پیچیدگی مدل جدید، Anthropic Sonnet 4.5 را تحت چارچوب سطح ایمنی هوش مصنوعی 3 خود منتشر می‌کند، به این معنی که دارای فیلترهایی است که برای جلوگیری از خروجی‌های بالقوه خطرناک مربوط به اعلان‌های مربوط به سلاح‌های شیمیایی، بیولوژیکی و هسته‌ای طراحی شده‌اند.

نموداری که نشان می‌دهد Sonnet 4.5 چگونه در آزمایش ایمنی با سایر مدل‌های پیشرفته مقایسه می‌شود. Anthropic

با اعلامیه امروز، Anthropic همچنین در حال ارائه بهبودهایی در کیفیت زندگی در سراسر پشته محصول Claude است. برای شروع، Claude Code، عامل کدنویسی محبوب این شرکت، یک رابط ترمینال تازه دارد و یک ویژگی جدید به نام checkpoints در آن گنجانده شده است. همانطور که احتمالاً می‌توانید از نام آن حدس بزنید، آنها به شما این امکان را می‌دهند که پیشرفت خود را ذخیره کنید و اگر Claude کد عجیبی نوشت که دقیقاً همانطور که تصور می‌کردید کار نمی‌کند، به حالت قبلی برگردید. ایجاد فایل، که Anthropic began rolling out at the start of the month، اکنون برای همه کاربران Pro در دسترس است و اگر به لیست انتظار Claude for Chrome پیوسته‌اید، می‌توانید از امروز شروع به استفاده از این افزونه کنید.

قیمت API برای Sonnet 4.5 همچنان 3 دلار برای یک میلیون توکن ورودی و 15 دلار برای همان مقدار توکن خروجی است. انتشار Sonnet 4.5 یک سپتامبر قوی را برای Anthropic رقم می‌زند. تنها یک روز پس از اینکه مایکروسافت added Claude models to Copilot 365 هفته گذشته، OpenAI admitted اذعان کرد که رقیبش بهترین هوش مصنوعی را برای کارهای مرتبط با کار ارائه می‌دهد.