Claude Sonnet 5'i Tanıtıyoruz
Şimdiye kadarki en ajantiği Sonnet modeli, kodlama ve günlük profesyonel çalışmalar için birinci sınıf zekâ ile.

Claude Sonnet 5, şimdiye kadarki en ajantiği Sonnet modeli olmak üzere tasarlanmıştır. Plan yapabilir, tarayıcı ve terminal gibi araçları kullanabilir ve birkaç ay önce daha büyük ve pahalı modeller gerektiren bir seviyede özerk olarak çalışabilir.
Birçok geliştirici için ajanti AI çağı Sonnet-sınıfı modellerle başladı: Claude Sonnet 3.5, 3.6 ve 3.7, kodlama ve Tool use konularında etkileyici beceriler gösteren ilk modellerdi. Ancak daha yakın zamanlarda, ajanti yeteneklerindeki en açık ilerleme Opus-sınıfı modellerimizde yaşanmıştır.
Sonnet 5 boşluğu kapatıyor: performansı Opus 4.8'e yakın, ancak daha düşük fiyatlarla. Akıl yürütme, Tool use, kodlama ve bilgi çalışması gibi ajanti performansının önemli yönlerinde öncülü Sonnet 4.6'den önemli ölçüde daha iyidir:
Güvenlik değerlendirmelerimiz, Sonnet 5'in Sonnet 4.6'ye göre istenmeyen davranışların genel olarak daha düşük bir oranını gösterdiğini ve ajanti bağlamlarda kullanmak için genel olarak daha güvenli olduğunu bulmuştur. Değerlendirmeler ayrıca, mevcut Opus modellerimize kıyasla siber güvenlik görevlerini yerine getirme konusunda çok daha düşük bir yeteneğe sahip olduğunu göstermektedir.
Bugünden itibaren, Claude Sonnet 5 tüm planlar üzerinde kullanılabilir: Ücretsiz ve Pro planlar için varsayılan model olup, Max, Team ve Enterprise kullanıcılarına sunulmaktadır. Ayrıca Claude Code'da ve Claude Platform'da mevcuttur; burada 31 Ağustos 2026'ya kadar giriş fiyatlandırması olan 1 milyon input Token başına 2 dolar ve 1 milyon output Token başına 10 dolar ile başlatılmıştır; bundan sonra 1 milyon input Token başına 3 dolar ve 1 milyon output Token başına 15 dolar fiyatlandırılacaktır. Geliştiriciler Claude API üzerinden claude-sonnet-5 kullanabilir.
Claude Sonnet 5 ile Çalışmak
Aşağıdaki grafikler, ajanti arama değerlendirmesi BrowseComp ve bilgisayar kullanımı değerlendirmesi OSWorld-Verified'de farklı çaba seviyeleri üzerinde Sonnet 5'in performansını Sonnet 4.6 ve Opus 4.8 ile karşılaştırmaktadır. Sonnet 5 (turuncu çizgi) Sonnet 4.6'ya (gri çizgi) göre kesin bir iyileştirmedir. Opus 4.8 (sarı çizgi) bu görevlerde daha yüksek doğruluk için hala tercih edilen modeldir, ancak Sonnet 5, geliştiricilere daha önce mevcut olanlardan çok daha yüksek kaliteli düşük fiyatlı seçenekler sunmaktadır. Sonnet 5 ve Opus 4.8 arasında, kullanıcılar maliyet ve performans arasında doğru dengeyi bulmak için çaba seviyesini ayarlayabilir.
Erken erişim ortaklarımızdan gelen geri bildirim tutarlıdır: Sonnet 5, öncüllerine göre çok daha ajantidir. Test edenler, önceki Sonnet modellerinin eksik kalacağı karmaşık görevleri nasıl tamamladığını, açıkça sorulmadan kendi çıktısını nasıl kontrol ettiğini ve tüm bu ajanti çalışmasını cazip bir fiyat noktasında nasıl yaptığını anlatmışlardır:
Güvenlik değerlendirmeleri
Önceden dağıtım güvenliği değerlendirmelerimiz, Sonnet 5'in genel olarak Sonnet 4.6'da bir iyileştirme olduğunu bulmuştur. Ajanti güvenlikte, model kötü niyetli istekleri reddetmede ve Prompt injection saldırılarında ele geçirme girişimlerine direnç göstermede daha iyidir. Model, Sonnet 4.6'ye kıyasla hallüsinasyon ve sycophancy oranlarının daha düşüğünü göstermektedir. Yanlış hizalama ile işbirliği ve aldatma gibi çok çeşitli uyumsuz davranışları test eden otomatik davranış denetimimizde Sonnet 5 genel olarak daha düşük (yani, daha güvenli) puanlandı. Ancak, daha yetenekli Opus 4.8 ve Claude Mythos Preview ile karşılaştırıldığında bu değerlendirmede biraz daha yüksek uyumsuz davranış oranları göstermiştir.
Sonnet 5'i kasıtlı olarak siber güvenlik görevlerine eğitmedik. Bazı rutin, zararsız siber görevleri gerçekleştirebilir, ancak yazılım açıklarını geliştirme gibi potansiyel olarak tehlikeli siber beceriler test eden değerlendirmelerde, Opus 4.8 ve Mythos 5 gibi modellerden önemli ölçüde daha düşük performans göstermektedir. Bir değerlendirmeden alınan puanlar; bu değerlendirme, modellerin Firefox tarayıcısındaki güvenlik açıkları için açıkları geliştirme yeteneğini test etmiş, aşağıda gösterilmektedir. Sonnet 5 hiçbir zaman tam olarak çalışan bir açık geliştiremedi, ancak kısmi başarının biraz daha yüksek bir oranını Sonnet 4.6'ye kıyasla göstermektedir. Bu sonraki değişiklik, muhtemelen belirli eğitimden ziyade genel zekâdaki iyileştirmelerden kaynaklanmaktadır.
Sonnet 5 bu görevlerde öncülüne kıyasla biraz daha güçlü olduğundan, bunu siber korumalar varsayılan olarak etkinleştirilmiş şekilde başlattık. Bu korumalar—gerçek zamanlı olarak tehlikeli siber kullanımını algılayan ve bloke eden—Claude Opus 4.7 ve 4.8'de mevcut olanlarla aynıdır (Sonnet 5'ten gelen genel siber güvenlik riskinin düşük olduğunu değerlendirdiğimiz için, korumalar Fable 5 ile başlatılan ve çok daha geniş bir siber güvenlik görevleri yelpazesini bloke eden olanlardan daha az katıdır).1
Birçok güvenlik ve yetenek değerlendirmesi genelinde Sonnet 5'in tam değerlendirmesi Claude Sonnet 5 System Card'da rapor edilmektedir.
Erişilebilirlik ve fiyatlandırma
Claude Sonnet 5 bugün her yerde 31 Ağustos 2026'ya kadar 1 milyon input Token başına 2 dolar ve 1 milyon output Token başına 10 dolar giriş fiyatı ile kullanılabilir. Daha sonra 1 milyon input Token başına 3 dolar ve 1 milyon output Token başına 15 dolar standart fiyatlandırmasına taşınır.2 Daha yüksek çaba seviyelerine ait daha yüksek Token kullanımını karşılamak için Chat, Cowork, Claude Code ve Claude Platform3 genelinde hız limitlerini artırdık; kullanıcılar belirli projeleri için uygun olan her seviyeyi seçebilirler.