Anthropic, yeni yapay zeka modeli Claude Opus 4.7'yi tanıttı ve bu modelin performansı oldukça etkileyici. Yazılım mühendisliği alanında belirgin bir iyileşme gösteren Opus 4.7, talimatları takip etme ve gerçek dünya problemlerini çözme konularında önemli bir gelişim sağladı.
Öne Çıkan Performans İyileştirmeleri
Yeni model, agentic kodlama, çok disiplinli akıl yürütme ve ölçeklendirilmiş araç kullanımı gibi alanlarda önceki versiyona göre daha iyi sonuçlar veriyor. SWE-Bench Pro programlama ölçütünde %64,3 puan alarak, Opus 4.6'dan %10 daha yüksek bir başarı elde etti. Aynı zamanda Terminal-Bench 2.0 veri setindeki görevleri de daha etkin bir şekilde çözüyor.
Bununla birlikte, Anthropic'in geliştirdiği siber güvenlik girişimi Project Glasswing ile karşılaştırıldığında, Claude Opus 4.7'nin siber yetenekleri henüz aynı seviyeye ulaşmadı. Ancak bu modelde siber saldırıları tespit etme mekanizması bulunuyor ve bu sayede kullanıcı güvenliği artırılmaya çalışılıyor.
Opus 4.7’nin performansı bazı testlerde Mythos kadar etkileyici sonuçlar gösterse de, OpenAI'ın GPT-5.4 modeli bazı benchmarklarda onu geride bırakmayı başardı.
Claude Opus 4.7, Anthropic'in tüm hizmetlerinde erişilebilirken; Microsoft, Google ve Amazon gibi büyük bulut sağlayıcıları aracılığıyla API'si üzerinden de kullanılabiliyor. Yeni modelin fiyatının ise önceki sürümle aynı olduğu belirtiliyor.
Yenilikçi özellikler arasında geliştiricilerin belirleyebileceği yeni "effort level (çaba seviyesi)" parametresi ve "task budgets (görev bütçeleri)" özelliği öne çıkıyor. Ayrıca Claude Code'a entegre edilen ultrareview slash komutu ile kullanıcıların programlama süreçlerini hızlandırmaları mümkün hale geliyor.