Anthropic, heyecan verici bir yenilikle yapay zeka alanında önemli bir adım attı ve Claude Opus 4.7'yi kullanıcılara sundu. Bu yeni modelin, yazılım mühendisliği ve talimatları izleme konularında önceki versiyonlara göre kayda değer bir gelişim gösterdiği belirtiliyor.
Gelişmiş Performans ve Yeni Özellikler
Claude Opus 4.7, agentic kodlama ve çok disiplinli akıl yürütme yetenekleri ile dikkat çekiyor. Endüstri benchmarklarında gösterdiği performans, onu Claude Opus 4.6'dan daha üstün kılıyor. SWE-Bench Pro değerlendirmesinde elde edilen %64,3'lük puanla bu alandaki başarı oranını neredeyse %10 artırdı.
Bunun yanı sıra yeni model, Terminal-Bench 2.0 veri setindeki kodlama zorluklarını daha etkin bir şekilde çözme kapasitesine sahip. Ancak Anthropic, Claude Mythos Preview adlı siber güvenlik girişiminin parçası olan bazı özelliklerin henüz bu modelde mevcut olmadığını vurguluyor.
Opus 4.7'nin siber saldırılara karşı tespit mekanizması da önemli bir yenilik olarak öne çıkıyor. Şirketin mühendisleri bu mekanizmanın etkinliğini değerlendirecek ve elde edilen bulgular siber güvenlik önlemlerini güçlendirmek için kullanılacak.
Ayrıca modelin lisansüstü düzeyde bilim soruları üzerinde gösterdiği başarı da dikkat çekici; GPQA Diamond testinde en iyi modele yalnızca %1'lik bir farkla yaklaşmayı başardı. Ancak OpenAI'ın GPT-5.4’ü, çevrimiçi araştırma becerilerini test eden BrowseComp benchmarkında Mythos'un puanını geride bıraktı.
Claude Opus 4.7, Anthropic'in tüm ürünlerinde kullanılabilirken; Microsoft, Google ve Amazon gibi bulut sağlayıcıları aracılığıyla API'si üzerinden erişilebilir olacak. Şirket fiyatlandırmada önceki modelle aynı seviyede kalacağını duyurdu.
Bunların yanı sıra geliştiricilere yönelik yeni özellikler de tanıtıldı;