Anthropic “daha dürüst” Claude Opus 4.8'i getiriyor ve Mythos'u duyuruyor

Microsoft için Salı Yaması ne anlama geliyorsa, Antropik için de Perşembe Yaması odur: Claude Opus 4.8 şu anda mevcut – yalnızca Nisan ortasında piyasaya sürülen önceki Opus 4.7 ile aynı fiyata. Yeni modelin kodlama, temsilci becerileri, muhakeme ve bilgi çalışması için kriterleri daha da geliştirmesi şaşırtıcı değil, ancak her disiplinde kıyaslama kazananı değil. Model güncellemesine ek olarak şirket, öncelikle serbest meslek sahibi ve büyük ölçekli çalışmaları hedefleyen çeşitli yeni özellikler sunuyor.

Duyurudan sonra devamını okuyun

Antropik modellerin amiral gemisi disiplinlerinden birinde Opus 4.8, yalnızca Terminal Bench 2.1'de de olsa OpenAI'nin GPT-5.5'ine karşı yenilgiyi kabul etmek zorunda.

“Daha dürüst yapay zeka”: dört kat daha az tespit edilemeyen hata

Anthropic'e göre Opus 4.8, önceki sürüme göre belirsizlikleri daha sık vurguluyor ve desteklenmeyen iddiaları daha az dile getiriyor. Kendi ürettiği kodda yeni model, hataların yorumlanmadan Opus 4.7'ye göre dört kat daha az oluşmasına izin veriyor.

Dahili uyum ekibi ayrıca modelin, kullanıcı özerkliğini desteklemek ve kullanıcının çıkarına göre hareket etmek de dahil olmak üzere “toplum yanlısı özellikler” olarak adlandırılan yeni ve geliştirilmiş değerler sunduğunu da onaylıyor. İstismar vakalarında aldatma veya işbirliği gibi yanlış hizalanmış davranışların, Opus 4.7'ye göre önemli ölçüde daha az sıklıkta meydana geldiği ve Anthropic'in bugüne kadarki en uyumlu model olarak adlandırdığı Claude Mythos Preview ile aynı seviyede olduğu söyleniyor.

Dinamik iş akışları: Yüzlerce paralel alt aracı

Yeni olan, Claude Code'un arama önizlemesinde bulunan “Dinamik İş Akışları” özelliğidir. Bu, Claude Code'un karmaşık görevleri parçalamasına, tek bir oturumda yüzlerce paralel alt aracıyı başlatmasına ve sonuçları çıktıdan önce incelemesine olanak tanıyacak. Örneğin Anthropic, görev tanımından tamamlanmış birleştirmeye kadar yüz binlerce kod satırındaki kod tabanı düzeyindeki geçişlerden bahsediyor. Bu özellik Enterprise, Team ve Max planlarında mevcuttur.

Çaba kontrolü, daha ucuz hızlı mod, yeni API işlevi

Duyurudan sonra devamını okuyun

Claude.ai kullanıcıları Opus 4.8 ile yeni bir efor kontrolü özelliğine sahip oluyor. Model seçimine ek olarak, Claude'un bir yanıta ne kadar çaba harcaması gerektiğini de belirleyebilirsiniz: daha hızlı, kaynakları daha verimli kullanan yanıtlardan zor görevler için daha derin düşünmeye kadar.

Opus 4.8'in 2,5 kat daha hızlı çalışması beklenen hızlı modun maliyeti önceki modele göre üçte iki daha düşük. API'nin normal fiyatı değişmeden kalıyor: Bir milyon giriş tokenı başına 5 ABD Doları ve bir milyon çıkış tokenı başına 25 ABD Doları. Hızlı modda maliyeti 10 veya 50 ABD dolarıdır.

Geliştiriciler için yeni bir API özelliği eklendi: Mesajlar API'si artık Mesajlar dizisi içindeki sistem girişlerini kabul ediyor. Bu, komut istemi önbelleğini bozmadan, çalışan bir görev sırasında talimatların güncellenmesine izin verdi.

Claude Opus 4.8 artık API aracılığıyla Claude-opus-4-8 model adı altında ve claude.ai adresinden edinilebilir.

Herkes için “Önümüzdeki haftalarda efsanevi ders”

Anthropic, Opus 4.8'in çıkışına paralel olarak önümüzdeki haftalarda Mythos sınıfı modellerin tüm müşterilerin kullanımına sunulacağını duyurdu. Anthropic, gerekli koruyucu önlemlerin geliştirilmesinin hızla ilerlediğini söylüyor.

Şu ana kadar Claude Mythos Preview'a yalnızca çok dar bir çevre erişebildi. “Glasswing Projesi” kapsamında yaklaşık 40 seçilmiş kritik altyapı şirketine, sistemlerini güvenlik açıklarına karşı kontrol etmeleri için erişim veriliyor. Bu grubu 70 şirkete daha genişletme planı, güvenlik endişeleri ve olası kapasite darboğazları nedeniyle Beyaz Saray'ın direnciyle karşılaştı.

Anthropic, önceki isteksizliğini modelin güvenlik açıklarını bulma ve kullanma konusundaki olağanüstü performansıyla haklı çıkarıyor. Yapay zeka destekli güvenlik açığı tarayıcısı Claude Security, daha az güçlü olan Opus 4.7'yi temel alıyor ve Nisan ayının sonundan itibaren tüm kurumsal müşterilerin kullanımına sunulacak.

Model karusel dönmeye devam ediyor

Nisan ayının sonunda OpenAI, yine büyük ölçüde temsilci çalışmalarına dayanan GPT-5.5'i tanıttı. Metas Llama 4, Uzmanların Karması mimarisine sahip açık ağırlıklı bir model olarak ve uzun vadede açık kaynaklı modellerin geçerli olacağı vaadiyle Nisan ayında geldi. European Mistral Medium 3.5, veri egemenliğine ve kendi kendini barındırmaya odaklanan ve yalnızca dört GPU ile yetinmesi gereken açık ağırlıklı bir model olarak da mevcuttur.

(vza)