Anthropic “daha dürüst” Claude Opus 4.8'i getiriyor ve Mythos'u duyuruyor

kapanış bildirimi

Bu makale İngilizce olarak da mevcuttur. Teknik yardımla tercüme edildi ve yayınlanmadan önce editoryal olarak gözden geçirildi.

Microsoft için Salı Yaması ne anlama geliyorsa, Antropik için de Perşembe Yaması odur: Claude Opus 4.8 şu anda mevcut – yalnızca Nisan ortasında piyasaya sürülen önceki Opus 4.7 ile aynı fiyata. Yeni modelin kodlama, temsilci becerileri, muhakeme ve bilgi çalışması için kriterleri daha da geliştirmesi şaşırtıcı değil, ancak her disiplinde kıyaslama kazananı değil. Model güncellemesine ek olarak şirket, öncelikle serbest meslek sahibi ve büyük ölçekli çalışmaları hedefleyen çeşitli yeni özellikler sunuyor.

Duyurudan sonra devamını okuyun

Referans tablosu

Antropik modellerin amiral gemisi disiplinlerinden birinde Opus 4.8, yalnızca Terminal Bench 2.1'de de olsa OpenAI'nin GPT-5.5'ine karşı yenilgiyi kabul etmek zorunda.

Anthropic'e göre Opus 4.8, önceki sürüme göre belirsizlikleri daha sık vurguluyor ve desteklenmeyen iddiaları daha az dile getiriyor. Kendi ürettiği kodda yeni model, hataların yorumlanmadan Opus 4.7'ye göre dört kat daha az oluşmasına izin veriyor.

Dahili uyum ekibi ayrıca modelin, kullanıcı özerkliğini desteklemek ve kullanıcının çıkarına göre hareket etmek de dahil olmak üzere “toplum yanlısı özellikler” olarak adlandırılan yeni ve geliştirilmiş değerler sunduğunu da onaylıyor. İstismar vakalarında aldatma veya işbirliği gibi yanlış hizalanmış davranışların, Opus 4.7'ye göre önemli ölçüde daha az sıklıkta meydana geldiği ve Anthropic'in bugüne kadarki en uyumlu model olarak adlandırdığı Claude Mythos Preview ile aynı seviyede olduğu söyleniyor.

Yeni olan, Claude Code'un arama önizlemesinde bulunan “Dinamik İş Akışları” özelliğidir. Bu, Claude Code'un karmaşık görevleri parçalamasına, tek bir oturumda yüzlerce paralel alt aracıyı başlatmasına ve sonuçları çıktıdan önce incelemesine olanak tanıyacak. Örneğin Anthropic, görev tanımından tamamlanmış birleştirmeye kadar yüz binlerce kod satırındaki kod tabanı düzeyindeki geçişlerden bahsediyor. Bu özellik Enterprise, Team ve Max planlarında mevcuttur.

Duyurudan sonra devamını okuyun

Claude.ai kullanıcıları Opus 4.8 ile yeni bir efor kontrolü özelliğine sahip oluyor. Model seçimine ek olarak, Claude'un bir yanıta ne kadar çaba harcaması gerektiğini de belirleyebilirsiniz: daha hızlı, kaynakları daha verimli kullanan yanıtlardan zor görevler için daha derin düşünmeye kadar.

Opus 4.8'in 2,5 kat daha hızlı çalışması beklenen hızlı modun maliyeti önceki modele göre üçte iki daha düşük. API'nin normal fiyatı değişmeden kalıyor: Bir milyon giriş tokenı başına 5 ABD Doları ve bir milyon çıkış tokenı başına 25 ABD Doları. Hızlı modda maliyeti 10 veya 50 ABD dolarıdır.

Geliştiriciler için yeni bir API özelliği eklendi: Mesajlar API'si artık Mesajlar dizisi içindeki sistem girişlerini kabul ediyor. Bu, komut istemi önbelleğini bozmadan, çalışan bir görev sırasında talimatların güncellenmesine izin verdi.

Claude Opus 4.8 artık API aracılığıyla Claude-opus-4-8 model adı altında ve claude.ai adresinden edinilebilir.

Anthropic, Opus 4.8'in çıkışına paralel olarak önümüzdeki haftalarda Mythos sınıfı modellerin tüm müşterilerin kullanımına sunulacağını duyurdu. Anthropic, gerekli koruyucu önlemlerin geliştirilmesinin hızla ilerlediğini söylüyor.

Şu ana kadar Claude Mythos Preview'a yalnızca çok dar bir çevre erişebildi. “Glasswing Projesi” kapsamında yaklaşık 40 seçilmiş kritik altyapı şirketine, sistemlerini güvenlik açıklarına karşı kontrol etmeleri için erişim veriliyor. Bu grubu 70 şirkete daha genişletme planı, güvenlik endişeleri ve olası kapasite darboğazları nedeniyle Beyaz Saray'ın direnciyle karşılaştı.

Anthropic, önceki isteksizliğini modelin güvenlik açıklarını bulma ve kullanma konusundaki olağanüstü performansıyla haklı çıkarıyor. Yapay zeka destekli güvenlik açığı tarayıcısı Claude Security, daha az güçlü olan Opus 4.7'yi temel alıyor ve Nisan ayının sonundan itibaren tüm kurumsal müşterilerin kullanımına sunulacak.

Nisan ayının sonunda OpenAI, yine büyük ölçüde temsilci çalışmalarına dayanan GPT-5.5'i tanıttı. Metas Llama 4, Uzmanların Karması mimarisine sahip açık ağırlıklı bir model olarak ve uzun vadede açık kaynaklı modellerin geçerli olacağı vaadiyle Nisan ayında geldi. European Mistral Medium 3.5, veri egemenliğine ve kendi kendini barındırmaya odaklanan ve yalnızca dört GPU ile yetinmesi gereken açık ağırlıklı bir model olarak da mevcuttur.


(vza)


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir