Anthropic “daha dürüst” Claude Opus 4.8'i getiriyor ve Mythos'u duyuruyor

yakın bildirim

Bu makale İngilizce olarak da mevcuttur. Teknik yardımla tercüme edildi ve yayınlanmadan önce editoryal olarak gözden geçirildi.

Microsoft için Salı Yaması ne anlama geliyorsa, Anthropic için de Perşembe Sürümü odur: Claude Opus 4.8 şu anda mevcut – yalnızca Nisan ortasında piyasaya sürülen önceki Opus 4.7 ile aynı fiyata. Şaşırtıcı olmayan bir şekilde, yeni modelin kodlama, aracılık becerileri, muhakeme ve bilgi çalışmasına yönelik kıyaslamalarda daha da geliştiği söyleniyor, ancak her disiplinde kıyaslama kazananı değil. Model güncellemesiyle birlikte şirket, öncelikle otonom, büyük ölçekli çalışmayı hedefleyen birkaç yeni işlev sağlıyor.

Reklamdan sonra devamını okuyun

Karşılaştırma tablosu

Antropik modellerin amiral gemisi disiplinlerinden birinde Opus 4.8, yalnızca Terminal Bench 2.1'de olsa bile OpenAI'nin GPT-5.5'ine yenilgiyi kabul etmek zorunda.

Anthropic'e göre Opus 4.8, önceki sürüme göre belirsizlikleri daha sık vurguluyor ve desteklenmeyen iddiaları daha az dile getiriyor. Kendi kendine yazılan kodda yeni model, yorum yapılmadan hataların Opus 4.7'ye göre dört kat daha az oluşmasına izin veriyor.

Şirket içi uyum ekibinin ayrıca, modelin, kullanıcı özerkliğini desteklemek ve kullanıcının çıkarına göre hareket etmek de dahil olmak üzere, sözde “sosyal özellikler” için yeni en iyi değerlere sahip olduğunu da onayladığı iddia ediliyor. Kötüye kullanım durumunda aldatma veya işbirliği gibi yanlış hizalanmış davranışların, Opus 4.7'ye göre önemli ölçüde daha az sıklıkta meydana geldiği ve Anthropic'in bugüne kadarki en uyumlu model olan Claude Mythos Preview olduğunu söylediği seviyede olduğu söyleniyor.

Yeni olan, Claude Code'un araştırma ön izlemesinde bulunan “Dinamik İş Akışları” özelliğidir. Bu, Claude Code'un karmaşık görevleri parçalamasına, tek bir oturumda yüzlerce paralel alt aracıyı başlatmasına ve sonuçları çıktıdan önce incelemesine olanak tanıyacaktır. Örnek olarak Anthropic, görev tanımından tamamlanmış birleştirmeye kadar yüz binlerce kod satırı üzerinden kod tabanı çapında geçişleri gösteriyor. Bu özellik Enterprise, Team ve Max planlarında mevcuttur.

Reklamdan sonra devamını okuyun

Claude.ai kullanıcıları, Opus 4.8 ile yeni bir efor kontrol fonksiyonuna sahip oluyor. Model seçimine ek olarak, Claude'un bir cevaba ne kadar çaba harcaması gerektiğini (daha hızlı, kaynak açısından daha verimli cevaplardan zor görevler için daha derin düşünmeye kadar) ayarlayabilirsiniz.

Opus 4.8'in 2,5 kat daha hızlı çalışması beklenen hızlı mod, önceki modele göre üçte iki daha ucuz. Normal API fiyatı değişmeden kalır: Bir milyon giriş tokenı başına 5 ABD Doları ve bir milyon çıkış tokenı başına 25 ABD Doları. Hızlı modda maliyeti 10 veya 50 ABD dolarıdır.

Geliştiriciler için yeni bir API işlevi eklendi: Mesajlar API'si artık Mesajlar dizisi içindeki sistem girişlerini kabul ediyor. Bu, komut istemi önbelleğini kesintiye uğratmadan, çalışan bir görevin ortasında talimatların güncellenmesine izin verdi.

Claude Opus 4.8 artık API aracılığıyla Claude-opus-4-8 model adı altında ve claude.ai adresinden edinilebilir.

Opus 4.8'in çıkışına paralel olarak Anthropic, önümüzdeki birkaç hafta içinde Mythos sınıfı modelleri tüm müşterilerin kullanımına sunacağını duyurdu. Anthropic, gerekli koruyucu önlemlerin geliştirilmesinin hızla ilerlediğini söylüyor.

Şu ana kadar Claude Mythos Preview'a yalnızca çok dar bir çevre erişebildi. “Glasswing Projesi”nin bir parçası olarak, seçilen yaklaşık 40 diğer kritik altyapı şirketi, sistemlerini güvenlik açıklarına karşı kontrol etme erişimine sahip oluyor. Bu grubu yaklaşık 70 şirkete daha genişletme planı, güvenlik kaygıları ve olası kapasite darboğazları nedeniyle Beyaz Saray'ın direnişiyle karşılaştı.

Anthropic, önceki isteksizliğini modelin güvenlik açıklarını bulma ve kullanma konusundaki olağanüstü performansıyla haklı çıkarıyor. Yapay zeka destekli güvenlik açığı tarayıcı ürünü Claude Security ise daha az güçlü olan Opus 4.7'yi temel alıyor ve Nisan ayının sonundan bu yana tüm kurumsal müşterilerin kullanımına sunuldu.

Nisan ayının sonunda OpenAI, yine büyük ölçüde ajans çalışmasına dayanan GPT-5.5'i tanıttı. Metas Llama 4, Uzmanların Karması mimarisine sahip açık ağırlıklı bir model olarak Nisan ayında geldi ve açık kaynaklı modellerin uzun vadede geçerli olacağına dair söz verdi. European Mistral Medium 3.5, veri egemenliğine ve kendi kendini barındırmaya odaklanan ve yalnızca dört GPU ile yetinmesi beklenen açık ağırlık modeli olarak da mevcuttur.


(vza)


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir