Anthropic, Claude Opus 4.8'i tanıtıyor: öncekinden daha iyi ve hata yaptığında rapor veriyor

Antropik sunuldu Eser 4.8güncellemesi dilsel modeller ailesi gelişmiş Claude.

İyileştirmeler programlama faaliyetlerini, “akıl yürütmeyi”, etken iş akışlarının yönetimini ve özellikle sınırların tanınmasını mükemmelleştirirler ve yapay zekanın (AI) sağladığı yanıtlardaki hatalar.

Resmi basın bülteni, Opus 4.8'in “uzun ufuklu” görevleri, yani planlama, genişletilmiş bağlamsal hafıza ve tutarlılığı sürdürme yeteneği çok uzun operasyonlar sırasında.

Benzer şekilde model, “araç tetikleme” konusunda iyileştirmeler getiriyor, araçları göz ardı ettiği durumları azaltmak veya atanan görevi tamamlamak için gerekli işlevler.

Claude Opus 4.8 hakkında bilinmesi gerekenler

Daha önemli yenilikler arasında, yapay zeka reklam modelinin daha büyük eğilimi vurgulanmalıdır belirsizlikleri veya bilgi sınırlamalarını kabul edin. Anthropic, Claude Opus 4.8'in aşırı kesinlik ile icat edilmiş veya formüle edilmiş cevaplar üretmeye daha az eğilimli olduğunu söylüyor.

Modelin kullanım amacı ne olursa olsun önemli bir nokta, çünkü halüsinasyonlar (makul görünen ancak yanlış veya tamamen icat edilmiş tepkiler) hala devam etmektedir. modellerin ana sınırlamalarından biri büyük dilbilim. Makul ancak hatalı yanıtlar üretebilen bir sistem aslında siber güvenlik, finans, tıp, yazılım geliştirme ve diğerleri gibi alanlarda büyük bir sorunu temsil edebilir.

Göze çarpan bir başka gelişme de geliştiricilerle ilgilidir. Opus 4.8, çaba düzeyinin, yani bir modelin bir göreve uygulamaya karar verdiği “akıl yürütme” miktarının daha dikkatli bir şekilde yapılandırılması için teknik özellikler sunar. Üstelik, Hızlı Mod kod oluşturmada daha fazla hız vaat ediyor. Bununla birlikte Anthropic, Opus 4.8'in koddaki hataları veya sorunları tespit etmede daha etkili olduğunu ve bazı durumlarda yazılım hatalarının göz ardı edilme olasılığını dört kat azalttığını iddia ediyor.

Bir diğer merkezi unsur ise evrimdir. ajan yetenekleri. Antropik aslında sonuçları özerk bir şekilde doğrulayabilen, ara hataları düzeltebilen ve karmaşık faaliyetleri daha küçük operasyonlara bölebilen paralel alt aracılar aracılığıyla karmaşık iş akışlarını koordine edebilen sistemlere doğru ilerliyor.

Kontrendikasyonlar

Cevap veremeyeceğini iddia eden bir model büyülememeli çünkü bu onun gerçek farkındalığa sahip olduğu anlamına gelmez kendi hatalarından. Eleştirel bir ruha sahip olmadan ona güvenmekten kaçınmak, çünkü onu üretenler onun avantajlarını tanıtıyor, her zaman iyi bir şey.

Üstelik asırlık ve ölümsüz kalıntılar “çift kullanım” sorunuAkıl yürütme konusunda daha yetenekli olan (yani bir sonuca ulaşmak için yapılandırılmış “akıl yürütme” yeteneği) ve kod oluşturma ve üretim faaliyetlerinde daha fazla performans gösteren bir model, kötü niyetli aktörler tarafından da kullanılabilir.

Claude Opus 4.8 gibi daha “dürüst” bir modelin, siber suçlulara özgü suiistimal ve manipülasyona daha az maruz kalacağı söylenemez. Genişletilebilecek bir tartışma sektördeki tüm oyuncuları dahil etmekçünkü OpenAI (ChatGpt'yi üreten), Google (Gemini modelleriyle) ve Meta (Meta AI), devlerin doldurduğu rekabetçi bir pazarda üstünlük sağlamaya çalışırken, kendi modellerinin hesaplama kapasitesini, özerkliğini ve güvenilirliğini artırmak için milyarlarca dolar yatırım yapıyor.

Yapay zekayı üretkenlik için kullananlar için kesinlikle faydalı olan tüm bunlar, aynı zamanda onu daha az asil amaçlarla kullananları da destekliyor. sosyal mühendislik, kimlik avı ve farklı türden manipülatif içerik.

Deepfake'lere karşı mücadele

Yapay zeka modelleri üretenler, onları giderek daha performanslı hale getirmeye kararlı olsa da, perde arkasında bu evrimin gerektirdiği sorunlara çözüm bulmak için çok çalışan kişiler de var.

Günümüzde sorun artık yalnızca içeriği manipüle etmek değil, çünkü katlanarak büyüyen bir fenomen olan deepfake'leri oluşturmak nispeten kolaydır; temel sorun şu: gerçek olanı sentetik olandan ayırt edebilmeközellikle yapay zeka sistemleri daha yetkin hale geldikçe.

Deepfake ile mücadelede ön planda OpenFake projesi öne çıkarılmalıDeepfake'lerin tanınmasını geliştirmek için çeşitli üniversitelerden araştırmacılar tarafından tasarlanan ve cesaret verici sonuçlar veren açık bir platform. THE araştırmacılar Üç milyon gerçek çekimi, farklı yapay zeka modelleri tarafından oluşturulan neredeyse bir milyon sahte fotoğrafla birleştirerek yaklaşık dört milyon görüntü topladılar ve yeni üretken teknolojilerin insan gözünü nasıl aldatabildiğini, giderek daha karmaşık hale gelen otomatik dedektörleri nasıl gerekli hale getirdiğini vurgulayan bir çalışma ürettiler.

A ayırt edici özellik Projenin bir parçası, görüntü veri setinin sürekli olarak güncellenmesine olanak tanıyan ve siyasi dezenformasyona özellikle vurgu yaparak bilginin bütünlüğünü bir bütün olarak korumayı amaçlayan bir kitle kaynak platformu olan OpenFake Arena'dır.

Anthropic, Claude Opus 4.8'i tanıtıyor: öncekinden daha iyi ve hata yaptığında rapor veriyor

Claude Opus 4.8 hakkında bilinmesi gerekenler

Kontrendikasyonlar

Deepfake'lere karşı mücadele

Yorumlar

Bir yanıt yazın Yanıtı iptal et