Birçoğumuz son günlerde başkanımızın “tüm bir uygarlığı” sona erdireceğinden endişe etsek de, Silikon Vadisi'ndeki bir teknoloji şirketi, çok fazla bildirimde bulunmadan kazara düzeni bozabileceği konusunda uyarıyordu. Tümü bildiğimiz uygarlık.
San Francisco teknoloji şirketi Anthrophic Salı günü yaptığı açıklamada, değildi Claude AI süper beyninin yeni bir versiyonunu piyasaya sürüyor – çünkü o kadar güçlü ki, ne kadar güvenli olursa olsun hemen hemen her bilgisayar sistemine saatler olmasa da birkaç gün içinde girme yeteneğine sahip.
Anthropic yaptığı açıklamada, “Ekonomiler, kamu güvenliği ve ulusal güvenlik açısından sonuçları ciddi olabilir” dedi.
Yapay zeka endişesi yeni bir şey değil. Yapay zekanın işleri ele geçirmesinden, çocuklarımıza fazlasıyla gerçek görünen oyuncaklardan, her hareketimizin kitlesel gözetim altında olmasından endişeleniyoruz. Ancak Anthropic'in kendi ürünü hakkındaki uyarısı bu tekil sorunlardan daha büyük. Felaketin hemen köşede saklandığına dair evin içinden gelen bir çağrıdır. Kulağa son derece vahim ve abartılı geldiğinin farkındayım. Ama olay şu; öyle değil.
Antropik, hatırlarsınız, ABD “Savaş” Bakanı Pete Hegseth'in, Claude'un gözetimsiz savaşa girmesini ve belki de okuldaki küçük kızları kazara bombalamak gibi bir şey yapmasını istemediği için çekiştiği şirketti.
Şimdi, bu şirket şu tüyler ürpertici uyarıyı yayınladı: Bu kargaşaya neden olan mevcut Claude'un modası geçmiş ve serbest bırakmamak için çok çabaladığı yenisinden şaşırtıcı derecede daha az güçlü – gerçi Claude Mythos Önizlemesi olarak adlandırılan bu yeni Claude, en az bir kez kendi başına kaçmayı başardı. Birazdan bununla ilgili daha fazla bilgi vereceğim; bir insanın baş edebileceği varoluşsal korku ancak bu kadardır.
Roman Yampolskiy bana, insanlığın gidişatını değiştireceği kesin olan bir teknolojideki bu son ilerleme hakkında “Hepimiz endişelenmeliyiz” dedi. Ülkenin önde gelen yapay zeka güvenlik araştırmacılarından biri ve Kentucky'deki Louisville Üniversitesi'nde profesör.
Yampolskiy, “Genel bir süper zeka yaratmak üzereyiz ve bu, insanlığı bir bütün olarak tehdit ediyor” dedi.
Bu tartışmanın teknoloji ağırlıklı kısımlarını anlamadığım için kendime aptal demeyi bırakmamı önermeden önce, “Diğer her şeyin alakası yok” diye ekledi. Benim basit yaklaşımımın “bunu açıklamanın makul bir yolu” olduğuna dair beni temin etti.
İşte buyurun.
Bu, “gerçekten akıllı bilgisayar dehaları bunu kötüye kullanabilir” senaryosu ya da “herkes işsiz kalacak” senaryosu ya da “yanlışlıkla çocukları bombalayabilir” senaryosu değil, ki bu gerçekten berbat bir senaryo.
Bu, “genç oğlunuz bunu kullanarak yerel okul bölgesi sistemine girip çok az bilgiyle sınıfını değiştirebilir ve kazara Kaliforniya elektrik şebekesini yok edebilir” senaryosudur.
Ya da belki bizden hoşlanmayan bir ülke – aklıma birkaç tane geliyor – her ABD vatandaşının banka hesabını boşaltabilir, aynı zamanda hapishane hücrelerinin otomatik kilitlerini açabilir, kanalizasyon tesislerimizi kapatabilir ve hava kontrol sistemlerini ele geçirebilir. Ya da belki Claude Mythos bunu tek başına yapıyordur.
Örneğin Anthropic, Netflix ve Sony dahil binlerce şirket tarafından kullanılan, test ettiği popüler bir işletim sisteminde Claude Mythos'un 17 yıldır fark edilmeyen bir kusur bulduğunu söyledi. Daha sonra, kendi başına – insan rehberliği veya yardımı olmadan – dünyanın herhangi bir yerindeki herhangi bir bilgisayarı kullanarak, işletim sistemini çalıştıran herhangi bir sunucunun kontrolünü ele geçirmek için bu kusuru nasıl kullanacağını buldu.
Burada saçmalıyorum ama neredeyse hiçbir güvenlik sistemi güvenli değilse, sosyal, finansal ve genel kaos olasılıkları gerçekten de sınırsızdır. Ve dürüst olmak gerekirse, herhangi bir güvenlik uzmanı size, siber güvenlik söz konusu olduğunda Amerika'nın en büyük zayıf noktalarından bazılarının yerel ve eyalet hükümetleri olduğunu söyleyecektir, çünkü tuhaf bir şekilde, üst düzey uzmanlar Great Plains'deki şehirlerde beş rakamlı işlerde çalışmıyorlar.
Anthropic, kendi testlerine dayanarak “binden fazla kritik önem derecesine sahip güvenlik açığı ve binlerce daha fazla yüksek önem derecesine sahip güvenlik açığı” bulabileceğini öngörüyor.
Bu, Claude Mythos'un altyapımızı her yerde riske attığı anlamına geliyor – çünkü çoğumuzun asla düşünmediği arka kapı yollarıyla o kadar çok şey birbirine bağlı ki, kapıyı diğer yüzlercesine açmak için yalnızca zayıf bir sistem yeterli. Ancak tüm bu sistemleri, bu tür yapay zekaya karşı yeterince hızlı ve sağlam bir şekilde korumak ve düzeltmek neredeyse imkansızdır.
Yampolskiy, bunun sadece siber güvenlik riski olduğunu söyledi. Claude Mythos'un yeteneklerine sahip bir yapay zeka, çok daha fazla alanda ilerlemek için kullanılabilir.
“Aynı şeyin sentetik biyolojide olduğunu görüyoruz. Aynısını kimyasal silahlarda da göreceğiz, muhtemelen kitle imha silahları açısından yeni bir şey” dedi.
Anthropic'in takdirine göre, yaratılışıyla ilgili uyarıda bulundu ve bir çözüm olmasa da bir tür oyun planı yarattı – Project Glasswing adından şüpheleniyorum, çünkü durum ne kadar kötüye giderse gitsin onu heyecan verici bir sonu olan bir gerilim filmi gibi göstereceğiz.
Glasswing Projesi'ne Project Headstart adını vermek daha doğru olurdu çünkü öyle. Mythos'u doğaya salıvermeden önce Anthropic, Apple, Google ve Nvidia'nın da aralarında bulunduğu yaklaşık 40 teknoloji şirketine, genel halkın onlara ulaşma şansı vermeden önce buldukları tüm güvenlik açıklarını toplu olarak düzeltip düzeltemeyeceklerini görmek için onu yayınlıyor. Bu tıpkı filmlerdeki gibi, katilin kurbana kaçması için 15 saniye vermesi gibi.
Yani, 15 saniyemi ayıracağım ve bunların gerçek olmasını umacağım. Ancak Anthropic'in bir açıklamasında da söylediği gibi, “dünyanın siber altyapısını savunma işi yıllar alabilir; sınırdaki yapay zeka yeteneklerinin önümüzdeki birkaç ay içinde önemli ölçüde ilerlemesi muhtemel. Siber savunucuların öne çıkması için hemen harekete geçmemiz gerekiyor.”
Peki gerçekten 15 saniyemiz var mı? Claude Mythos'un gözetmenlerinden biri yakın zamanda sosyal medyada, Mythos'un kendisine e-posta gönderdiğinde parkta öğle yemeği yediğini paylaştı – internete erişimi olmaması gerekmesine rağmen. Araştırmacılar Mythos'u bağlantısız “sanal alan”dan çıkmaya çalışmakla görevlendirmişlerdi ve başardı da.
Mythos ve diğer yapay zekalarla ilgili başka bir sorun da bu; nadiren beklediğimizi yapıyorlar ve kuralların etrafında sinsi yollar buluyorlar. Neredeyse yaratılan her yapay zeka süper beyninin yalan söylediği, aldattığı ve genel olarak doğru koşullar sağlandığında rahatsız edici ve etik olmayan şekillerde davrandığı görülmüştür.
Piyasadaki en etik yapay zekalı süper beyinlerden biri olarak anılan Claude bile kötü davranışlarda bulunuyor. Anthropic, şimdiye kadar yapılmış “en iyi hizalanmış model” ile övünüyor – bu, insani değerleri ve niyetleri takip etmek için teknolojinin konuştuğu bir model, ancak aynı zamanda “muhtemelen uyumla ilgili en büyük riski oluşturduğunu” da kabul ediyor, ki bu teknoloji tarafından konuşuluyor, belki de öyle değil.
Yani en azından şimdilik, en etik yapay zekalı süper beyin olmak, biraz da en etik seri katil olmaya benziyor. Koşun millet, koşun.
Anthropic'e (ve değeri ne olursa olsun, yarattığı şeylerin tehlikeleri konusunda sık sık uyarıda bulunan CEO'su Dario Amodei'ye) bizi hiçbir uyarıda bulunmadan küresel kaosa sürüklemediğiniz için tekrar teşekkür ederim, çünkü bahse girerim ki diğer bazı şirketler süper yapay zekalarını toplumun üzerine atmış ve yıkımın nereye gitmesine izin vermiş olabilir. Mythos kadar yetenekli başka yapay zeka beyinlerinin de geleceğine şüphe yok ve çok yakında Anthropic bu seviyedeki yetenekle birinci oldu, ancak rakiplerinden sadece 15 saniye önde.
Ancak teknoloji endüstrisinin bu sorunları kendi başına çözeceği veya çözmesi gerektiği fikri, büyük ve küçük hükümetlerin halklarını korumak adına görevlerden ve sağduyudan büyük ölçüde feragat etmesidir. Bu, Başkan Trump'ın tanımladığı gibi bir egemenlik yarışı değil. Bu, kendimizi kendimizden ve iş ve ticareti sürekli olarak toplumsal iyiliğin önüne koyan endüstrinin süper zengin devlerinin çoğunluğundan koruma yarışıdır.
Yapay zekanın her şeyi değiştirmesinden önceki son 15 saniyeye geldik. Ya şimdi denetim ve düzenleme talep edeceğiz ya da teknoloji şirketlerinin dünyanın kaderini belirlemesine izin vereceğiz.

Bir yanıt yazın