Yapay zekanın işinizi elinden almasından endişeleniyorsanız, bunun için oturmak isteyebilirsiniz. Yapay zeka girişimi Anthropic, tanıtım malzemesine göre “insanların yaptığı gibi” bilgisayar ekranına bakabilen ve sanal fare ve klavyeyi çalıştırabilen yeni bir “Claude” modeli sergiledi.
Video demosunda araştırmacı Sam Ringer, Claude'un ilgili bilgileri bulmak ve bir form göndermek için Mac masaüstünün ekran görüntülerini kullanan AI modeliyle “ağır iş” veri girişi yaptığını gösteriyor. Bu aslında dünyanın her yerindeki çalışanların her gün yaptığı türden bir şey, ancak Ringer bunun “temsili bir örnek” olduğunu belirtiyor. Videonun tam olarak ne kadarının düzenlendiği bilinmiyor.
Ancak bunun için Anthropic'in sözüne güvenmenize gerek yok. Claude 3.5 Sonnet API'nin erken bir sürümü şu anda denemeye hazır ve Pennsylvania Üniversitesi Wharton Okulu'nda yapay zeka üzerine çalışan profesör Ethan Mollick tam da bunu yaptı. Mollick yapay zekayı test etti Evrensel Ataçlararka planında harika derecede incelikli bilim kurguların yer aldığı çevrimiçi bir tıklama oyunu.
Mollick programı oyunun tarayıcı penceresine işaret etti ve “kazanmasını söyledi”, ardından arkasına yaslanıp çalışmasını izledi. Sonuç büyüleyiciydi. Yapay zeka, metin tabanlı arayüzünü tahmin ederek oyunun amacını belirleyebildi, ardından denemek ve kazanmak için biraz deneme yanılma yöntemini kullandı; bu durumda, temelde sadece sayıların yükselmesini sağladı. Gerçek bir oyuncunun yapacağı gibi, bazı temel A/B testleri ile fantezi gelirini artırmak için ataç fiyatlarıyla oynamayı başardı. Ancak süreci optimize etmek için gereken adımları tam olarak bir araya getirmedik ki bu, bir insan oyuncu için oldukça açık bir durumdur.
Gerçek dünyadaki yapay zeka, kurgusal yapay zekayla ilgili bir oyun “oynuyordu”. Anlamlı bir ilerleme kaydetmesini engelleyen birkaç mantık döngüsüyle karşılaştı ve Mollick'in sanal makinesi, saatler süren oyun tamamlanamadan birçok kez çöktü. Ancak insan operatörün ilginç bir girdisiyle, “sen bir bilgisayarsın, yeteneklerini kullan”, süreçlerini otomatikleştirmek için temel bir kod yazmaya ikna edildi.
Bu, sanal bir oyun oynamak için sanal kod yazan bir sanal bilgisayarın örneğidir – tam gaz devam ediyoruz Başlangıç burada oldukça temel bir amaç ve sonuçla da olsa. Claude, birden fazla VM çökmesinin ardından “verilen kısıtlamalar dahilinde” bir dönüm noktasına ulaşarak oyunu “başarılı bir şekilde 'kazandığını'” açıkladı.
Kazanamadı Evrensel Ataçlaruzun bir atışla değil. Ancak büyük ölçüde bağlamsal olan bu oyunu oynamanın uzak Anthropic'in demo videosunda ortaya konan orijinal otomasyon amacının ötesinde. Yapay zekanın bir hedef belirleme ve minimum düzeyde teşvikle ilerleme kaydetme yeteneği etkileyiciydi. Tam döküm okumaya değer.
“[Claude] Çoğu hata karşısında esnek ve ısrarcıydı” diye yazıyor Profesör Mollick. “A/B testi gibi akıllıca şeyler yaptı. Ve en önemlisi, neredeyse bir saat kesintisiz çalışarak işini yaptı.”
Anthropic'in Claude AI'si, web üzerinde ücretsiz metin tabanlı bir araç olarak ve iOS ve Android'de bir uygulama olarak, görseller ve metin belgeleri hakkında soru sorma özelliğiyle mevcuttur. En son değişiklikler (sürüm 3.5) ücretsiz sürüm için yayındadır, ancak daha gelişmiş erişim, öncelikli bant genişliği ve daha fazla modelle kişi başına aylık 20 ABD doları tutarında Pro hesap gerektirir. Anthropic, aralarında Notion, Intuit (TurboTax'ın yapımcıları) ve Zoom'un da bulunduğu düzinelerce şirketi içeren mevcut müşterileri olduğunu iddia ediyor.
Bir yanıt yazın