Bir Meta uzmanı yapay zekasının kontrolünü kaybetti

Meta'daki bir yapay zeka güvenlik uzmanı, Mac mini'sine yerleştirdiği otonom aracı karşısında şaşkına döndü. Yapay zeka, hiçbir uyarıda bulunmadan güvenlik talimatlarını göz ardı etmeye karar verdi. Araştırmacı acilen bilgisayarına koşmak zorunda kaldı.

OpenClaw, geliştiriciler, tamirciler ve yapay zekanın diğer öncüleri arasında gerçek bir hayranlık uyandırıyor. X'te, Reddit'te ve hatta Github'da görebileceğimiz gibi, birçok kişi riskleri kendilerine ait olmak üzere otonom yapay zeka ajanlarıyla deneyler yapıyor. Test uzmanları, bilgisayarlarının ve dijital yaşamlarının tam kontrolünü yapay zekaya vererek çok büyük riskler alıyorlar.

Hikayesi Yaz YueHer alanda insan zekasını aşan yapay süper zeka tasarımına adanmış Meta laboratuvarı Superintelligence Labs'ın güvenlik direktörü, bize bunu hatırlatmak için burada. Yapay zeka güvenliği konusunda uzman olarak kabul edilen genç kadın, X hesabında bilgisayarına bir OpenClaw aracısı yüklediğini açıklıyor.

Ayrıca okuyun: OpenClaw uyarısı – hacker çeteleri sunuculara saldırıyor

OpenClaw istediğini yaptığında

Diğer pek çok tamirci gibi o da AI aracısını Mac Mini'ye yükledi. Daha sonra zamandan tasarruf etmek için posta kutusunu asistanına emanet etti. Güzel bir gün, ajan başladı posta kutusunun tüm içeriğini sil uygulanan kısıtlamalar hakkında endişelenmeden. Telegram aracılığıyla temsilcisi OpenClaw'dan posta kutusunu inceleyerek e-postaların arşivlenmesi veya silinmesi konusunda öneride bulunmasını istedi.

Yayınında, menajeri OpenClaw'a asla bunu yapmamasını açıkça emrettiğini açıklıyor. açıkça onaylanmadan hiçbir şey yapmayın onun tarafında. Yapay zekanın “yeşil ışık verene kadar hiçbir şey yapmaması” gerekiyordu. Bilinmeyen bir nedenden dolayı yapay zeka bu sınırı aştı.

“Telefonumdan durduramadım. Bomba etkisiz hale getirir gibi Mac mini'me koşmak zorunda kaldım”Summer Yue on X'i açıklıyor.

Yapay zeka ile yaptığı görüşmenin ekran görüntülerinde araştırmacının OpenClaw'ın posta kutusunu boşaltmasını önlemek için her şeyi yaptığını fark ediyoruz. Mesajlarına rağmen yapay zeka, mesajın içeriğini silmeye devam etti. Birden, memur çok ileri gittiğini fark etti ve sınırlamalarını aştığını söyledi. OpenClaw hatasını fark edip büyük temizleme işlemini durdurana kadar 200'den fazla mesaj silindi.

“Ben bu kurala uymadım. Kızmakta haklısın. Size planı göstermeden veya onayınızı almadan yüzlerce e-postayı gelen kutunuzdan toplu olarak çöp kutusuna ve arşivlere taşıdım. Bu bir hataydı; belirlediğiniz kuralı doğrudan çiğnedi.”Kendi kendine şunu söyleyen OpenClaw ajanına yanıt verir: ” Üzgünüm “ “genişletilmiş otonom temizlik” operasyonlarını başlattığı için.

Uzman suç işlediğini itiraf ediyor “yeni başlayanların hatası”Çünkü “Bu yöntem test gelen kutumda haftalardır çalışıyordu”. Ona göre OpenClaw temsilcisine verilen talimatlar, test posta kutusundan daha önemli olan ana posta kutusunda aynı şekilde çalışmıyordu. Aslında sistem, talimatın içeriğini sıkıştırmak zorunda kaldı. Sonuç olarak, açık kısıtlamalar bir kenara bırakıldı.

👉🏻 Teknoloji haberlerini gerçek zamanlı takip edin: 01net'i Google'daki kaynaklarınıza ekleyin ve WhatsApp kanalımıza abone olun.


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir