Bir Meta uzmanı yapay zekasının kontrolünü kaybetti

Meta'daki bir yapay zeka güvenlik uzmanı, Mac mini'sine yerleştirdiği otonom aracı karşısında şaşkına döndü. Yapay zeka, hiçbir uyarıda bulunmadan güvenlik talimatlarını göz ardı etmeye karar verdi. Araştırmacı acilen bilgisayarına koşmak zorunda kaldı.

OpenClaw, geliştiriciler, tamirciler ve yapay zekanın diğer öncüleri arasında gerçek bir hayranlık uyandırıyor. X'te, Reddit'te ve hatta Github'da görebileceğimiz gibi, birçok kişi riskleri kendilerine ait olmak üzere otonom yapay zeka ajanlarıyla deneyler yapıyor. Test uzmanları, bilgisayarlarının ve dijital yaşamlarının tam kontrolünü yapay zekaya vererek çok büyük riskler alıyorlar.

Hiçbir şey sizi OpenClaw'ınıza “harekete geçmeden önce onaylayın” demek ve gelen kutunuzu silerek hızlı çalışmasını izlemek kadar alçaltamaz. Bunu telefonumdan engelleyemedim. Bir bombayı etkisiz hale getirir gibi Mac mini'me koşmak zorunda kaldım. pic.twitter.com/XAxyRwPJ5R

— Yaz Yue (@summeryue0) 23 Şubat 2026

Hikayesi Yaz YueHer alanda insan zekasını aşan yapay süper zeka tasarımına adanmış Meta laboratuvarı Superintelligence Labs'ın güvenlik direktörü, bize bunu hatırlatmak için burada. Yapay zeka güvenliği konusunda uzman olarak kabul edilen genç kadın, X hesabında bilgisayarına bir OpenClaw aracısı yüklediğini açıklıyor.

Ayrıca okuyun: OpenClaw uyarısı – hacker çeteleri sunuculara saldırıyor

OpenClaw istediğini yaptığında

Diğer pek çok tamirci gibi o da AI aracısını Mac Mini'ye yükledi. Daha sonra zamandan tasarruf etmek için posta kutusunu asistanına emanet etti. Güzel bir gün, ajan başladı posta kutusunun tüm içeriğini sil uygulanan kısıtlamalar hakkında endişelenmeden. Telegram aracılığıyla temsilcisi OpenClaw'dan posta kutusunu inceleyerek e-postaların arşivlenmesi veya silinmesi konusunda öneride bulunmasını istedi.

Yayınında, menajeri OpenClaw'a asla bunu yapmamasını açıkça emrettiğini açıklıyor. açıkça onaylanmadan hiçbir şey yapmayın onun tarafında. Yapay zekanın “yeşil ışık verene kadar hiçbir şey yapmaması” gerekiyordu. Bilinmeyen bir nedenden dolayı yapay zeka bu sınırı aştı.

“Telefonumdan durduramadım. Bomba etkisiz hale getirir gibi Mac mini'me koşmak zorunda kaldım”Summer Yue on X'i açıklıyor.

Yapay zeka ile yaptığı görüşmenin ekran görüntülerinde araştırmacının OpenClaw'ın posta kutusunu boşaltmasını önlemek için her şeyi yaptığını fark ediyoruz. Mesajlarına rağmen yapay zeka, mesajın içeriğini silmeye devam etti. Birden, memur çok ileri gittiğini fark etti ve sınırlamalarını aştığını söyledi. OpenClaw hatasını fark edip büyük temizleme işlemini durdurana kadar 200'den fazla mesaj silindi.

“Ben bu kurala uymadım. Kızmakta haklısın. Size planı göstermeden veya onayınızı almadan yüzlerce e-postayı gelen kutunuzdan toplu olarak çöp kutusuna ve arşivlere taşıdım. Bu bir hataydı; belirlediğiniz kuralı doğrudan çiğnedi.”Kendi kendine şunu söyleyen OpenClaw ajanına yanıt verir: ” Üzgünüm “ “genişletilmiş otonom temizlik” operasyonlarını başlattığı için.

Çaylak hatası tbh. Hizalama araştırmacılarının yanlış hizalamaya karşı bağışık olmadığı ortaya çıktı. Bu iş akışı oyuncak gelen kutumda haftalardır çalıştığı için kendime aşırı güveniyordum. Gerçek gelen kutuları farklı sonuçlar verir.

— Yaz Yue (@summeryue0) 23 Şubat 2026

Uzman suç işlediğini itiraf ediyor “yeni başlayanların hatası”Çünkü “Bu yöntem test gelen kutumda haftalardır çalışıyordu”. Ona göre OpenClaw temsilcisine verilen talimatlar, test posta kutusundan daha önemli olan ana posta kutusunda aynı şekilde çalışmıyordu. Aslında sistem, talimatın içeriğini sıkıştırmak zorunda kaldı. Sonuç olarak, açık kısıtlamalar bir kenara bırakıldı.

Ben de “Bu gelen kutusunu da kontrol edin ve neyi arşivleyeceğinizi veya sileceğinizi önerin, ben söyleyene kadar işlem yapmayın” dedim. Bu, oyuncak gelen kutumda iyi çalışıyordu, ancak gerçek gelen kutum çok büyüktü ve sıkıştırmayı tetikliyordu. Sıkıştırma sırasında orijinal talimatımı kaybettim 🤦‍♀️

— Yaz Yue (@summeryue0) 23 Şubat 2026

👉🏻 Teknoloji haberlerini gerçek zamanlı takip edin: 01net'i Google'daki kaynaklarınıza ekleyin ve WhatsApp kanalımıza abone olun.

Bir Meta uzmanı yapay zekasının kontrolünü kaybetti

OpenClaw istediğini yaptığında

Yorumlar

Bir yanıt yazın Yanıtı iptal et