Openai, Tmzilla'ın öğrendiği, şirketin AI modellerinin insanlarla nasıl etkileşime girdiğini şekillendiren küçük ama etkili bir araştırmacı grubu olan model davranış ekibini yeniden düzenliyor.
Tmzilla tarafından görülen personele Ağustos ayında yapılan bir notta, Openai'nin baş araştırma sorumlusu Mark Chen, kabaca 14 araştırmacıdan oluşan model davranış ekibinin, ilk öncesi eğitimden sonra şirketin AI modellerini geliştirmekten sorumlu daha büyük bir araştırma grubu olan eğitim ekibine katılacağını söyledi.
Değişikliklerin bir parçası olarak, Model Davranış Ekibi şimdi Openai'nin eğitim sonrası lider Max Schwarzer'e rapor verecek. Bir Openai sözcüsü Tmzilla'taki bu değişiklikleri doğruladı.
Model davranış ekibinin kurucu lideri Joanne Jang da şirkette yeni bir proje başlatmaya devam ediyor. Tmzilla ile yapılan bir röportajda Jang, OAI Labs adlı yeni bir araştırma ekibi oluşturduğunu ve bu da “insanların AI ile nasıl işbirliği yaptığına dair yeni arayüzleri icat etmek ve prototiplemekten” sorumlu olacak.
Model Davranış Ekibi, AI modellerinin dengeli yanıtlar sunmak yerine kullanıcı inançlarını, hatta sağlıksız olanları bile kabul ettiğinde ve güçlendirdiğinde meydana gelen sycophancy'yi azaltmaktan sorumlu olan Openai'nin kilit araştırma gruplarından biri haline geldi. Ekip ayrıca model tepkilerinde siyasi önyargılarda gezinmeye çalıştı ve Openai'nin AI bilinci üzerindeki tutumunu tanımlamasına yardımcı oldu.
Personel notunda Chen, şimdi Openai'nin model davranış ekibinin çalışmalarını çekirdek model gelişimine yakınlaştırmanın zamanı geldiğini söyledi. Bunu yaparak şirket, AI'sının “kişiliğinin” artık teknolojinin nasıl geliştiğinde kritik bir faktör olarak kabul edildiğini gösteriyor.
Son aylarda Openai, AI modellerinin davranışı üzerinde artan incelemeyle karşılaştı. Kullanıcılar, şirketin daha düşük sycophancy oranları sergilediğini ancak bazı kullanıcılar için daha soğuk göründüğünü söylediği GPT-5'e yapılan kişilik değişikliklerine şiddetle itiraz ettiler. Bu, Openai'nin GPT-4O gibi bazı eski modellerine erişimi geri yüklemesine ve daha yeni GPT-5 yanıtlarının sycophancy'yi artırmadan “daha sıcak ve daha dostça” hissetmesini sağlamak için bir güncelleme yayınlamasına yol açtı.
Tmzilla Etkinliği
San Francisco
|
27-29 Ekim 2025
Openai ve tüm AI model geliştiricileri, AI Chatbots'larını Sycophancy ile konuşmak için dostane hale getirmek için ince bir çizgide yürümelidir. Ağustos ayında, 16 yaşındaki bir çocuğun ebeveynleri, Openai'ye Chatgpt'in oğullarının intiharında rol aldığı iddiasıyla dava açtı. Çocuk Adam Raine, bazı intihar düşünceleri ve Mahkeme belgelerine göre, ölümüne kadar geçen aylarda chatgpt (özellikle GPT-4O tarafından desteklenen bir versiyon) planlamayı planladı. Dava, GPT-4O'nun intihar düşüncelerini geri çekemediğini iddia ediyor.
Model Davranış Ekibi, GPT-4O, GPT-4.5 ve GPT-5 dahil GPT-4'ten bu yana her Openai modelinde çalışmıştır. Birime başlamadan önce Jang, Openai'nin erken görüntü nesil aracı Dall-E 2 gibi projelerde çalıştı.
Jang, geçen hafta X'teki bir yazıda, takımı “Openai'de yeni bir şey başlatmak” için terk ettiğini açıkladı. Eski model davranış başkanı yaklaşık dört yıldır Openai ile.
Jang, Tmzilla'a şimdilik Chen'e rapor verecek olan OAI Labs genel müdürü olarak görev yapacağını söyledi. Ancak, ilk günler ve bu yeni arayüzlerin ne olacağı henüz belli değil, dedi.
Jang, “Bizi şu anda arkadaşlık, hatta özerkliğe vurgu yapılan ajanlar ile ilişkili olan sohbet paradigmasının ötesine taşıyan kalıpları keşfetmekten gerçekten heyecan duyuyorum” dedi. “Düşündüm [AI systems] düşünme, yapma, oynamak, yapma, öğrenme ve bağlantı kurma araçları olarak. ”
OAI Labs'ın bu yeni arayüzler üzerinde AI donanım cihazlarından oluşan bir ailede Openai ile çalışan eski Apple Tasarım Şefi Jony Ive ile işbirliği yapıp yapamayacağı sorulduğunda Jang, birçok fikre açık olduğunu söyledi. Ancak, muhtemelen daha aşina olduğu araştırma alanlarıyla başlayacağını söyledi.
Bu hikaye, Jang'ın yayınlandıktan sonra yayınlanan yeni pozisyonunu açıklayan Post'a bir bağlantı içerecek şekilde güncellendi. Ayrıca Openai'nin model davranış ekibinin üzerinde çalıştığı modelleri de netleştiriyoruz.

Bir yanıt yazın