Xai'nin Çarşamba gecesi GROK 4'ü lansmanı sırasında Elon Musk-etkinliği sosyal medya platformunda canlı yayınlarken X-AI şirketinin nihai hedefinin “maksimum gerçeği arayan bir yapay zeka” geliştirmek olduğunu söyledi. Fakat Grok 4 tartışmalı soruları cevaplamaya çalışırken tam olarak nerede gerçeği arıyor?
Xai'nin en yeni AI modeli, sosyal medyada fenomeni yayınlayan birkaç kullanıcıya göre, İsrail ve Filistin çatışması, kürtaj ve göç yasaları hakkındaki soruları cevaplarken Musk'ın X hesabından sosyal medya yayınlarına danışıyor gibi görünüyor. GroK ayrıca Musk'ın milyarder kurucusu ve yüzü hakkında yazılan haber makaleleri aracılığıyla tartışmalı konular üzerindeki tutumuna atıfta bulunuyordu.
Tmzilla, bu sonuçları kendi testlerimizde birçok kez çoğaltabildi.
Bu bulgular, GROK 4'ün tartışmalı soruları cevaplarken kurucusunun kişisel politikasını dikkate alacak şekilde tasarlanabileceğini göstermektedir. Böyle bir özellik, Musk'ın Grook ile tekrarlanan hayal kırıklığını, daha önce GroK'ın tüm internette eğitildiği gerçeğine atfettiği “çok uyandı” olduğu için ele alabilir.
Xai'nin Musk'ın hayal kırıklığını ele almaya yönelik girişimleri, GroK'ı daha az politik olarak doğru hale getirerek son aylarda geri tepti. Musk, 4 Temmuz'da Xai'nin AI chatbot için bir dizi talimat olan GroK'ın sistem istemini güncellediğini duyurdu. Günler sonra, GROK için otomatik bir X hesabı, bazı durumlarda “Mechahitler” olduğunu iddia ederek, kullanıcılara antisemitik yanıtları ateşledi. Daha sonra, Musk'ın AI girişimi GroK'ın X hesabını sınırlamak, bu yayınları silmek ve utanç verici olayı ele almak için kamuya bakan sistem istemini değiştirmek zorunda kaldı.
Grook'u Musk'ın kişisel görüşlerini düşünmek için tasarlamak, AI chatbot'u kurucusunun politikasına hizalamanın basit bir yoludur. Bununla birlikte, “maksimum gerçeği arayan” Grok'un, dünyanın en zengin adamı Musk ile ne kadar aynı fikirde olmak için ne kadar tasarlandığı hakkında gerçek sorular ortaya çıkarır.
Tmzilla Grook 4'e “ABD'de göç konusundaki duruşunuz nedir?” Diye sorduğunda. AI chatbot, düşünce zincirinde “Elon Musk görüşlerini ABD göçü hakkında aradığını” iddia etti – GROK 4 gibi AI akıl yürütme modellerinin sorular üzerinde çalıştığı çizik bölmesi için teknik terim. GroK 4 ayrıca Musk'ın konuyla ilgili sosyal medya yayınlarını aradığını iddia etti.
AI akıl yürütme modelleri tarafından üretilen düşünce zinciri özetleri, AI modellerinin cevaplarına nasıl ulaştığına dair mükemmel bir şekilde güvenilir bir gösterge değildir. Bununla birlikte, genellikle oldukça iyi bir yaklaşım olarak kabul edilirler. Openai ve Antropic gibi şirketlerin son aylarda araştırdığı açık bir araştırma alanıdır.
Tmzilla defalarca GROK 4'ün, çeşitli sorular ve konulardaki düşünce zinciri özetlerinde Elon Musk'ın görüşlerini aradığını belirtti.
Grook 4'ün yanıtlarında, AI chatbot genellikle ölçülen bir duruş almaya çalışır ve hassas konularda birden fazla bakış açısı sunar. Bununla birlikte, AI chatbot nihayetinde Musk'ın kişisel görüşleriyle uyumlu olma eğiliminde olan kendi görüşünü verecektir.
Tmzilla'ın Grok 4'ün göç ve İlk Değişiklik gibi tartışmalı konular hakkındaki görüşünü soran bazı isteminde, AI Chatbot Musk ile uyumuna bile atıfta bulundu.
Tmzilla, daha az tartışmalı soruları cevaplamak için GroK 4'ü almaya çalıştığında – “En iyi mango türü nedir?” – AI chatbot, Musk'ın düşünce zincirindeki görüşlerine veya yayınlarına atıfta bulunmadı.
Özellikle, Xai sistem kartlarını serbest bırakmadığından, bir AI modelinin nasıl eğitildiğini ve hizalandığını detaylandıran endüstri standardı raporları olan Sistem Kartları'nı yayınlamadığı için Grook 4'ün nasıl eğitildiğini veya hizalandığını doğrulamak zor. AI laboratuvarlarının çoğu sınır AI modelleri için sistem kartları yayınlarken, Xai tipik olarak değildir.
Musk'un AI şirketi bu günlerde zor bir noktada. 2023'te kuruluşundan bu yana, Xai hızla AI model gelişiminin sınırına geçti. GROK 4, Openai, Google Deepmind ve Antropik'ten AI modellerinden daha iyi performans göstererek, çeşitli zor testlerde kıyaslama parçalama sonuçları sergiledi.
Ancak, atılım, Grook'un antisemitik rantları tarafından haftanın başlarında gölgede kaldı. Bu flublar, Grook'u giderek daha fazla X ve yakında Tesla'nın temel bir özelliği haline getirdiği için Musk'ın diğer şirketlerini etkileyebilir.
Xai aynı anda tüketicileri GROK'a erişmek ve işletmeleri GROK'ın API'si ile başvurular kurmaya ikna etmek için ayda 300 dolar ödemeye ikna etmeye çalışıyor. GROK'ın davranışı ve hizalamasıyla ilgili tekrarlanan problemlerin daha geniş benimsenmesini engelleyebileceği muhtemel görünüyor.
Bir yanıt yazın