OpenAI, ajansal kodlama için yeni MacOS uygulamasını başlattı

Yapay zeka, yazılımın yazılma şekli üzerinde zaten sismik bir etkiye sahip; programlamanın zorlu işlerinin çoğu artık aracılar ve alt aracılar tarafından gerçekleştiriliyor. Ancak geliştiriciler insan-yapay zeka işbirliği için yeni arayüzler ve form faktörleri üzerinde deneyler yaptıkça, en gelişmiş yapay zeka laboratuvarlarının bile buna ayak uydurması zorlaşıyor.

Mevcut trend, Claude Code ve Cowork uygulamaları tarafından örneklendirilen, yapay zeka aracılarının kodlama görevleri üzerinde bağımsız olarak çalışabildiği sistemler olan ajansal yazılım geliştirme yönündedir. Bu arada OpenAI, geçen Nisan ayında bir komut satırı aracı olarak başlatılan ve bir ay sonra bir web arayüzüne genişleyen Codex aracını yavaş yavaş geliştiriyor.

Şimdi OpenAI, arayı kapatmak için büyük bir adım atıyor. Pazartesi günü şirket, Codex için geçen yıl popüler hale gelen ajans uygulamalarının çoğunu entegre eden yeni bir MacOS uygulamasını başlattı. Yeni uygulama, birden fazla temsilciyle paralel olarak çalışacak ve temsilci becerilerini ve diğer son teknoloji iş akışlarını entegre edecek şekilde tasarlandı. Lansman, OpenAI'nin en güçlü kodlama modeli olan ve şirketin Claude Code kullanıcılarını cezbetmeye yeteceğini umduğu GPT-5.2-Codex'in piyasaya sürülmesinden iki aydan kısa bir süre sonra gerçekleşti.

CEO Sam Altman basın toplantısında gazetecilere verdiği demeçte, “Eğer gerçekten karmaşık bir şey üzerinde sofistike bir çalışma yapmak istiyorsanız, 5.2 açık ara en güçlü modeldir” dedi. “Ancak kullanımı daha zor olduğundan bu seviyedeki model kapasitesini alıp daha esnek bir arayüze yerleştirmenin oldukça önemli olacağını düşünüyoruz.”

Altman'ın GPT-5.2'ye olan güveni anlaşılabilir olsa da kodlama kıyaslamaları daha karmaşık bir hikaye anlatıyor. GPT-5.2, en azından yayınlandığı an itibarıyla TerminalBench'te (yapay zekanın komut satırı programlama görevlerini ne kadar iyi yönettiğini ölçen bir test) en üst sırada yer alıyor. Ancak Gemini 3 ve Claude Opus'un ajanları kabaca eşdeğer puanlar kaydettiler; daha düşük, ancak karşılaştırma ölçütünün hata payı dahilinde. Yapay zekanın gerçek dünyadaki yazılım hatalarını düzeltme yeteneğini test eden başka bir kodlama kriteri olan SWE-bench'ten elde edilen sonuçlar da benzerdir ve GPT-5.2 için açık bir avantaj göstermemektedir. Ancak aracılı kullanım durumlarını etkili bir şekilde kıyaslamak zor olmuştur ve en son teknolojiye sahip modeller, kullanıcı deneyimi açısından önemli ölçüde farklılık gösterebilir.

Codex uygulaması ayrıca OpenAI'nin eşitlik sağlamasına veya bazı durumlarda çeşitli Claude uygulamalarını geride bırakmasına yardımcı olacağını söylediği bir dizi yeni özellik ile birlikte geliyor. Codex uygulaması, arka planda otomatik bir programla çalışacak şekilde ayarlanabilecek otomasyonlara izin verecek ve sonuçlar, kullanıcı geri döndüğünde incelenmek üzere bir kuyruğa yerleştirilecek. Kullanıcılar ayrıca çalışma tarzlarına bağlı olarak temsilci için pragmatikten empatikliğe kadar farklı kişilikler seçebilirler.

Ancak şirket için en büyük satış noktası, yapay zekanın mümkün kıldığı gelişme hızıdır. Altman, “Bunu temiz, yepyeni bir kağıt parçasından birkaç saat içinde gerçekten oldukça karmaşık bir yazılım parçası oluşturmak için kullanabilirsiniz” dedi. “Yeni fikirleri ne kadar hızlı yazabilirim, inşa edilebileceklerin sınırı budur.”

Techcrunch etkinliği

Boston, MA
|
23 Haziran 2026


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir