Ajansal kodlama: kodlayıcıdan kod denetleyiciye

Marius Wichtner, MaibornWolff'ta bir yazılım mühendisidir ve yazılım mimarisi, temiz kod ve geliştirme sürecinde üretken yapay zekanın kullanımı üzerinde yoğun bir şekilde çalışmaktadır. Çeşitli müşteri projelerinde, sürdürülebilir kod kalitesi ve geliştirici deneyimine odaklanarak aracıların mevcut sistemlere nasıl anlamlı bir şekilde entegre edilebileceğine dair stratejiler geliştiriyor.

Venko Kisev, MaibornWolff'un sağlık kontrolü ve yazılım modernizasyon departmanına başkanlık ediyor. Son 15 yılda ekibiyle birlikte çok sayıda analiz ve modernizasyon projesine liderlik ederek, çeşitli sektörlerden lider firmalarla işbirlikleri yaparak, yapay zekanın duyarlı ve sorumlu kullanımına giderek daha fazla odaklanıyor.

Ajansal kodlama günlük gelişimin ayrılmaz bir parçası haline geldi. Yapay zeka aracıları kodu kısa sürede planlar, dağıtır, test eder ve belgelendirir. Ekipler, her değişikliği elle yazmak yerine uzman asistanları yönetir. GitHub Copilot gibi yapay zeka asistanlarına ve ChatGPT gibi sohbet modellerine ek olarak, tüm geliştirme aşamalarıyla ilgilenen otonom aracılar da mevcut.

Duyurudan sonra devamını okuyun

Döngü sayısı artıyor ancak korkuluklara olan ihtiyaç da artıyor. Güvenlik gereksinimleri, gecikme hedefleri, ölçeklenebilirlik ve mimari kurallar göz ardı edilirse işlevsel olarak doğru kod yeterli değildir. Yeterli bağlamsal bilgi olmadan, sistemler yavaş yavaş orijinal mimarisinden sapar, testlerin doğruluğu kaybolur ve teknik borç artar.

Aracılar mevcut yazılım senaryolarına nasıl entegre edilebilir, işlevsel olmayan gereksinimler söz konusu olduğunda sınırlamaları nelerdir? Uygulamada hangi rolleri ve süreçleri oynuyorlar ve boru hattındaki hangi testler hız ve sürdürülebilirliği birleştirmeye yardımcı oluyor? Bu makale bunun gibi sorulara cevap veriyor.

Ajanslı kodlama, projede gerçekleştirilecek görevlere, kod tabanının büyüklüğüne ve uygulanacak değişikliğin türüne bağlı olarak yapay zeka ajanlarıyla tek tek veya birkaç özel aracıyla birlikte geliştirmeyi ifade eder. Yardım araçlarının aksine, yalnızca seçici destek sağlamakla kalmaz, aynı zamanda tanımlanmış hedefleri büyük ölçüde özerk bir şekilde uygularlar. Bağımsız olarak görevleri zamanlayabilir, kodu değiştirebilir, testler oluşturabilir, kararları belgeleyebilir ve iyileştirme döngülerini çalıştırabilirsiniz. İnsanlar hedefleri ve kuralları tanımlar, sonuçları kontrol eder ve mimari kararlar verir.

Kendini tamamlamadan mimari sorumluluğa

Duyurudan sonra devamını okuyun

Anthropic ve OpenAI'nin (ChatGPT) GitHub Copilot ve sohbet modellerine ek olarak artık yeni bir araç sınıfı var: otonom aracılar. Planlamadan entegrasyona kadar tüm geliştirme aşamalarıyla siz ilgilenirsiniz. Bugün bunlar, örneğin Windsurf ve Cursor gibi Visual Studio Code çatallarında IDE entegrasyonları olarak, Anthropic'in Claude Code'u veya OpenAI'nin Codex'i gibi terminalle entegre aracılar olarak ve OpenCode gibi açık kaynaklı yazılımlar olarak bulunabilir.

Bu aracılar API'ler tasarlar, test paketlerini düzenler, güvenlik açıklarını tespit eder veya eski modülleri davranışlarını değiştirmeden yeniden yapılandırır. Bazı durumlarda dış bilgi kaynaklarına erişirler, kararlarını belgelendirirler ve iyileştirme döngülerini bağımsız olarak yürütürler. Yeni bir çalışma modeli ortaya çıkıyor: Geliştiriciler artık bireysel araçlarla etkileşime girmiyor, bunun yerine uzman aracılardan oluşan bir ekip oluşturuyor. Bu değişiklik yalnızca teknik düzeyde değil, aynı zamanda projelerin yapılandırılma ve üstlenilme biçiminde de ortaya çıkıyor.

Bu gelişme birçok olasılığın önünü açıyor ama aynı zamanda sorumlulukları da değiştiriyor. Temsilciler ne kadar operasyonel görev üstlenirse, kavramsal yönergeler oluşturma yeteneği de o kadar önemli hale gelir. Bir çözümün uygulanabilir olup olmadığına kim karar veriyor? Üretilen kodun hedef mimariye uyup uymadığını kim kontrol ediyor? Peki etmenler birbiriyle çeliştiğinde, işlevsel olmayan gereksinimleri göz ardı ettiğinde veya teknik açıdan istenmeyen varsayımlarda bulunduğunda ne olur?

Ajanssal kodlama, otomasyonun doğrusal bir devamı değil, yeni bir aşamadır: kararlar değişiyor, süreçler hızlanıyor, beklentiler değişiyor. Ve tam da bu nedenle, yalnızca araçlar konusunda değil, aynı zamanda bizzat gelişime yönelik tutum konusunda da yansıtıcı bir yaklaşım gereklidir.

Aracıların sınırlarına ulaştığı yer: İşlevsel olmayan gereksinimler

Ajanslı kodlama, yapay zeka destekli otomasyonun ne kadar ilerlediğini etkileyici bir şekilde gösteriyor. Yapay zeka aracıları işlevsel görevleri giderek daha güvenilir bir şekilde yerine getiriyor: bir API tasarlamak, bir formu doğrulamak ve bir veritabanı sorgusunu entegre etmek, genellikle bir insanın yapabileceğinden daha hızlı. Ancak sonuçlar her zaman teknik olarak doğru değildir; Yalnızca derinlemesine bilgi ve işlevsel olmayan gereksinimlerin kontrolü ile güvenilir, iyi belgelenmiş, yürütülebilir ve uygulanabilir hale gelirler.

Çünkü işlevsel olmak, dayanıklı olmak anlamına gelmez. Çünkü basitçe “yazılımın ne yapması gerektiğinin” ötesine geçen gereksinimler devreye girdiğinde (örneğin ne kadar hızlı tepki vermesi gerektiği, ne kadar güvenli veya sürdürülebilir olması gerektiği gibi) yeni boşluklar ortaya çıkıyor. İşlevsel olmayan gereksinimler alanının ve bununla birlikte günümüz temsilcilerinin tipik zayıflıklarının başladığı yer tam da burasıdır.

İşlevsel olmayan gereksinimler bir sistemin “nasıl” olduğunu tanımlar: Bir hizmet yük altında ne kadar iyi tepki vermelidir? Arayüzler saldırılara karşı ne kadar güvenli korunuyor? İş modeli değişirse yeni bir modül ne kadar ölçeklenebilir? Uzun vadeli bakımı yapılabilir sistemler elde etmek için hangi mimari kurallara uyulmalıdır?

Nadiren bu tür gereksinimler doğrudan bir bilgi isteminden türetilebilir. Genellikle örtülü, bağlamsal, şirkete özgü ve dinamiktirler. Yazılımdaki birçok kararın, neden başka bir ekibin spesifikasyon sağladığı veya belirli bir çözümü seçtiği gibi nedensel bağımlılıkları vardır. İhtiyaçlar genellikle zamanla ortaya çıkar: ölçeklenebilirlik ancak kullanıcı sayısı arttığında önem kazanır; Gerçek zamanlı özellikler geldiğinde gecikme gereksinimleri. Bu tür bağlantıların kısa bir mesaja sıkıştırılması pek mümkün değildir. Yalnızca yerel olarak çalışan (yani bireysel dosyalara veya görevlere odaklanan) aracıların bu üst düzey hususlara dair hiçbir öngörüsü yoktur.

Örnek: üretkenlik yerine risk

Örnek: Bir aracı, test ve dokümantasyon da dahil olmak üzere rekor sürede yeni bir REST API oluşturur. Teknik olarak doğru, sözdizimsel olarak temiz, ancak mevcut güvenlik mekanizmalarına entegrasyon yok, günlüğe kaydetme konsepti yok ve gecikme veya ölçeklenebilirlik dikkate alınmıyor. İlk bakışta üretkenlik gibi görünen şey, hızla sistem çapında bir risk haline gelir.

Mimari kararlarda da durum benzerdir. Aracılar bağlamsal olarak çalışırlar, ancak yalnızca ellerindeki bilgilerle çalışırlar. Bir modül mevcut bir katmanlı mimariye uyarsa, mevcut kurallar ihlal edilirse veya döngüsel bağımlılıklar yaratılırsa, ek kontrol mekanizmaları olmadan genellikle fark edilmez. Kötü kararlar aniden ortaya çıkmaz, anında artar.

Bir temsilci, bir yöntemi başarılı bir şekilde uygulayabilir ancak bunun güvenlik açısından kritik bir yolda olduğunu fark etmeyebilir. Testler yazabilir ancak bunların gerçekten temel iş mantığını sağlayıp sağlamadığını değerlendiremez. Düzenleyici bir çerçeveyi etkilediğini bilmeden kodu yeniden yapılandırabilir.

Uygulamada bu durum paradoksal bir etkiye yol açmaktadır: Sistemler daha hızlı ortaya çıkmakta, ilk bakışta eksiksiz görünmektedir ve merkezi kalite özelliklerine sahip olmadıkları için hala teknik borç üretmektedir.

Test kapsamına ilişkin yinelenen bir model de vardır: birçok test oluşturulur, ancak doğru olanlar olmayabilir. Sınır koşulları, arıza yolları veya iş açısından kritik mantık dikkate alınmazken genellikle önemsiz durumlar ele alınır. Test kapsamı yanılsaması, güvenilir bir kalite stratejisinin yerini tutamaz.

Dahası, meta düzeyde yeni zorluklar ortaya çıkıyor: Çıktıyı kim kontrol ediyor? Aracılar saat başına düzinelerce işlem ürettiğinde insan incelemesinin rolü nedir? Hangi metrikler değerlendirmeye yardımcı olur? Teknik borcun sadece kalıcı olmasını değil aynı zamanda otomatik olarak büyümesini de nasıl önleyebilirsiniz?