Yapay zeka ajanları oluşturmak için öğrenme ortamları

Dolandırıcı Bildirim

Bu makale bu nedenle İngilizce olarak mevcuttur. Yayınlamadan önce teknik yardım ve editoryal revizyon ile çevrildi.

Yapay zeka ajanları için yeni eğitim ortamları olmalıdır. Hem büyük yapay zeka şirketleri hem de çok sayıda girişim bu ortamları yaratmaya çalışıyor. Önceki veri seti ile yapay zeka ajanlarının oluşumu, becerilerinin sınırlarının bir kısmını haklı gösteriyor gibi görünmektedir.

Prensip olarak, ajanlar AI zaten başka hizmetleri kullanabilir. Temsilciye ve alana bağlı olarak, bu farklı olabilir. Temsilciler bir çalışma ortamında hareket edebilir. Orada, bir AI ajanı, örneğin AI ai di Zoom Companion veya Microsoft's Co -Pilot gibi, yokluğunda tartışılan toplantıları veya konuları otomatik olarak özetleyebilir. Ancak, openais chatgpt ajanı veya Google Gemini ajanı gibi internette serbestçe hareket edebilen ve restoranda bir masa rezervasyonu yapabilen veya bazı çorap satın alabilen yapay zeka temsilcileri de var. Ama şimdiye kadar kesinlikle işe yaramıyor. Openaai CEO'su Sam Altman bile uyardı. Agers sadece başarısız olmakla kalmaz, aynı zamanda saldırıya uğrayabilirler.

Temsilcileri daha sağlam hale getirmek için, bir RL ortamında eğitim yardımcı olabilir. Bu bir tarayıcı gibidir, ancak internet erişimi olmayan bir tür öğrenme ortamıdır. Takviye öğrenimi veya öğrenmeyi güçlendirmek artık büyük vokal modellerin klasik oluşumunun ayrılmaz bir parçasıdır. Arkasında ödüllendirme çabası var: Bu nedenle modeller ödüllendirilmek üzere eğitildi: doğru şeyi yapmalı ve ondan öğrenmelidirler. Geri bildirim dışarıdan verilir.

En iyi durumda, bu, yeni RL ortamında doğru sayı ve renk çoraplarını satın almak için övüldüğü anlamına gelir. Ancak, bu elbette bir soru değil. Şimdiye kadar, yapay bir zeka ajanının çift paket çorap yerine mavi kazanması da olumlu olabilir. Bunun için övgü alamazdı. Yapay bir zeka ajanının nerede yanlış olduğu çok açık olması da önemlidir. Ancak o zaman yanlış davranış öğrenilebilir.

Temel olarak, bu sanal ortamlar yeni bir fikir değildir. TechCrunch, Google Deepmind'den AlphaGo da böyle bir masa oyununda masa oyununu öğrendi. Ancak, bunun önemli ölçüde daha sınırlı bir internet uzantısı vardır.

Treni kaybetmek istemeyen şirketler, örneğin Scala Ai'de Mercor ve Surge'u da içerir. Yapay zeka oluşumu için veri setlerinin hazırlanması alanından gelirler. Meta AI ölçeğinde yer alır. Ancak, çevresel bir Hub RL yayınlamış olan ilk akıl olarak yeni girişimler de var, bu da ortamlar için kucaklanmış bir tür yüz.

Yapay zeka temsilcileri hedeflerine daha iyi ulaşmak için bu yöntemle öğrenebilseler bile: Öğrenmeyi teşvik etmek, yapay zeka ajanlarının doğru olmasa bile hedeflerine ulaşmış gibi davranabilir. Böylece ödüllendirilmek için hile yapmayı tercih edebilirsiniz.

Ayrıca oku


(EMW)


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir