Bu Fransız yapay zekası, çok daha az kaynakla Google'dan daha iyi performans gösteriyor

Rakiplerine göre 20 kat daha az bilgi işlem kaynağına sahip olan INRIA Paris'te doğan bir model, operasyonel hava durumu tahmin sistemlerini geride bırakıyor. Ve kodu açık erişimdir.

Yapay zeka kullanılarak yapılan hava tahminleri, üç yılda devler arasında bir rekabet alanı haline geldi. Google DeepMind, GraphCast'ı 2023'te, ardından GenCast'ı 2025'te piyasaya sürdü. Avrupa Orta Vadeli Hava Tahminleri Merkezi (Bonn merkezli ECMWF), IFS ENS modelini onlarca yıldır çalıştırıyor. Bu devlerle rekabet edebilmek için genellikle devasa GPU çiftliklerine ve yedi rakamlı araştırma bütçelerine ihtiyacınız var. Paris'teki INRIA'dan bir ekip bunun tam tersini gösterdi. 22 Nisan'da yayınlanan çalışmaları Bilim GelişmeleriNeuralGCM'nin avantajını koruduğu jeopotansiyel hariç, neredeyse tüm referans hava durumu değişkenlerinde IFS ENS ve NeuralGCM'den (hibrit fizik-AI yaklaşımı) daha iyi performans gösteren olasılıksal bir model olan ArchesWeatherGen'i sunuyoruz.

Araçlarının küçük bir kısmıyla Google'dan daha iyisini nasıl yapabilirsiniz?

İşin püf noktası, iyi uygulanmış basit bir fikirde yatıyor. Ekip, üretken bir modeli doğrudan ham atmosferik verilere (bilgi işlemde bir servete mal olan) dayalı olarak eğitmek yerine iki adımda ilerledi. Bunlardan ilki, atmosferin 24 saat sonraki ortalama durumunu tahmin eden klasik bir deterministik model olan ArchesWeather'ın eğitilmesini içeriyor. İkincisi, deterministik modelin yakalayamadığı şeyleri modellemek için “akış eşleştirme” (yayılma modellerinin modern bir çeşidi, görüntü oluşturmak için kullanılanlarla aynı) adı verilen bir tekniği kullanır: belirsizlik miktarı, alternatif senaryolar, atmosferin izleyebileceği yörüngeler.

Tahminlerin doğruluğunu bir yıla ait (bu durumda 2020 yılı) gerçek verilere göre ölçen bir test olan WeatherBench değerlendirmesinde ArchesWeatherGen, IFS ENS'yi şubat kadar aşıyor: Ortalama %5,3 Olasılıksal tahminler için referans ölçütü olan CRPS puanı üzerinde, 10 güne kadar tahminlerin tüm temel değişkenleri üzerinde. Google'ın 111 km'lik bir ızgara üzerinde eğitilmiş GenCast'ı ile karşı karşıya kalan Fransız modeli, kısa vadede (1 ila 3 gün) biraz daha düşük performans gösteriyor ancak 4 günden itibaren avantaj elde ediyor. Ve GenCast'in atmosferi bölen yüksek çözünürlüklü versiyonuyla karşı karşıyayız. 28 km ağ ve eğitimi yirmi kat daha pahalı olan ArchesWeatherGen, 9 ve 10 günlük tahminlerde benzer performanslara yaklaşıyor.

Üniversite laboratuvarlarının kapısını açan erişilebilir bir model

ArchesWeatherGen'in toplam eğitim bütçesi GPU V100'de 45 günlük hesaplamaveya daha yeni A100 kartlarda yaklaşık 23 gün. Büyüklük sıralaması yapmak gerekirse, Google'ın GenCast'ı 1.000 V100 gününden fazlasını gerektirir. Eğitim veri seti, dünyayı 167 km'lik ağlara böler ve yalnızca bir terabayt ağırlığındadır; bu oran, yarışmada kullanılan 28 km'lik ince ızgaranın 36 katıdır. Tüm kodlar, önceden eğitilmiş modeller ve veri hattı GitHub'da açık bir lisans altında yayınlanır.

Bu çalışmanın arkasındaki ekip, yapay zeka alanında “Fransa'yı Seçin” başkanının bir parçası olarak Guillaume Couairon (Google DeepMind Paris'e taşındığından beri) ve Claire Monteleoni tarafından yönetiliyor. Hesaplama, CNRS bilgi işlem merkezi olan GENCI ve İDRİS'in Fransız altyapıları üzerinde gerçekleştirildi. Şunu açıkça söyleyebiliriz: Bu, kamu fonlarıyla finanse edilen ve gezegendeki en donanımlı laboratuvarlarla rekabet edebilecek bir model üreten Fransız kamu araştırmasıdır.

ArchesWeatherGen yarın Météo-France'ın çok daha iyi çözünürlüklerde çalışan operasyonel modellerinin yerini almayacak. Ancak bu, bir üniversite laboratuvarının artık uygun bir bütçeyle birinci sınıf olasılıksal tahminler üretebileceğini kanıtlıyor.

👉🏻 Teknoloji haberlerini gerçek zamanlı takip edin: 01net'i Google'daki kaynaklarınıza ekleyin ve WhatsApp kanalımıza abone olun.

Kaynak :

Bilim Gelişmeleri/INRIA


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir