Genel Bakış 3: Sinir ağları nelerdir ve nasıl çalışılır?

Nöronal ağlar modern mekanik öğrenmenin kalbidir. Vokal tanımadan görüntülerin işlenmesine ve GPT-5 gibi üretken vokal modellere kadar çok sayıda uygulamanın temelidir.

Genellikle çok karmaşık ve anlaşılması zor bir yapı gibi görünüyorlar. Nispeten basit bir prensibe dayanmaktadırlar: birçok küçük tekdüze işleme birimi arasındaki yüksek boyutlu ilişkileri modelleyebilen bir ağa bağlantı.

Golo Roden, yerel web GmbH'nin kurucusu ve CTO'sudur. Olaylara ve hizmetlere dayalı olarak dağıtılmış mimarilere özellikle dikkat ederek web ve bulut uygulamalarının ve arıların anlayışı ve geliştirilmesi ile ilgilidir. Yol gösterici ilkesi, yazılımın gelişiminin kendi başına bir son olmaması, ancak her zaman aşağıda bir profesyonellik izlemesi gerektiğidir.

Bu makale sinir ağlarının temel yapısını açıklamaktadır, en önemli terimleri açıklamaktadır ve basit varyantların neden şaşırtıcı derecede verimli olabileceğini gösterir.

Biyolojik olarak ilham verici, ancak organik değil

Nöronal ağlar başlangıçta insan beyninin yapısından esinlenmiştir. Biyolojide beyinler, sinapslar ve elektrik işlem sinyalleri yoluyla birbirine bağlı nöronlardan oluşur. Bu benzetme bir model olarak hizmet edilir – ancak yüzeyseldir. Yapay bir nöronal ağdaki “nöronlar”, ağırlık veren, sonucu ekleyen ve sonucu ekleyen ve gönderen bir aktivasyon işlevinden gönderen basit matematiksel fonksiyonlardır. Bu yüzden biyolojik süreçlerin gerçek bir kopyası değil, soyut hesaplama öğeleri.

Nöronal bir ağ oluşturun

Yapay bir sinir ağı farklı seviyelerden oluşur:

Giriş seviyesi (giriş seviyesi): Giriş seviyesi ham verileri kaplar. Her giriş değişkeni bu katmandaki bir düğüme karşılık gelir.
Gizli seviyeler (gizli seviyeler): Gizli katmanlar verileri dönüştüren nöronlardan oluşur. Bu katmanların sayısına ve yapısına bağlı olarak, düz veya derin ağlardan bahsediyoruz.
Harcama seviyesi (çıktı seviyesi): Çıkış seviyesi, örneğin bir sınıflandırma veya sayısal değer gibi ağın sonucunu döndürür.

Bir tabakanın her nöronu bir sonraki tabakanın nöronlarına bağlanır. Bu bağlantılar deniyor Ağırlıkeğitim sırasında uyarlanmıştır. Ayrıca, her nöronun bir Ön yargıYani, seslerden bağımsız olarak çalışan bir hareket.

Tipik bir nöron, girişlerinin ağırlıklı bir toplamını hesaplar, bozulma ekler ve bu nedenle bir aktivasyon işlevi kullanır. Bu fonksiyon, nöronun “çekim yapıp yapmadığına” karar verir. Ortak aktivasyon fonksiyonları relu (düzeltilmiş doğrusal birim) veya sigmiideo fonksiyonudur.

Neden birkaç katman?

Tek bir nöron sadece iki sınıf arasında doğrusal bir ayrım gibi çok basit resimler oluşturabilir. Sadece farklı katmanlardaki birçok nöronun kombinasyonu ile karmaşık ve doğrusal olmayan ilişkileri de modelleyebilen bir ağdır. Her seviye bir dereceye kadar farklı bir soyutlama seviyesini öğrenir: Görüntü algılama için bir ağda, birinci seviyeler basit kenarları, orta geometrik şekilleri ve yüzler veya karakterler gibi en son karmaşık nesneleri tanıyabilir.

Bu hiyerarşinin oluşumu, nöronal ağların önemli bir başarı faktörüdür. Sistemlerin örnek verilerden, ilgili özellikler hakkında nispeten açık bir şekilde açık bir şekilde açık bir bilgi ile öğrenmesini mümkün kılar.

Bir Ağ Nasıl Öğrenilir

Nöronal bir ağ iki adımda antrenman yapıyor: ileri yarış (ileri yayılma) ve arkanın arkası (pişirme yayılımı).

Ön Koşu: Giriş verileri, bir çıkış oluşturulana kadar ağ üzerinden seviyeye göre yönlendirilir.
Hata Hesaplama: Çıktı beklenen sonuçla karşılaştırılır. Bu bir hata değerine dönüşür (örneğin orta kare sapma gibi bir kayıp işlevinden).
Geri yayılma: Hata, ağ üzerinden çıkış seviyesi tarafından yayılır. Ağırlıklar düzenli olarak ayarlanır, böylece bir sonraki işlem yapılırken hata azalır. Bu işlem gradyan prosedürlerine dayanır ve birçok yinelemede tekrarlanır.

Bu süreç tamamen matematikseldir. Ağ “” insan anlamında hiçbir şey içermez: verilere mümkün olan en iyi şekilde adapte olan matematiksel bir işleve yaklaşmak için yalnızca sayısal değerlere uyum sağlar.

Sınırlar ve zorluklar

Nöronal ağlar güçlüdür, ancak evrensel olarak uygulanabilir değildir. Genellikle güvenilir bir şekilde çalışmak için büyük miktarlarda eğitim verisine ihtiyacınız vardır. Ayrıca, adaptasyonun fazlalığına, yani eğitim verilerini uyarlama yöntemine duyarlıdırlar, bu da onları yeni öğelerde genelleştirilmiş hale getirir.

Başka bir eleştiri noktası sınırlı açıklanabilirliktir: özellikle, derin ağların analiz edilmesi genellikle zordur, çünkü hangi iç temsillerin öğrendiği açık değildir. Bu nedenle, daha fazla şeffaflığa izin vermesi gereken açıklanabilir yapay zeka prosedürleri üzerine yapılan araştırma yapılmaktadır.

görüş

Bir sonraki bölümde derin öğrenmeye yöneliyoruz: “derin” nöronal ağların ne yaptığı sorusu, çünkü derinlik genellikle yararlıdır ve sinir ağları (CNN) ve tekrar eden sinir ağları (RNN) gibi tipik mimariler çalışır. Bu, birçok modern yapay zeka uygulamasına izin veren yöntemlere en yakın yöntemleri kullanır.

(RME)