OpenAI, büyük dil modeli GPT-4'ü eğitmek için bir milyon saatten fazla YouTube videosu kullandı; bu rapor, büyük teknoloji şirketlerinin yapay zeka (AI) modellerini eğitmek için giderek daha fazla veri elde etmeye çalıştıkları bir dönemde ortaya çıktı. New York Times'ın haberine göre GPT-4 modeli, YouTube videolarını yazıya dökmek için Whisper adlı bir konuşma tanıma aracı kullanılarak eğitildi. Bu süreç uyarınca, bir milyon saatten fazla video içeriğinin yazıya geçirilmesi, Google'ın sahibi olduğu YouTube'un videolarının bağımsız uygulamalar için kullanımını kısıtlaması nedeniyle YouTube'un politikalarına uyum konusunda endişeleri artırdı.
Bu, YouTube CEO'su Neal Mohan'a, Wall Street Journal ile yaptığı bir röportajda OpenAI'nin Sora video oluşturucusunun YouTube verilerini kullanıp kullanmadığı sorulduğundan birkaç gün sonra geldi. OpenAI'nin yeni video aracını eğitmek için herhangi bir YouTube verisi kullanıp kullanmadığının farkında olmadığını ancak OpenAI'nin YouTube videolarını kullanması durumunda bunun bir sorun olacağını iddia ettiğini söyledi.
Raporda ayrıca Google'ın, potansiyel olarak telif hakkı yasalarını ihlal edebilecek yapay zeka eğitimi için YouTube videolarının yazıya döküldüğü iddia edildi. Mark Zuckerberg'in Meta'sı bile geniş bir kitap kütüphanesine erişmek için Simon & Schuster'ı satın almayı tartıştı.
Yapay zeka modellerinin etkinliği, üzerinde eğitim aldıkları veri hacmine göre artar. Daha önce yüksek kaliteli verilere olan talebin o kadar yüksek olduğu ve bazı teknoloji şirketlerinin mevcut internet verilerini 2026 yılına kadar tüketebileceği bildirilmişti.
OpenAI, yapay zeka modellerinin her birinin benzersiz bir veri kümesi üzerinde eğitildiğini söylerken Google, yaratıcılarla yapılan anlaşmalar kapsamında bazı YouTube içeriklerinde yapay zeka modellerinin eğitildiğini kabul etti.
Bir yanıt yazın