Kararlı Difüzyon birkaç kelimeden video üretir

Açık kaynaklı içerik oluşturma modeli Stable Diffusion, videoya geçiyor. Araştırmacılara yönelik ilk versiyon, halka daha geniş bir şekilde dağıtılmadan önce kullanıma sunuldu.

Üretken yapay zeka, birkaç kelimeden nasıl resim, metin ve hatta müzik oluşturulacağını biliyor. Stabil Difüzyon yayına bir yenisini daha ekliyor: video! Tek yapmanız gereken, neyin hareket ettiğini görmek istediğinizi tanımlamaktır ve model bir video oluşturacaktır.

Bir sonraki gişe rekorları kıran film Stable Diffusion tarafından mı yaratılacak?

Üretken videoya yönelik bu ilk model, farklı tarzlarda illüstrasyonlar, logolar, posterler, görüntüler, kurgu, kodlar oluşturmanıza olanak tanıyan Stabil Dağıtım görüntü modelini temel alır… Stabil Video Dağıtımı, birden fazla görünüm oluşturma gibi birçok duruma uyum sağlar aynı konunun tek bir görüntüden elde edilmesi.

Kararlı Yayılım Videosu, özel yenileme hızlarıyla (saniyede 3 ila 30 kare arasında) video başına 14 ila 25 kare oluşturma kapasitesine sahiptir.

Kod GitHub’da mevcutken, araştırmacılar bu yeni özelliğe ilişkin genel bir bakışa zaten ulaşabiliyor. Stabil Difüzyon ayrıca bu modelin nasıl çalıştığını detaylandıran bir araştırma makalesini de paylaşıyor. Genel halk ve meraklılar, gelecekteki web arayüzüne erişmek için bir e-posta listesine abone olma olanağına sahiptir. Pek çok fırsat var: eğitim, eğlence, reklam vb.

Dall-E veya Midjourney gibi diğer modellerden farklı olarak Stable Diffusion, açık kaynak yapısı nedeniyle daha erişilebilirdir. Öte yandan üretilen görsellerin kalitesi değişken olup, modelin ürettiği içeriğin istismar edilmesi telif hakkı açısından sorun yaratabilmektedir.

Kaynak :

Kararlı Difüzyon


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir