Openai GPT-4O görüntü oluşturmayı herkese sunar

Openai, doğrudan GPT-4O ile entegre edilmiş yeni bir görüntü oluşturma sistemi yayınladı. Bu sistem, AI'nın görüntü oluştururken bilgi tabanına ve konuşma bağlamına erişmesini sağlar.

Bu entegrasyonun daha bağlamsal olarak alakalı ve doğru görsel çıktılar sağladığı söylenir.

Openai'nin duyurusu şöyle diyor:

“GPT – 4O görüntü oluşturma, metni doğru bir şekilde oluşturma, tam olarak istemleri takip etmede ve 4O'nun doğal bilgi tabanını ve sohbet bağlamını kullanma konusunda mükemmeldir – yüklenen görüntüleri dönüştürmek veya görsel ilham olarak kullanma. Bu yetenekler, öngördüğünüz görüntüyü tam olarak yaratmayı, görsel ve güçle ilerletmenize yardımcı olmanızı kolaylaştırır.

İşte bilmeniz gereken her şey.

Teknik yetenekler

Openai, yeni görüntü oluşturma sisteminin aşağıdaki özelliklerini vurgular:

  1. Görüntüler içinde metni doğru bir şekilde oluşturur.
  2. Kullanıcıların tutarlı bir stil tutarken görüntüleri konuşma yoluyla hassaslaştırmasına olanak tanır.
  3. 20'ye kadar farklı nesneye sahip karmaşık istemleri destekler.
  4. Yüklenen referanslara dayalı görüntüler oluşturabilir.
  5. GPT-4O'nun eğitim verilerinden gelen bilgileri kullanarak görseller oluşturur.

Openai Devletleri Duyurusunda:

“Görüntü oluşturma artık GPT – 4O'ya özgü olduğundan, doğal sohbet yoluyla görüntüleri rafine edebilirsiniz. GPT – 4O, sohbet bağlamında görüntüler ve metinler üzerine inşa edebilir, örneğin bir video oyunu karakteri tasarlıyorsanız, karakterin görünümü, geliştirip denerken birden fazla yinelemede tutarlı kalır.”

Örnekler

Göstermek için karakter tutarlılığıİşte bir kediyi gösteren bir örnek ve sonra aynı kediyi şapka ve tekli ile.

Ekran görüntüsü: openai.com/index/introducing-4o-image-generation/, Mart 2025.

İşte pazarlamacılar için daha pratik bir örnek, metin üretimi: Ayrıntılı bir istem ile oluşturulan tam bir restoran menüsü.

Ekran görüntüsü: openai.com/index/introducing-4o-image-generation/, Mart 2025.

Openai'nin duyuru postasında, birçoğu birkaç istem ve takip içeren düzinelerce örnek var.

Sınırlamalar

Openai itiraf ediyor:

“Modelimiz mükemmel değil. Şu anda ilk lansmandan sonra model iyileştirmeleri yoluyla ele almak için çalışacağımız birden fazla sınırlamanın farkındayız.”

Şirket, yeni görüntü oluşturma sisteminin aşağıdaki sınırlamalarını not eder:

  • Kırpma: GPT-4O bazen posterler gibi uzun görüntüleri altta çok yakından ekler.
  • Halüsinasyonlar: Bu model, özellikle belirsiz istemlerle yanlış bilgi oluşturabilir.
  • Yüksek harmanlama problemleri: Tam bir periyodik tablo gibi aynı anda 10 ila 20'den fazla kavramı doğru bir şekilde tasvir etmek için mücadele ediyor.
  • Çok dilli metin: Model, Latin olmayan karakterleri gösteren ve hatalara yol açan sorunlar olabilir.
  • Düzenleme: Belirli görüntü parçalarını düzenleme talepleri diğer alanları değiştirebilir veya yeni hatalar oluşturabilir. Ayrıca yüklenen görüntülerde yüzleri tutarlı tutmak için mücadele ediyor.
  • Bilgi Yoğunluğu: Model, küçük boyutlarda ayrıntılı bilgi göstermekte zorluk çekiyor.

Arama sonuçları

Bu güncelleme, AI görüntü üretimini esas olarak dekoratif kullanımlardan iş ve iletişimdeki daha pratik işlevlere değiştirir.

Web siteleri AI tarafından oluşturulan görüntüleri kullanabilir, ancak önemli hususlar ile.

Google'ın yönergeleri, bunun yerine içeriğin nasıl üretildiğine bakılmaksızın değer sağlayıp sağlamadığına odaklanarak AI tarafından oluşturulan görselleri yasaklamamaktadır.

Bu en iyi uygulamaları takip etmek önerilir:

  • Şeffaflığı korumak için C2PA meta verilerini (GPT-4O'nun otomatik olarak eklediği) kullanmak
  • Erişilebilirlik ve dizinleme için uygun alt metin ekleme
  • Görüntülerin sadece alanı doldurmak yerine kullanıcı niyetine hizmet etmesini sağlamak
  • Genel AI şablonları yerine benzersiz görseller oluşturmak

Google arama savunucusu John Mueller, AI tarafından oluşturulan görüntüler hakkında olumsuz bir görüş dile getirdi. Kişisel tercihleri ​​Google'ın algoritmalarını etkilemese de, başkalarının AI görüntüleri hakkında ne hissettiğini gösterebilir.

Ekran görüntüsü: bsky.app/profile/johnmu.com, Mart 2025.

Google'ın arama sonuçlarında AI tarafından oluşturulan görüntüleri etiketlemek için önlemler uyguladığını unutmayın.

Kullanılabilirlik

Bu özellik artık Plus, Pro, Ekip veya Ücretsiz Planlarla ChatGPT kullanıcıları için kullanılabilir. Kurumsal ve EDU kullanıcıları için erişim yakında satışa sunulacak.

Geliştiriciler önümüzdeki haftalarda API erişimi bekleyebilir. Daha yüksek işleme ihtiyaçları nedeniyle, görüntü üretimi ortalama bir dakika sürer.


Öne Çıkan Resim: PatrickasSale/Shutterstock


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir