13 Ağustos 2025'te Pekin, Çin'de dünyanın ilk somutlaştırılmış akıllı robot 4S mağazası Robot Mall'da mekanik bir el sergileniyor.
VCG | Görsel Çin Grubu | Getty Images
PEKİN — Alibaba'nın Bulut, OpenAI'nin ChatGPT'si gibi sohbet robotlarından farklı bir yaklaşım kullanarak gerçek dünyayı daha iyi kopyalamak için tasarlanmış yeni bir yapay zeka türüne yatırım yapıyor.
Bu değişim, öncelikle metin üzerinde eğitilen “büyük dil modellerinin” sınırlarını kabul ediyor. Bunun yerine geliştiriciler, videolar ve gerçek hayattaki fiziksel senaryolar üzerine inşa edilen “dünya modellerine” daha fazla odaklanmaya başlıyor.
Şirketin Cuma günü yaptığı duyuruya göre, Alibaba bu trende ayak uydurmak için yapay zeka video oluşturma aracı Vidu'nun arkasındaki startup olan ShengShu'ya 2 milyar yuan (290 milyon dolar) yatırım yaptı. TAL Education ve Baidu Ventures da B serisi finansman turuna katıldı.
Yatırım, ShengShu'nun Qiming Venture Partners ve diğer destekçilerden 600 milyon yuan toplamasından yaklaşık iki ay sonra gerçekleşti. Başlangıç, değerlemesini açıklamayı reddetti.
ShengShu, en son finansmanın, şu anda ayrı olan iki alan arasında köprü kurmak için yapay zekayı kullanan bir “genel dünya modelinin” geliştirilmesini destekleyeceğini söyledi: oyunların ve yapay zeka tarafından oluşturulan videoların dijital dünyası ile otonom sürüş ve robotların fiziksel dünyası.
Üç yaşındaki girişim yaptığı açıklamada, “ShengShu, görme, ses ve dokunma gibi çok modlu veriler üzerine inşa edilen genel bir dünya modelinin, fiziksel dünyanın nasıl çalıştığını büyük dil modellerinden daha doğal bir şekilde yakaladığına inanıyor.” dedi.
ShengShu'nun kurucusu Zhu Jun, yaptığı açıklamada “Algı ve eylemi birleştirmeyi amaçlıyoruz” diyerek yapay zeka sistemlerinin gerçek dünyadaki davranışları tutarlı bir şekilde daha iyi modellemesine ve tahmin etmesine olanak sağladı.
Yapay Analiz'e göre ShengShu'nun Ocak ayında piyasaya sürülen en son Vidu Q3 Pro modeli, metin ve görüntülerden video oluşturmak için en iyi 10 yapay zeka modeli arasında yer alıyor.
Şirket, OpenAI'nin yapay zeka video üretimi için artık kapatılan Sora aracını yaygın olarak kullanılabilir hale getirmesinden aylar önce Vidu'yu dünya çapında piyasaya sürdü. Çinli kısa video şirketleri Kuaishou ve ByteDance, video oluşturmak için benzer rakip yapay zeka araçlarını da yayınladı.
Dünya modeli yarışması
Alibaba, ilgili girişimlere yatırımlarını genişletti.
Çinli teknoloji devi ve Baidu Ventures geçen ay, fotoğraflardan hızlı bir şekilde dijital 3D modeller oluşturmak için yapay zekayı kullanan bir platform olan Tripo AI'ya 50 milyon dolarlık bir yatırıma öncülük etti. Tripo ayrıca dil modellerinin kullandığı tekniklerden fiziksel uzaya dayalı yapay zeka araçlarına doğru ilerlediğini ve kendi dünya modelini geliştirdiğini söyledi.
Eylül ayında Alibaba ayrıca, bu yılın başlarında kullanıcıların bir videonun oluşturulurken nasıl gelişeceğini yönlendirmesine olanak tanıyan bir yapay zeka dünya modelini yayınlayan PixVerse'e 60 milyon dolarlık bir yatırıma da öncülük etti.
E-ticarete başlayan Alibaba aynı zamanda video üretimi için ücretsiz, açık kaynaklı yapay zeka modellerini de yayınladı ve Şubat ayında robotlara güç sağlamak için bir model piyasaya sürdü.
Shengshu Cuma günü yaptığı açıklamada, endüstriyel, ticari ve ev ortamlarında kullanılmak üzere somutlaştırılmış yapay zeka (fiziksel dünyayla etkileşime giren insansı robotlar gibi sistemler) geliştiren şirketlerle stratejik ortaklıkları olduğunu söyledi.
ABD teknoloji dergisi Wired'ın kurucu ortağı Kevin Kelly, geçen ay Substack'ta şunu yazdı: Dünya modelleri robotik için kritik öneme sahip çünkü teknolojinin çalışması için yüksek lisanstan daha fazlasına ihtiyaç var.
Kelly, sonuçta, insan zekasını kopyalamak için yapay zekanın üç şeye ihtiyacı olacağını söyledi: akıl yürütme, fiziksel dünyayı anlama ve sürekli öğrenme. Öğrenme kategorisi için yapay zeka henüz geliştirilmemiş olsa da, Yüksek Lisans destekli sohbet robotlarının bilgi unsurunu yarattığını ve dünya modellerini atılım gerektiren önemli bir alan haline getirdiğini söyledi.

Bir yanıt yazın