Manus muhtemelen Çin'in ikinci 'Deepseek anı' değil

Geçen hafta önizlemede piyasaya sürülen bir “ajan” AI platformu olan Manus, bir Taylor Swift konserinden daha fazla hype üretiyor.

Hugging Face'deki ürün başkanı Manus “şimdiye kadar denediğim en etkileyici AI aracı” olarak adlandırdı. AI politika araştırmacısı Dean Ball, Manus'u “AI kullanan en sofistike bilgisayar” olarak nitelendirdi. Manus için resmi Discord Server sadece birkaç gün içinde 138.000'den fazla üyeye büyüdü ve Manus için kodların davet edilmesi, Çinli satıcı uygulaması Xianyu'ya binlerce dolar sattığı bildiriliyor.

Ama hype'ın haklı olduğu açık değil.

Manus tamamen sıfırdan geliştirilmedi. Sosyal medyadaki raporlara göre, platform, araştırma raporları hazırlama ve finansal dosyaları analiz etme gibi görevleri yerine getirmek için Antropic's Claude ve Alibaba'nın Qwen dahil olmak üzere mevcut ve ince ayarlı AI modellerinin bir kombinasyonunu kullanıyor.

Yine de, web sitesinde, manusun arkasındaki Çinli şirket olan Butterfly Effect, platformun sözde ne başarabileceğine dair birkaç vahşi örnek veriyor, gayrimenkul satın almaktan video oyunlarını programlamaya kadar.

X'deki viral bir videoda, Manus için bir araştırma lider olan Yichao “Peak” Ji, platformun Openai'nin derin araştırma ve operatörü gibi ajan araçlarından daha üstün olduğunu ima etti. Manus, GAIA adlı genel AI asistanları için popüler bir ölçüt üzerinde derin araştırmalardan daha iyi performans gösteriyor, Ji, AI'nın web'e göz atarak, yazılımı ve daha fazlasını kullanarak iş yapma yeteneğini araştıran iddia etti.

“[Manus] Sadece başka bir sohbet botu veya iş akışı değil, ”dedi Ji videoda. “Gebe kalma ve infaz arasındaki boşluğu dolduran tamamen özerk bir ajan […] Bunu insan-makine işbirliğinin bir sonraki paradigması olarak görüyoruz. ”

Ancak bazı erken kullanıcılar Manus'un her derde deva olmadığını söylüyor.

AI Startup Pleias'ın kurucu ortağı Alexander Doria, X üzerindeki bir yazıda, Manus'u test ederken hata mesajları ve sonsuz döngülerle karşılaştığını söyledi. Diğer X kullanıcıları, Manus'un gerçek sorularda hata yaptığını ve çalışmasını sürekli olarak belirtmediğine dikkat çekti – ve genellikle çevrimiçi olarak kolayca bulunan bilgileri kaçırıyor.

Manus ile kendi deneyimim inanılmaz derecede olumlu değildi.

Platformdan bana oldukça basit bir istek gibi görünen şeyleri ele almasını istedim: Teslimat aralığımdaki en iyi fast food ekleminden kızarmış bir tavuk sandviç sipariş edin. Yaklaşık on dakika sonra Manus düştü. İkinci denemede, kriterlerimi karşılayan bir menü öğesi buldu, ancak Manus sipariş sürecini tamamlayamadı veya hatta bir ödeme bağlantısı sağlayamadı.

Manus ile kızarmış tavuk sandviç sipariş etmeye çalışmak sinir bozucu bir deneyim.Resim Kredileri:Manus

Manus benzer şekilde NYC'den Japonya'ya bir uçuş rezervasyonu yapmasını istediğimde kokladı. Belirsizlik için fazla yer bırakmadığını düşündüğüm talimatlar göz önüne alındığında (örneğin “bir işletme sınıfı uçuş arayın, fiyat ve esnek tarihleri ​​önceliklendirme”), en iyi manusun yapabileceği en iyi manusun birkaç havayolu web sitesi ve kayak gibi uçak bileti arama motorlarında, bazıları kırılmış olan uçaklara bağlantılar sunmaktı.

Manus henüz sizin için Tokyo'ya uçuş rezervasyonu yapamaz.Resim Kredileri:Manus

Sonraki birkaç görev cazibe olabileceğini umuyorum, Manus'a yürüme mesafesinde bir restoranda bir masa ayırmasını söyledim. Birkaç dakika sonra başarısız oldu. Sonra platformdan Naruto'dan ilham alan bir dövüş oyunu inşa etmesini istedim. Yarım saat içinde hata yaptı, o zaman havlu atmaya karar verdim.

Manus sözcüsü Tmzilla'a aşağıdaki ifadeyi DM aracılığıyla gönderdi:

“Küçük bir ekip olarak, odak noktamız, kullanıcıların sorunları çözmesine yardımcı olan Manus'u geliştirmeye ve AI ajanları yapmaktır. […] Mevcut kapalı beta'nın birincil amacı, sistemin çeşitli kısımlarını stresle test etmek ve sorunları tanımlamaktır. Herkesin paylaştığı değerli bilgileri derinden takdir ediyoruz. ”

Peki Manusis teknik vaatlerinden yetersiz kalıyorsa, neden patladı? Davaların kıtlığının yarattığı münhasırlık gibi birkaç faktör katkıda bulundu.

Çin medyası, AI atılımı olarak Manus'u hızlandırdı; Yayın QQ News buna “yerli ürünlerin gururu” dedi. Bu arada, sosyal medyadaki AI etkileyicileri, Manus'un yetenekleri hakkında yanlış bilgilendirme yaydı. Çok paylaşılan bir video, görünüşte manus, birden fazla akıllı telefon uygulamasında harekete geçerek bir masaüstü programı gösterdi. Ji, videonun aslında bir Manus demosu olmadığını doğruladı.

X üzerindeki diğer etkili AI hesapları, Manus ve Çin AI şirketi Deepseek arasında karşılaştırmalar yapmaya çalıştı – karşılaştırmalar gerçekte kök salmış değildir. Kelebek etkisi, Deepseek'in aksine herhangi bir şirket içi model geliştirmedi. Ve Deepseek teknolojilerinin çoğunu açıkça kullanılabilir hale getirirken, Monica – en azından henüz tam olarak değil.

Kelebek etkisine adil olmak için Manus çok erken erişimde. Şirket, bilgi işlem kapasitesini ölçeklendirmek ve bildirildikleri gibi sorunları çözmek için çalıştığını iddia ediyor. Ancak platform şu anda var olduğu gibi, Manus teknolojik yeniliğin önünde koşan bir yutturmaca gibi görünüyor.

Güncellendi 18:02 Pasifik: Bir Manus sözcüsünden bir açıklama ekledi ve MANus'ın arkasındaki şirketin yanlış tanımlanmasını düzeltti.


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir